




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
列聯表與獨立性檢驗
【考試要求】1.通過實例,理解2X2列聯表的統計意義2通過實例,了解獨立性檢驗及其應用.
■落實主干知識
仰識梳理】
1.分類變量
為了表述方便,我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機
變量稱為分類變量.分類變量的取值可以用實數表示.
2.列聯表與獨立性檢驗
(1)關于分類變量X和y的抽樣數據的2X2列聯表:
Y
X合計
r=oY=\
%=0aba+6
%=1cdc+d
合計a+cb+d〃=a+b+c+d
⑵計算隨機變量好=,”初一A)2,,利用/的取值推斷分類變量X和y是查獨立
(a+b)(c+d)(a+c)(/>+d)
的方法稱為Z2獨立性檢驗.
如表為5個常用的小概率值和相應的臨界值.
a
Xa
【思考辨析】
判斷下列結論是否正確(請在括號中打“J”或“義”)
(1)2X2列聯表中的數據是兩個分類變量的頻數.(V)
(2)事件力和B的獨立性檢驗無關,即兩個事件互不影響.(X)
(3”的大小是判斷事件/和6是否相關的統計量.(J)
(4)在2X2列聯表中,若|〃一火|越小,則說明兩個分類變量之間關系越強.(X)
【教材改編題】
1.某機構為調查網游愛好者是否有性別差異,通過調研數據統計:在500名男生中有200
名愛玩網游,在400名女生中有50名愛玩網游.若要確定網游愛好是否與性別有關時,用下
列最適合的統計方法是()
A.均值B.方差
C.獨立性檢驗D.回歸分析
答案C
解析由題意可知,“愛玩網游"與''性別”是兩類變量,其是否有關,應用獨立性檢驗判斷.
2.如表是2X2列聯表,則表中a,b的值分別為()
y2合計
XIa835
X2113445
合計h428()
,38B.28,38
C.27,37D.28,37
答案A
解析4=35—8=27,/>=?+11=27+II=38.
3.已知產(三2)=,0(/22)=0001在檢驗喜歡某項體育運動與性別是否有關的過程中,某研
究員搜集數據并計算得到犬=,則根據小概率值。=的z2獨立性檢驗,分析喜歡該項
體育運動與性別有關.
答案
解析因為,所以根據小概率值1=的/獨立性檢驗,分析喜歡該項體育運動與性別有關.
■探究核心題型
題型一列聯表與犬的計算
例1(1)為了解某大學的學生是否喜歡體育鍛煉,用簡單隨機抽樣方法在校園內調查了12()
位學生,得到如下2X2列聯表:
男女合計
喜歡ab73
不喜歡C25
合計74
則a—b—c等于()
A.7B.8C.9D.10
答案C
解析根據題意,可得c=120—73—25=22,a=74-22=52,6=73—52=21,
補充完整2X2列聯表為:
男女合計
喜歡522173
不喜歡222547
合計7446120
c=52—21—22=9.
(2)為加強素質教育,使學生各方面全面發展,某學校對學生文化課與體育課的成績進行了調
查統計,結果如表:
體育課不及格體育課及格合計
文化課及格57221278
文化課不及格164359
合計73264337
在對體育課成績與文化課成績進行獨立性檢驗M,根據以k數據可得到好的值為()
A.B.
C.7D.
答案A
解析產葉林)2
(a+6)(c+d)(a+c)(〃+d)
=337X(57X43-16X221%255
278X50X73X264
思維升華2X2列聯表是4行4列,計算時要準確無誤,關鍵是對涉及的變量分清類別.
跟蹤訓練1某次國際會議為了搞好對外宣傳工作,會務組選聘/50名記者擔任對外翻譯工
作,在如表“性別與會外語”的2X2列聯表中,a+b+d=.
會外語不會外語合計
男ab20
女6d
合計1850
答案44
解析由題意得。+/>+c/+6=50,
所以o+b+d=50—6=44
題型二列聯表與獨立性檢驗
例2(2023?吉林模擬)共享單車是指企業與政府合作,在校園、地鐵站點、公交站點、居民
區、商業區、公共服務區等提供單車共享服務,是共享經濟的一種新形態.為了研究廣大市
民共享單車的使用情況,某公司在某市隨機抽取了200名用戶進行調查,得到如下數據:單
位:人
每周使用次數1次2次3次4次5次6次及以上
男866141660
女121()881240
合計2016142228100
(1)如果認為每周使用超過3次的用戶為“喜歡騎行共享單車”,請完成2X2列聯表;
單位:人
不喜歡騎行共享單車喜歡騎行共享單車合計
男
女
合計
(2)根據小概率值&=的獨立性檢驗,分析“喜歡騎行共享單車”是否與性別有關.
附:/=Md-be?〃=a+b+c+d.
(a+b)(c+d)(a+c)(6+d)
a
Xa
解(1)由題中表格可得2X2列聯表如下:
單位:人
不喜歡騎行共享單車喜歡騎行共享單車合計
男2090110
女306090
合計50150200
(2)零假設為〃°:“喜歡騎行共享單車”與性別無關.將2X2列聯表中的數據代入公式計算
得,
,_200X(90><30-60X20)2
x—=x,
50X150X110X90
所以根據小概率值。=的獨立性檢驗,推斷不成立,即認為“喜歡騎行共享單車”與性別
有關.
思維升華獨立性撿險的一般步驟
(1)根據樣本數據制成2X2列聯表.
r^ad—bc)1
(2)根據公式計算.
(a+力)(c+d)(a+c)S+4)
(3)比較爐與臨界值的大小關系,作統計推斷.
跟蹤訓練2為了減少自身消費的碳排放,“綠色消費”等綠色生活方式漸成風尚.為獲得
不同年齡段的人對“綠色消費”意義的認知情況,某地研究機構將“9()后與()0后”作為4
組,將“70后與80后”作為〃組,并從力,8兩組中各隨機選取了100人進行問卷調查,
整理數據后獲得如下列聯表:
單位:人
認知情況
年齡段合計
知曉不知曉
A組(90后與00后)7525100
4組(70后與80后)4555100
合計12080200
附篇篇3+/〃=?+”".
a
Xa
(1)若從樣本內知曉“綠色消費”意義的120人中用比例分配的分層隨機抽樣方法隨機抽取
16人,問應在力組、4組中各抽取多少人?
(2)能否依據小概率值。=的獨立性檢驗,分析對“綠色消費”意義的認知情況與年齡有關?
解(1)由題意知,在力組中抽取的人數為16X禽=10.在〃組中抽取的人數為16X普=6.
(2)零假設為所:對“綠色消費”意義的認知情況與年齡無關.
200X(75X55—25X45)2_
由題意,得爐=---X,
12()X80X100X10()
故依據小概率值。=的獨立性檢臉,推斷〃0不成立,即認為對“綠色消費”意義的認知情況
與年齡有關.
題型三獨立性檢驗的綜合應用
例3體有運動是強身健體的重要途徑,《中國兒童青少年體育健康促進行動方案(2020—
2030)?(下面簡稱“體育健康促進行動方案”)中明確提出青少年學生每天在校內參與不少于
60分鐘的中高強度身體活動的要求.隨著“體育健康促進行動方案”的發布,體育運助受到
各地中小學的高度重視,眾多青少年的體質健康得到很大的改善.某中學教師為了了解體育
運動對學生的數學成績的影響情況,現從該中學高三年級的一次月考中隨機抽取1000名學
生,調查他們平均每天的體育運動情況以及本次月考的數學成績情況,得到如表數據:
數學成績(分)[30,50)[50,70)[70,90)[90,110)[110,130)[130,150]
人數(人)2512535030015050
運動達標
104514520010743
的人數(人)
約定:平均每天進行體育運動的時間不少于60分鐘的為“運動達標”,數學成績排在年級前
50%以內(含50%)的為“數學成績達標”.
(I)求該中學高三年級本次月考數學成績的65%分位數;
(2)請估計該中學高三年級本次月考數學成績的平均分(同一組中的數據用該組區間的中點值
作代表);
(3)請根據已知數據完成下列列聯表,并根據小概率值。=的獨立性檢驗,分析“數學成績達
標”是否與“運動達標”相關.
數學成績達標人數數學成績不達標人數合計
運動達標人數
運動不達標人數
合計
n(ad-bc)2
附:*=(〃=Q+8+C+").
(a十b)(c+d)(a+c)(。十d)
a
Xa
解(1)每組的頻率依次為
???++=,+++=,
且+=,
2
高三年級本次月考數學成績的65%分位數位于[90,110)內,且為[90,110)的中點100,
該中學高三年級本次月考數學成績的65%分位數為100.
(2)該中學高三年級本次月考數學成績的平均分
x=X40+X6()+X80+X|()0+X|20+X140=,
估計該中學高三年級本次月考數學成績的平均分為分.
(3)列聯表如表所示:
數學成績達標人數數學成績不達標人數合計
運動達標人數35020055()
運動不達標人數150300450
合計5005001000
零假設為Ho:”數學成績達標”與“運動達標”無關,
、1000X(350X300-200X150)2_1000.
jT——7—X,
550X450X500X50011
,根據小概率值[=的獨立性檢驗,推斷從不成立,即認為“數學成績達標”與“運動達標”
有關.
思維升華獨立性檢驗的考查,往往與概率和抽樣統計圖等一起考查,這類問題的求解往往
按各小題及提問的順序,一步步進行下去,是比較容易解答的,考查單純的獨立性檢驗往往
用小題的形式,而改的公式一般會在原題中給出.
跟蹤訓練3某網紅奶茶品牌公司計劃在沙市某區開設加盟分店,為了確定在該區開設分店
的個數,該公司對該市已開設分店的5個區域的數據作了初步處理后得到下列表格,記x表
示在5個區域開設分店的個數,y表示這x個分店的年收入之和.
M個)23456
M十萬元)346
(1)該公司經過初步判斷,可用經驗回歸模型擬合》與式的關系,求y關于x的經驗回歸方程;
(2)如果該公司最終決定在該區選擇兩個合適的地段各開設一個分店,根據市場調查得到如下
統計數據,第一分店每天的顧客平均為30人,其中5人會購買該品牌奶茶,第二分店每天的
顧客平均為8()人,其中20人會購買該品牌奶茶.依據小概率值。=的獨立性檢驗,分析兩
個店的顧客下單率有無差異.
2
參考公式:力=錯誤!,〃=J'-bx;產n(ad-bc)——,x=27()6
(a+b)(c+</)(</+c)(b+cl)
解(1)由題意可得,%=2+3+;+5+6=應
y=+3+4++6=4
5,
錯誤!M=2X+3X3+4X4+5X+6X6=,
錯誤7=22+32+42+52+62=9(),
設y關于x的經驗回歸方程為
則6=錯誤!==,
a=y—bx=4—X4=,
???),關于x的經臉回歸方程為y=x+0.6.
(2)零假設為“0:兩個店的顧客下單率無差異,則
由題意可知2X2列聯表如表所示:
不下單下單合計
分店一25530
分店二60208()
合計852511()
110X(25X20-5X60)2=44?
**-Z2=
30X80X85X255「
???根據小概率值。=的獨立性檢臉,沒有充分證據推斷M不成立,即兩個店的顧客下單率沒
有差異.
課時精練
過基礎保分練
1.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是()
答案D
解析觀察等高堆積條形圖易知D選項兩個分類變量之間關系最強.
2.下列關于獨立性檢驗的說法正確的是()
A.獨立性檢驗是對兩個變量是否具有線性相關關系的一種檢驗
B.獨立性檢驗可以100%確定兩個變量之間是否具有某神關系
C.利用爐獨立性檢驗推斷吸煙與患肺病的關聯中,若有99%的把握認為吸煙與患肺病有關
系時,則我們可以說在10。個吸煙的人中,有99人患肺病
D.對于獨立性檢驗,隨機變散2的值越小,判定“兩變量有關系”犯錯誤的概率越大
答案D
解析對于A,獨立性檢鴕是通過卡方計算來判斷兩個變量存在關聯的可能性的一種方法,
并非檢驗二者是否是線性相關,故錯誤;
對于B,獨立性檢驗并不能100%確定兩個變量相關,故錯誤;
對于C,99%是指“抽煙”知“患肺病”存在關聯的可能性,并非抽煙人中患肺病的發病率,
故錯誤;
對于D,根據卡方計算的定義可知該選項正確.
3.為了考察某種中成藥預防流感的效果,抽樣調查40人,得到如下數據:
流感
藥物
患流感未患流感
服用218
未服用812
下表是*獨匯性檢驗中幾個常用的小概率值和相應的臨界值:
a
Xa
n(ad-bc)2
根據表中數據?,計算/=若由此認為“該藥物預防流感有效果”,
(a+b)(c+d)(a+c)(b+d)
則該結論出錯的概率不超過()
A.B.C.D.
答案A
40X(2XI2-8X18尸==
解析由題意知,/=
10X30X20X20
由臨界值表可知,認為“該藥物預防流感有效果”,則該結論出錯的概率不超過0.05.
4.(多選)(2022?鄭州模擬)為考察一種新型藥物預防疾病的效果,某科研小組進行動物實驗,
收集整理數據后將所得結果填入相應的2X2列聯表中,由列聯表中的數據計算得/2*9.616.
參照附表,下列結論正確的是()
附表:
a
Xu
A.根據小概率值夕=的獨立性檢驗,分析認為“藥物有效”
B.根據小概率值夕=的獨立性檢驗,分析認為“藥物無效”
C.根據小概率值。=的獨立性檢驗,分析認為“藥物有效”
D.根據小概率值。=的獨立性檢驗,分析認為“藥物無效”
答案BC
解析因為犬比,所以7.879<必,所以根據小概率值。=的獨立性檢驗,分析認為“藥物無效”.
根據小概率值。=的獨立性檢驗,分析認為“藥物有效”.
5.(多選)(2023?南通模擬)根據分類變量x與y的觀察數據,計算得到/=,依據表中給出的
/獨立性檢驗中的小概率值和相應的臨界值,作出下列判斷,正確的是()
a
Xa
A.根據小概率值。=的獨立性檢驗,分析變量x與y相互獨立
B.根據小概率值。=的獨立性檢驗,分析變量x與y不相互獨立
C.變量x與y相互獨立,這個結論犯錯誤的概率不超過
D.變量x與y不相互獨立,這個結論犯錯誤的概率不超過
答案AD
解析因為爐=,所以變量x與y不相互獨立,這個結論犯錯誤的概率不超過0.1.
6.為考查某種營養品對兒童身高增長的影響,選取部分」童進行試驗,根據100個有放回簡
單隨機樣本的數據,得到如下列聯表,由表可知下列說法正確的是()
身高
營養品合計
有明顯增長無明顯增長
食用a1050
未食用b3050
合計6040100
n(ad—hc)2
參考公式:/=其中〃=〃+/)—c+d.
(a+6)(c4~?/)(a+c)(b+d)'
參考數據;
a
Xa
A.a=b=30
B.A
c.從樣本中隨機抽取?名兒童,抽到食用該營養品且身高有明顯增長的兒童的概率是:
D.根據小概率值。=的獨立性檢驗,可以認為該營養品對兒童身高增長有影響
答案D
解析由題可知a=50-1D=4O,8=50—30=20,所以A錯誤;
,=100X(40X30—10X20)2七=
^^一50X50X60X40
所以根據小概率值儀=的獨立性檢驗,
可以認為該營養品對兒童身高增長有影響,所以B錯誤,D正確;
從樣本中隨機抽取1名兒童,抽到食用該營養品且身高有明顯增長的兒童的概率是4°=2,
1005
所以C錯誤.
7.如表是對于“喜歡運動”與性別是否有關的2X2列聯表,依據表中的數據,得到
Z2^(結果保留到小數點后3位).
喜歡運動不喜歡運動合計
男402868
女51217
合計454085
答案
85X(40X12—28X5)2%
解析/=722
45X40X68X17
8.一項研究同年齡段的男、女生的注意力差別的腦功能實驗,其實驗數據如表所示:
注意力穩定注意力不穩定
男生297
女生335
則/=(精確到小數點后三位),依據概率值&=的獨立性檢驗,該實驗該年
齡段的學生在注意力的穩定性上對于性別沒有顯著差異(堪拒絕或支持).
答案支持
解析由表中數據可知〃=29,b=7,c=33,d=5,〃=a+b+c+d=74,
n(ad^bc)2
根據12=
(q+c)(c+d)[b+d){a+b)'
計算可知/2=74X(145—231)2
(294-33)X(334-5)X(7+5)X(294-7)
所以沒有充分證據認為學生在注意力的穩定性上與性別有關,
即該實驗支持該年齡段的學生在注意力的穩定性上對于性別沒有顯著差異.
9.(2021?全國甲卷改編)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為
了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統計如
下表:
一級品二級品合計
甲機床15()5()200
乙機床1208()200
合計7.70130400
(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少?
(2)依據小概率值。=的獨立性檢驗能否認為甲機床的產品質量與乙機床的產品質量有差異?
附:n(ad-bcY,
〃=a+6+c+d.
(a+b)(c+d)(a+c)S+d)
a
Xu
解(1)根據題表中數據知,甲機床生產的產品中一級品的頻率是;*=,乙機床生產的產品
中一級品的頻率是120=06.
200
(2)零假設為Ho:甲機床的產品質量與乙機床的產品質量無差異,
根據題表中的數據可得
,=400X(150X80—120X50)2
L200X200X270X130
?
=400
39
所以依據小概率值。=的獨立性檢臉,推斷〃。不成立,即認為甲機床的產品質量與乙機床的
產品質量有差異.
10.某花圃為提高某品種花苗質量,開展技術創新活動,力,8在實驗地分別用甲、乙方法培
育該品種花苗.為觀測其生長情況,分別在實驗地隨機抽取各50株,對每株進行綜合評分,
將每株所得的綜合評分制成如圖所示的頻率分布直方圖.記綜合評分為80及以上的花苗為
優質花苗.
(1)求圖中4的值,并求綜合評分的中位數:
(2)填寫卜面的2X2歹IJ聯表,并根據小概率值。=的獨立性檢驗,分析優質花苗與培育方法是
否有關,請說明理由.
優質花苗非優質花苗合計
甲培育法20
乙培育法10
合計
其中〃=a+5+c+".
附:?+4黑黑+/
a
Xa
解(1)由直方圖的性質可知,X10+X10+X10+10〃+X10=1,
解得ci=,
因為(+)X10=,所以中位數位于[80,90)內,
設中位數為x,則有X10+X(90—x)=,解得x=82.5.
故綜合評分的中位數為825.
(2)由(I)得優質花苗的頻率為,
所以樣本中優質花苗的數量為60,
得如下列聯表:
優質花苗非優質花苗合計
甲培育法203050
乙培育法401050
合計6040100
零假設為兒:優質花苗與培育方法無關,
,=100X(20X10—30X40)2“
“60X40X50X50
所以根據小概率值。=的獨立性檢驗,推斷,。不成立,即認為優質花苗與培育方法有關.
過綜合提升練
11.在某病毒疫苗的研發過程中,需要利用基因編輯小鼠進行動物實驗.現隨機抽取100只
基因編輯小鼠對該病毒疫苗進行實驗,得到如下2X2列聯表(部分數據缺失):
被某病毒感染未被某病毒感染合計
注射疫苗1050
未注射疫苗3050
合計30100
計算可知,根據小概率值a=的獨立性檢驗,分析”給基因編輯小鼠注射該種疫苗
能起到預防該病毒感染的效果”()
附:尸〃胸一反)2,〃=〃+b+c+d.
[a+b)(c+d)(a+c)(b+d)
a
Xa
B.
C.D.
答案B
解析完善2X2列聯表如下:
被某病毒感染未被某病毒感染合計
注射疫苗104050
未注射疫苗203()5()
合計3070100
零假設為〃o:”給基因編輯小鼠注射該種疫苗不能起到預防該病毒感染的效果”.
100X(10X30—40X20)2%
因為Z2—
30X70X50X50
所以根據小概率值。=的獨立性檢瞼,推斷為不成立,
即認為“給基因編輯小鼠注射該種疫苗能起到預防該病毒感染的效果”.
12.(多選)有兩個分類變量X,Y,其列聯表如表所示.
Y
X合計
KiYi
a20-a20
*215—430+a45
合計155065
其中出15一。均為大于5的整數,若依據。=的獨立性檢驗可以認為X與丫有關,則a的可能
取值為()
A.6B.7C.8D.9
答案CD
解析根據a>5且15-a>5,a£Z,知??扇?,7,8,9.由表中數據及題意,得
2_65X[a(30+a)—(15~a)(20-a)]2_13X(13a~60)2、_
X—一3一x結合選項,知。的可能取值為
20X45X15X5020X45X3X2
8,9.
立拓展沖刺練
13.(多選)在一次惡劣天氣的飛行航程中,調查男、女乘客在飛機上暈機的情況,得到如下
列聯表:(單位:人),則()
暈機
性別合計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 制定管理辦法技巧包括
- 《宏觀經濟分析:貨幣供應、價格與匯率的實證研究》
- 全面質量控制流程與程序手冊
- 企業人才戰略規劃體系構建與實施路徑
- 硬車削工藝參數優化:全因子試驗與響應曲面分析
- 校園榜樣力量培養與傳承案例分析
- 基于增強現實的博物館藏品虛擬復原研究-洞察及研究
- 安全教育的內容
- 安全生產目標評估
- 商混站安全操作規程
- 2025至2030中國大型連鎖超市行業發展趨勢分析與未來投資戰略咨詢研究報告
- T-GDMDMA 0044-2025 一次性使用血液灌流器的臨床使用指南
- 2025-2030年中國鱈魚腸行業市場發展分析及發展前景與投資策略研究報告
- 2025-2030年中國智慧應急行業市場深度調研及市場前瞻與投資策略研究報告
- 2025年全國統一高考語文試卷(全國一卷)含答案
- T/DZJN 03-2019即熱式飲水電加熱器具能效限定值及能效等級
- 2025年調解員職業技能考試試卷及答案
- 噴粉技術質量協議書
- 2025年自考有效溝通技巧試題及答案
- 商場物業外包合同協議
- 2025民宿租賃合同標準范本
評論
0/150
提交評論