




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1講統計和統計案例目錄第一部分:知識強化第二部分:重難點題型突破突破一:隨機數表法突破二:分層抽樣突破三:頻率分布直方圖突破四:平均數,眾數,中位數,方差,標準差突破五:總體百分位數突破六:回歸直線方程突破七:相關系數SKIPIF1<0突破八:殘差突破九:非線性回歸突破十:獨立性檢驗第三部分:沖刺重難點特訓第一部分:知識強化1、總體平均數與樣本平均數(1)總體平均數一般地,總體中有SKIPIF1<0個個體,它們的變量值分別為SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0則稱SKIPIF1<0為總體均值,又稱總體平均數.(2)加權平均數如果總體的SKIPIF1<0個變量值中,不同的值共有SKIPIF1<0(SKIPIF1<0)個,不妨記為SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其中SKIPIF1<0出現的頻數SKIPIF1<0(SKIPIF1<0),則總體均值還可以寫成加權平均數的形式:SKIPIF1<0.(3)樣本平均數如果從總體中抽取一個容量為SKIPIF1<0的樣本,它們的變量值分別為SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0則稱SKIPIF1<0為樣本均值,又稱樣本平均數.2、分層隨機抽樣的步驟①根據己經掌握的信息,將總體分成互不相交的層;②根據總體中的個體數SKIPIF1<0和樣本量SKIPIF1<0計算抽樣比SKIPIF1<0;③確定第SKIPIF1<0層應該抽取的個體數目SKIPIF1<0(SKIPIF1<0為第SKIPIF1<0層所包含的個體數),使得各SKIPIF1<0之和為SKIPIF1<0;④在各個層中,按步驟③中確定的數目在各層中隨機抽取個體,合在一起得到容量為SKIPIF1<0的樣本.3、繪制頻率分布直方圖的步驟及頻率分布直方圖的性質①求極差,即一組數據中的最大值與最小值的差.②決定組距與組數.組距與組數的確定沒有固定的標準,一般數據的個數越多,所分組數越多.當樣本容量不超過100時,常分成5~12組.為方便起見,一般取等長組距,并且組距應力求“取整”.③將數據分組.④列頻率分布表.計算各小組的頻率,第SKIPIF1<0組的頻率是eq\f(第i組頻數,樣本容量).⑤畫頻率分布直方圖.其中橫軸表示分組,縱軸表示eq\f(頻率,組距).eq\f(頻率,組距)實際上就是頻率分布直方圖中各小長方形的高度,它反映了各組樣本觀測數據的疏密程度.4、第SKIPIF1<0百分位數(1)第SKIPIF1<0百分位數的概念一般地,一組數據的第SKIPIF1<0百分位數是這樣一個值,它使得這組數據中至少有SKIPIF1<0的數據小于或等于這個值,且至少有SKIPIF1<0的數據大于或等于這個值.(2)計算第p百分位數的步驟第1步,按從小到大排列原始數據.第2步,計算SKIPIF1<0.第3步,若SKIPIF1<0不是整數,而大于SKIPIF1<0的比鄰整數為SKIPIF1<0,則第SKIPIF1<0百分位數為第SKIPIF1<0項數據;若SKIPIF1<0是整數,則第SKIPIF1<0百分位數為第項與第SKIPIF1<0項數據的平均數.5、總體集中趨勢的估計(1)平均數①定義:一組數據的和與這組數據的個數的商.數據SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0的平均數為SKIPIF1<0.②特征:平均數對數據有“取齊”的作用,代表該組數據的平均水平,任何一個數據的改變都會引起平均數的變化,這是眾數和中位數都不具有的性質.所以與眾數、中位數比較起來,平均數可以反映出更多的關于樣本數據全體的信息,但平均數受數據中極端值的影響較大,使平均數在估計總體時的可靠性降低.(2)眾數①定義:一組數據中出現次數最多的數據(即頻率分布最大值所對應的樣本數據)稱為這組數據的眾數。②特征:一組數據的眾數可能不止一個,也可能沒有,反映了該組數據的集中趨勢.(3)中位數①定義:一組數據按從小到大(或從大到小)的順序排成一列,處于最中間的一個數據(當數據個數是奇數時)或最中間兩個數據的平均數(當數據個數是偶數時)稱為這組數據的中位數.②特征:一組數據的中位數是唯一的,反映了該組數據的集中趨勢.在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積相等.6、在頻率分布直方圖中平均數,中位數,眾數的估計值(1)平均數:在頻率分布直方圖中,樣本平均數可以用每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和近似代替.(2)中位數:在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應該相等.(3)眾數:眾數是最高小矩形底邊的中點所對應的數據.7、總體離散程度的估計(1)極差一組數據中的最大值與最小值的差稱為極差.(2)方差與標準差一組數據SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0用SKIPIF1<0表示這組數據的平均數,則這組數據的方差:SKIPIF1<0;標準差:SKIPIF1<0(3)總體方差和標準差如果總體中所有個體的變量值分別為SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0總體平均數為SKIPIF1<0,則稱SKIPIF1<0為總體方差,SKIPIF1<0為總體標準差.(4)樣本方差和標準差如果一個樣本中個體的變量值分別為SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0,樣本平均數為SKIPIF1<0,則稱SKIPIF1<0為樣本方差,SKIPIF1<0為樣本標準差.(5)加權方差如果總體的SKIPIF1<0個變量值中,不同的值共有SKIPIF1<0(SKIPIF1<0)個,記為SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0,其中SKIPIF1<0出現的頻數為SKIPIF1<0(SKIPIF1<0),則總體方差為SKIPIF1<0.8、相關關系的強弱(1)樣本相關系數現實生活中的數據,由于度量對象和單位的不同等,數值會有大有小,為了去除這些因素的影響,統計學里一般用SKIPIF1<0來衡量SKIPIF1<0與SKIPIF1<0的線性相關性強弱,我們稱SKIPIF1<0為變量SKIPIF1<0和變量SKIPIF1<0的樣本相關系數.(2)相關系數SKIPIF1<0的性質①當SKIPIF1<0時,稱成對樣本數據正相關;當SKIPIF1<0時,成對樣本數據負相關;當SKIPIF1<0時,成對樣本數據間沒有線性相關關系.②樣本相關系數SKIPIF1<0的取值范圍為SKIPIF1<0當SKIPIF1<0越接近1時,成對樣本數據的線性相關程度越強;當SKIPIF1<0越接近0時,成對樣本數據的線性相關程度越弱.9、一元線性回歸模型參數的最小二乘法回歸直線方程過樣本點的中心SKIPIF1<0,是回歸直線方程最常用的一個特征;我們將SKIPIF1<0稱為SKIPIF1<0關于SKIPIF1<0的線性回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線。這種求經驗回歸方程的方法叫做最小二乘法,求得的SKIPIF1<0,叫做SKIPIF1<0,SKIPIF1<0的最小二乘估計,其中SKIPIF1<0稱為回歸系數,它實際上也就是經驗回歸直線的斜率,SKIPIF1<0為截距.其中SKIPIF1<010、殘差對于響應變量SKIPIF1<0,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的SKIPIF1<0稱為預測值,觀測值減去預測值稱為殘差.11、決定系數SKIPIF1<0(1)殘差平方和殘差平方和SKIPIF1<0,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.(2)決定系數SKIPIF1<0決定系數SKIPIF1<0是度量模型擬合效果的一種指標,在線性模型中,它代表解釋變量客戶預報變量的能力.SKIPIF1<0,SKIPIF1<0越大,即擬合效果越好,SKIPIF1<0越小,模型擬合效果越差.12、分類變量與列聯表(1)分類變量為了方便,會使用一種特殊的隨機變量,區別不同的現象或性質,這隨機變量稱為分類變量.(2)SKIPIF1<0列聯表①2×2列聯表給出了兩個分類變量數據的交叉分類頻數.②定義一對分類變量SKIPIF1<0和SKIPIF1<0,我們整理數據如下表所示:SKIPIF1<0SKIPIF1<0合計SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0合計SKIPIF1<0SKIPIF1<0SKIPIF1<0知識點2:獨立性檢驗(1)獨立性檢驗定義:利用SKIPIF1<0的取值推斷分類變量SKIPIF1<0和SKIPIF1<0是否獨立的方法稱為SKIPIF1<0獨立性檢驗,讀作“卡方獨立性檢驗”.簡稱獨立性檢驗.(2)獨立性檢驗公式:SKIPIF1<0其中SKIPIF1<0(注意使用公式時分子的平方不要忽略了)第二部分:重難點題型突破突破一:隨機數表法1.(2022·廣東·博羅縣榕城中學高一階段練習)從800件產品中抽取6件進行質檢,利用隨機數表法抽取樣本時,先將800件產品按001,002,…,800進行編號.如果從隨機數表第8行第8列的數開始往右讀數(隨機數表第7行至第9行的數如下),則抽取的6件產品的編號的75%分位數是(
)……8442175331
5724550688
77047447672176335025
83921206766301637859
1695566711
69105671751286735807
44395238793321123429
7864560782
52420744381551001342
9966027954A.105 B.556 C.671 D.169【答案】C【詳解】由題設,依次讀取的編號為SKIPIF1<0,根據編號規則易知:抽取的6件產品編號為SKIPIF1<0,所以將它們從小到大排序為SKIPIF1<0,故SKIPIF1<0,所以75%分位數為SKIPIF1<0.故選:C2.(2022·全國·高一課時練習)“雙色球”彩票中有33個紅色球,每個球的編號分別為01,02,…,33.一位彩民用隨機數表法選取6個號碼作為6個紅色球的編號,選取方法是從下面的隨機數表中第1行第5列和第6列的數字開始,從左向右讀數,則依次選出來的第5個紅色球的編號為7816657208026314021443199714019832049234493682003623486969387181A.01 B.02 C.14 D.19【答案】A【詳解】分析:根據隨機數表,依次進行選擇即可得到結論.詳解:從隨機數表第1行的第5列和第6列數字開始由左到右依次選取兩個數字中小于33的編號去除重復,可知對應的數值為08,02,14,19,01,04;則第5個個體的編號為01.故選A.3.(2022·江西景德鎮·模擬預測(理))某公司利用隨機數表對生產的900支新冠疫苗進行抽樣測試,先將疫苗按000,001,…,899進行編號,從中抽取90個樣本,若選定從第4行第4列的數開始向右讀數,(下面摘取了隨機數表中的第3行至第5行),根據下圖,讀出的第6個數的編號是(
)1676622766
5650267107
3290797853
1355385859
88975414101256859926
9682731099
1696729315
5712101421
88264981765559563564
3854824622
3162430990
0618443253
2383013030A.827 B.315 C.696 D.729【答案】B【詳解】從685開始向右數,即685,992,696,827,310,991,696,729,315,跳過992,991,696重復,跳過,所以第6個數字為315故選:B4.(2022·全國·高一課時練習)福利彩票“雙色球”中紅色球由編號為01,02,…,33的33個個體組成,某彩民利用下面的隨機數表(下表是隨機數表的第一行和第二行)選取6個紅色球,選取方法是從隨機數表中第1行的第6列和第7列數字開始,由左到右依次選取兩個數字,則選出來的第3個紅色球的編號為______.49
54
43
54
82
17
37
93
23
28
87
35
20
56
43
84
26
34
91
6457
24
55
06
88
77
04
74
47
67
21
76
33
50
25
83
92
12
06
76【答案】05【詳解】根據隨機數表,排除超過33及重復的編號,第一個編號為21,第二個編號為32,第三個編號05,故選出來的第3個紅色球的編號為05.5.(2022·山西太原·三模(文))設某總體是由編號為01,02,…,19,20的20個個體組成,利用下面的隨機數表選取6個個體,選取方法是從隨機數表第1行的第3列數字開始從左到右依次選取兩個數字,則選出來的第6個個體編號為___________.SKIPIF1<0【答案】19【詳解】解:由隨機數的抽樣規則得:依次選取的樣本編號為:SKIPIF1<0,故選出來的第6個個體編號為SKIPIF1<0.故答案為:SKIPIF1<0突破二:分層抽樣1.(2022·河南·開封市東信學校模擬預測(文))為了貫徹落實中央新疆工作座談會和全國對口支援新疆工作會議精神,促進邊疆少數民族地區教育事業發展,從A市20名教師?B市15名教師和C市10名教師中,采取分層抽樣的方法,抽取一個容量為n的樣本,若A市抽取4人,則SKIPIF1<0(
)A.9 B.10 C.12 D.15【答案】A【詳解】根據分層抽樣的定義可得SKIPIF1<0,解得SKIPIF1<0.故選:A.2.(2022·新疆烏魯木齊·二模(理))從某中學隨機抽取100名學生,將他們的身高數據(單位cm)繪制成頻率分布直方圖,若要從身高在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0三組內的學生中,用分層抽樣的方法選取16人參加一次活動.則從身高在SKIPIF1<0內的學生中選取的人數應為(
)A.3 B.4 C.5 D.7【答案】B【詳解】依題意SKIPIF1<0,解得SKIPIF1<0,身高在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0三組內的學生比例為SKIPIF1<0,用分層抽樣的方法選取16人參加一次活動,則從身高在SKIPIF1<0內的學生中選取的人數應為SKIPIF1<0人故選:B3.(2022·廣西河池·模擬預測(文))雅言傳承文明,經典浸潤人生,南寧市某校每年舉辦“品經誦典浴書香,提雅增韻享閱讀”中華經典誦讀大賽,比賽內容有三類:“誦讀中國”、“詩教中國”、“筆墨中國”.已知高一、高二、高三報名人數分別為:100人、150人和250人.現采用分層抽樣的方法,從三個年級中抽取25人組成校代表隊參加市級比賽,則應該從高一年級學生中抽取的人數為______.【答案】5【詳解】根據題意可得:高一、高二、高三報名人數之比為SKIPIF1<0,故從高一年級學生中抽取的人數為SKIPIF1<0.故答案為:5.4.(2022·全國·模擬預測)“中國式過馬路”是網友對部分中國人集體闖紅燈現象的一種調侃,即“湊夠一撮人就可以走了,和紅綠燈無關.”出現這種現象是大家受法不責眾的“從眾”心理影響,從而不顧及交通安全,某校對全校學生過馬路方式進行調查,在所有參與調查的人中,“跟從別人闖紅燈”“從不闖紅燈”“帶頭闖紅燈”人數如表所示.跟從別人闖紅燈從不闖紅燈帶頭闖紅燈男生6001000200女生400650300用分層抽樣的方法從“帶頭闖紅燈”的人中抽取10人參加“文明交通”宣傳活動,從這10人中任選取3人,則這三人性別不完全相同的概率為______.【答案】SKIPIF1<0##0.8【詳解】由題可知“帶頭闖紅燈”的人中男生與女生的比例為SKIPIF1<0,所以抽取的10人中,男生有SKIPIF1<0(人),女生有SKIPIF1<0(人),則這三人中性別不完全相同的概率為SKIPIF1<0.故答案為:SKIPIF1<05.(2022·山東聊城·二模)如圖是調查某學校高一年級男、女學生是否喜歡徒步運動而得到的等高條形圖,陰影部分表示喜歡徒步的頻率.已知該年級男生500人、女生400名(假設所有學生都參加了調查),現從所有喜歡徒步的學生中按分層抽樣的方法抽取23人,則抽取的男生人數為______.【答案】15【詳解】根據等高條形圖可知:喜歡徒步的男生人數為SKIPIF1<0,喜歡徒步的女生人數為SKIPIF1<0,所以喜歡徒步的總人數為SKIPIF1<0,按分層抽樣的方法抽取23人,則抽取的男生人數為SKIPIF1<0人.故答案為:156.(2022·陜西·交大附中模擬預測(理))某校為了解學生學習的情況,采用分層抽樣的方法從高一SKIPIF1<0人、高二SKIPIF1<0人、高三SKIPIF1<0人中,抽取SKIPIF1<0人進行問卷調查.已知高一被抽取的人數為SKIPIF1<0,那么高三被抽取的人數為_______.【答案】SKIPIF1<0【詳解】由分層抽樣的知識可得SKIPIF1<0,即SKIPIF1<0,所以高三被抽取的人數為SKIPIF1<0,應填答案SKIPIF1<0.突破三:頻率分布直方圖1.(2022·四川省遂寧市第二中學校模擬預測(文))在某次高中學科競賽中,SKIPIF1<0名考生的參賽成績統計如圖所示,SKIPIF1<0分以下視為不及格,若同一組中數據用該組區間中點作代表,則下列說法中有誤的是(
)A.成績在SKIPIF1<0分的考生人數最多 B.考生競賽成績的中位數為SKIPIF1<0分C.不及格的考生人數為SKIPIF1<0人 D.考生競賽成績的平均分約SKIPIF1<0分【答案】B【詳解】根據頻率分布直方圖得,成績出現在SKIPIF1<0的頻率最大,所以成績在SKIPIF1<0分的考生人數最多,故A正確;由于SKIPIF1<0,SKIPIF1<0,故考生競賽成績的中位數為SKIPIF1<0,故B錯誤;不及格考生數為SKIPIF1<0,故C正確;根據頻率分布直方圖估計考生競賽成績平均分為SKIPIF1<0,故D正確。故選:B.2.(2022·江蘇·華羅庚中學三模)光明學校為了解男生身體發育情況,從2000名男生中抽查了100名男生的體重情況,根據數據繪制樣本的頻率分布直方圖,如圖所示,下列說法中錯誤的是(
)A.樣本的眾數約為SKIPIF1<0 B.樣本的中位數約為SKIPIF1<0C.樣本的平均值約為66 D.體重超過75kg的學生頻數約為200人【答案】C【詳解】對于SKIPIF1<0,樣本的眾數為SKIPIF1<0,故SKIPIF1<0正確,對于SKIPIF1<0,設樣本的中位數為SKIPIF1<0,則SKIPIF1<0,解得SKIPIF1<0,故SKIPIF1<0正確,對于SKIPIF1<0,由直方圖估計樣本平均值可得:SKIPIF1<0,故SKIPIF1<0錯誤,對于SKIPIF1<0,2000名男生中體重超過SKIPIF1<0的人數大約為SKIPIF1<0,故SKIPIF1<0正確.故選:SKIPIF1<0.3.(2022·天津·靜海一中模擬預測)某校隨機抽取了400名學生進行成績統計,發現抽取的學生的成績都在50分至100分之間,進行適當分組畫出頻率分布直方圖如圖所示,下列說法正確的是(
)A.直方圖中x的值為0.040B.在被抽取的學生中,成績在區間SKIPIF1<0的學生數為30人C.估計全校學生的平均成績為84分D.估計全校學生成績的樣本數據的80%分位數約為93分【答案】C【詳解】定義A:根據學生的成績都在50分至100分之間的頻率和為1,可得SKIPIF1<0,解得x=0.03,所以A錯;對于B:在被抽取的學生中,成績在區間[70,80)的學生數為10×0.015×400=60(人),所以B錯;對于C:估計全校學生的平均成績為55×0.05+65×0.1+75×0.15+85×0.3+95×0.4=84(分),所以C對;對于D:全校學生成績的樣本數據的80%分位數約為SKIPIF1<0(分).所以D錯.故選:C4.(2022·安徽·模擬預測(文))某校開展“正心立德,勞動樹人”主題教育活動,對參賽的100名學生的勞動作品的得分情況進行統計,并繪制了如圖所示的頻率分布直方圖,根據圖中信息,下列說法錯誤的是(
)A.圖中的x值為0.020 B.得分在80分及以上的人數為40C.這組數據平均數的估計值為77 D.這組數據中位數的估計值為75【答案】D【詳解】對于A選項,由頻率分布直方圖可得,SKIPIF1<0,解得SKIPIF1<0,所以A選項正確;對于B選項,由頻率分布直方圖可知,得分在SKIPIF1<0分以上的人數為SKIPIF1<0,所以B選項正確;對于C選項,由頻率分布直方圖可知,這組數據平均數的估計值為SKIPIF1<0,所以C選項正確;對于D選項,由頻率分布直方圖可知,SKIPIF1<0的頻率為SKIPIF1<0,SKIPIF1<0的頻率為SKIPIF1<0,則中位數在SKIPIF1<0內,所以這組數據中位數的估計值為SKIPIF1<0,所以D選項錯誤;故選:D.5.(2022·云南昆明·一模(文))“雙減”政策實施后,某初中全面推進學校素質教育,推動學校體育運動發展,引導學生積極參與體育鍛煉,為了解該校學生每周平均體育運動的時間,學校隨機調查了500名學生每周平均體育運動時間的樣本數據(單位:小時),所得數據分成6組:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,據此得到的頻率分布直方圖如圖所示,則該校學生每周平均體育運動的時間約為______小時(同一組中的數據用該組區間的中點值為代表).【答案】SKIPIF1<0【詳解】由頻率分布直方圖可知,每周平均體育運動的時間約為:SKIPIF1<0,故答案為:SKIPIF1<06.(2022·廣東汕頭·一模)在黨史學習教育動員大會上,習近平總書記強調全黨同志要做到學史明理、學史增信、學史崇德,學史力行.某單位對200名黨員進行黨史知識測試,將成績分成6組:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,得到如圖所示的頻率分布直方圖,則SKIPIF1<0______.【答案】0.050【詳解】由SKIPIF1<0,解得SKIPIF1<0,故答案為:0.0507.(2022·云南·玉溪市民族中學模擬預測(文))全民健身,強國有我,某企業為增強廣大職工的身體素質和健康水平,組織全體職工開啟了“學習強國”平臺的強國運動項目,為了解他們的具體運動情況,企業工會從該企業全體職工中隨機抽取了100名,統計他們的日均運動步數,并得到如下頻率分布直方圖:(1)求直方圖中a的值;(2)估計該企業職工日均運動步數的平均數;(同一組中的數據用該組區間的中點值為代表)(3)若該企業恰好有SKIPIF1<0的職工的日均運動步數達到了企業制定的優秀強國運動者達標線,試估計該企業制定的優秀強國運動者達標線是多少?【答案】(1)SKIPIF1<0(2)9.08千步(3)11千步【詳解】(1)由頻率分布直方圖得SKIPIF1<0,解得SKIPIF1<0.(2)設平均數為SKIPIF1<0,則SKIPIF1<0.所以該企業職工日均運動步數的平均數約為9.08千步.(3)日均運動步數在SKIPIF1<0的頻率為SKIPIF1<0,日均運動步數在SKIPIF1<0的頻率為SKIPIF1<0,則SKIPIF1<0位數在SKIPIF1<0內,為SKIPIF1<0,該企業制定的優秀強國運動者達標線是11千步8.(2022·河南省杞縣高中模擬預測(理))在全民抗擊新冠肺炎疫情期間,某市教育部門開展了“停課不停學”活動,為學生提供了多種網絡課程資源.活動開展一個月后,某學校隨機抽取了高二年級的學生若干進行網絡問卷調查,統計學生每天的學習時間(單位:小時),將樣本數據分成SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0五組(全部數據都在SKIPIF1<0內),并整理得到如圖所示的頻率分布直方圖.(1)已知該校高二年級共有800名學生,根據統計數據,估計該校高二年級每天學習時間不低于5小時的學生人數;(2)利用統計數據,估計該校高二年級學生每天平均學習時間;【答案】(1)640人(2)5.6小時(1)根據統計數據估計該校高二年級每天學習時間不低于5小時的學生人數為SKIPIF1<0.所以估計該校高二年級每天學習不低于5小時的人數為640人.(2)樣本中學生每天學習時間的各組頻率分別為0.05,0.15,0.50,0.25,0.05.樣本中學生每天平均學習時間為SKIPIF1<0(小時).所以估計該校高二年級學生每天平均學習時間為5.6小時.9.(2022·新疆克拉瑪依·三模(文))第SKIPIF1<0屆北京冬季奧林匹克運動會于SKIPIF1<0年SKIPIF1<0月SKIPIF1<0日至SKIPIF1<0月SKIPIF1<0日在北京和張家口聯合舉辦.這是中國歷史上第一次舉辦冬季奧運會,它掀起了中國人民參與冬季運動的大熱潮.某市舉辦了中學生滑雪比賽,從中抽取SKIPIF1<0名學生的測試分數繪制成莖葉圖和頻率分布直方圖如下,后來莖葉圖受到了污損,可見部分信息如圖.
(1)求頻率分布直方圖中SKIPIF1<0的值,并根據直方圖估計該市全體中學生的測試分數的平均數(同一組中的數據以這組數據所在區間中點的值作代表,結果保留一位小數);(2)現要對測試成績在前26%的中學生頒發“滑雪達人”證書,并制定出能夠獲得證書的測試分數線,請你用樣本來估計總體,給出這個分數線的估計值.【答案】(1)SKIPIF1<0,平均數為SKIPIF1<0(2)SKIPIF1<0(1)解:由頻率分布直方圖可知,測試分數位于SKIPIF1<0的頻率為SKIPIF1<0,則測試分數位于SKIPIF1<0個數為SKIPIF1<0,所以,測試分數位于SKIPIF1<0的個數為SKIPIF1<0,所以SKIPIF1<0.估計平均數為SKIPIF1<0.(2)解:因為測試分數位于SKIPIF1<0的頻率為SKIPIF1<0,測試分數位于SKIPIF1<0的頻率為SKIPIF1<0,能夠獲得“滑雪達人”證書的中學生測試分數要在前SKIPIF1<0,故設能夠獲得證書的測試分數線為SKIPIF1<0,則SKIPIF1<0,由SKIPIF1<0,可得SKIPIF1<0,所以分數線的估計值為SKIPIF1<0.10.(2022·廣西·南寧三中一模(文))某種植園在芒果臨近成熟時,隨機從一些芒果樹上摘下100個芒果,其質量分布在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0(單位:克)中,經統計頻率分布直方圖如圖所示.(1)估計這組數據的平均數;(2)某經銷商來收購芒果,同一組中的數據以這組數據所在區間中點的值作代表,用樣本估計總體,該種植園中共有芒果大約10000個,經銷商提出以下兩種收購方案:方案①:所有芒果以10元/千克收購;方案②:對質量低于350克的芒果以3元/個收購,對質量高于或等于350克的芒果以5元/個收購.請通過計算確定種植園選擇哪種方案獲利更多?【答案】(1)387(克)(2)方案②獲利更多【詳解】(1)由頻率分布直方圖可得這組數據的平均數為:SKIPIF1<0(克);(2)方案①收入:SKIPIF1<0(元);方案②收入:由題意得低于350克的收入:SKIPIF1<0(元);高于或等于350克的收入:SKIPIF1<0(元).故總計SKIPIF1<0(元),由于SKIPIF1<0,故種植園選擇方案②獲利更多.突破四:平均數,眾數,中位數,方差,標準差1.(2022·上海·曹楊二中模擬預測)第24屆冬季奧運會于2022年2月4日至20日在北京舉行,中國代表團取得了9枚金牌,4枚銀牌,2枚銅牌的歷史最好成績.已知六個裁判為某一運動員這一跳的打分分別為95,95,95,93,94,94,評分規則為去掉六個原始分中的一個最高分和一個最低分,剩下四個有效分的平均數即為該選手的本輪得分.設這六個原始分的中位數為SKIPIF1<0,方差為SKIPIF1<0;四個有效分的中位數為SKIPIF1<0,方差為SKIPIF1<0.則下列結論正確的是(
)A.SKIPIF1<0,SKIPIF1<0 B.SKIPIF1<0,SKIPIF1<0C.SKIPIF1<0,SKIPIF1<0 D.SKIPIF1<0,SKIPIF1<0【答案】D【詳解】將打分95,95,95,93,94,94按照從小到大排列為93,94,94,95,95,95,無論是否去掉一個最高分和最低分中位數都是SKIPIF1<0,故AB錯誤;根據SKIPIF1<0SKIPIF1<0;又SKIPIF1<0SKIPIF1<0SKIPIF1<0故選:D.2.(2022·四川·成都市錦江區嘉祥外國語高級中學有限責任公司模擬預測(文))冬末春初,乍暖還寒,人們容易感冒發熱,若發生群體性發熱,則會影響到人們的身體健康,干擾正常工作生產,某大型公司規定:若任意連續7天,每天不超過5人體溫高于37.3℃,則稱沒有發生群體性發熱,下列連續7天體溫高于37.3℃人數的統計特征數中,能判定該公司沒有發生群體性發熱的為(
)(1)中位數為3,眾數為2
(2)均值小于1,中位數為1(3)均值為3,眾數為4
(4)均值為2,標準差為SKIPIF1<0A.(1)(3) B.(3)(4) C.(2)(3) D.(2)(4)【答案】D【詳解】將7個數由小到大依次記為SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0.對于(1)選項,反例:SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0,滿足中位數為3,眾數為2,與題意矛盾,(1)選項不合乎要求;對于(2)選項,假設SKIPIF1<0,即該公司發生了群體性發熱,因中位數為1,則SKIPIF1<0,平均數為SKIPIF1<0,矛盾,故假設不成立,即該公司沒有發生群體性發熱,(2)選項合乎要求;對于(3)選項,反例:SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0,滿足眾數為4,均值為3,與題意矛盾,(3)選項不合乎要求;對于(4)選項,假設SKIPIF1<0,即該公司發生群體性發熱,若均值為2,則方差為SKIPIF1<0,即SKIPIF1<0,與(4)選項矛盾,故假設不成立,即該公司沒有發生群體性發熱,(4)選項合乎要求.故選:D3.(2022·廣西·模擬預測(文))2022年6月6日是第27個“全國愛眼日”,為普及科學用眼知識,提高群眾健康水平,預防眼疾,某區殘聯在殘疾人綜合服務中心開展“全國愛眼日”有獎答題競賽活動.已知5位評委老師按百分制(只打整數分)分別給出某參賽小隊評分,可以判斷出一定有評委打滿分的是(
)A.平均數為98,中位數為98 B.中位數為96,眾數為99C.中位數為97,極差為9 D.平均數為98,極差為6【答案】D【詳解】解:選項A:當打分結果為SKIPIF1<0時,滿足平均數為98,中位數為98,所以A錯誤;選項B:當打分結果為SKIPIF1<0時,滿足中位數為96,眾數為99,所以B錯誤;選項C:當打分結果為SKIPIF1<0時,滿足中位數為97,極差為9,所以C錯誤;選項D:假設沒有評委打滿分,結合極差為6可得總成績SKIPIF1<0,則平均數SKIPIF1<0,與選項不符,故假設不成立,所以平均數為98,極差為6時,一定有評委打滿分,故選:D.4.(2022·重慶八中模擬預測)已知1,SKIPIF1<0這5個數的平均數為3,方差為2,則SKIPIF1<0這4個數的方差為(
)A.1 B.SKIPIF1<0 C.SKIPIF1<0 D.2【答案】B【詳解】∵1,SKIPIF1<0這5個數的平均數為3,方差為2,∴SKIPIF1<0,即SKIPIF1<0,∴SKIPIF1<0這4個數的平均數為SKIPIF1<0,∴SKIPIF1<0,即SKIPIF1<0,∴SKIPIF1<0這4個數的方差為SKIPIF1<0.故選:B.5.(2022·河南·南陽中學三模(文))某區創建全國文明城市指揮部辦公室對所轄街道當月文明城市創建工作進行考評,工作人員在本區選取了甲,乙兩個街道,并在這兩個街道各隨機抽取10個實地點位進行現場測評,下面的莖葉圖是兩個街道的測評分數(滿分100分),下列說法正確的是(
)A.甲,乙兩個街道的測評分數的極差相等B.甲,乙兩個街道的測評分數的平均數相等C.街道乙的測評分數的眾數為87D.甲、乙兩個街道測評分數的中位數中,乙的中位數比較大【答案】D【詳解】街道甲的測評分數的極差是SKIPIF1<0,街道乙的測評分數的的極差是SKIPIF1<0,兩者不相等,故A錯誤;街道甲的測評分數的平均數為SKIPIF1<0,街道乙的測評分數的平均數為SKIPIF1<0,故B錯誤;街道乙的測評分數的眾數為81,故C錯誤;街道甲的測評分數的中位數為SKIPIF1<0,街道乙的測評分數的中位數為SKIPIF1<0,故D正確,故選:D.6.(2022·安徽六安·一模(文))已知某樣本的容量為100,平均數為80,方差為95.現發現在收集這些數據時,其中的兩個數據記錄有誤,一個錯將90記錄為70,另一個錯將80記錄為100.在對錯誤的數據進行更正后,重新求得樣本的平均數為SKIPIF1<0,方差為SKIPIF1<0,則(
)A.SKIPIF1<0,SKIPIF1<0 B.SKIPIF1<0,SKIPIF1<0 C.SKIPIF1<0,SKIPIF1<0 D.SKIPIF1<0,SKIPIF1<0【答案】A【詳解】由題意,可得SKIPIF1<0,設收集的98個準確數據分別記為SKIPIF1<0,則SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,所以SKIPIF1<0.故選:A7.(2022·山東·肥城市教學研究中心模擬預測)在對某中學高一年級學生每周體育鍛煉時間的調查中,采用隨機數法,抽取了男生SKIPIF1<0人,女生SKIPIF1<0人.已知男同學每周鍛煉時間的平均數為SKIPIF1<0小時,方差為SKIPIF1<0;女同學每周鍛煉時間的平均數為SKIPIF1<0小時,方差為SKIPIF1<0.依據樣本數據,估計本校高一年級學生每周體育鍛煉時間的方差為___.【答案】19【詳解】根據平均數的計算公式,全班的平均數為SKIPIF1<0,由SKIPIF1<0,設男同學為SKIPIF1<0,女同學為SKIPIF1<0,則男同學的方差SKIPIF1<0,從而SKIPIF1<0,則女同學的方差SKIPIF1<0,從而SKIPIF1<0;所以全班同學的方差為SKIPIF1<0.故答案為:SKIPIF1<0.8.(2022·四川·石室中學三模(文))為了考察某校各班參加課外書法小組的人數,在全校隨機抽取5個班級,把每個班級參加該小組的人數作為樣本數據.已知樣本平均數為10,樣本方差為4,且樣本數據互不相同,則樣本數據中的最大值為______.【答案】13【詳解】設樣本數據由小到大依次為SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,記SKIPIF1<0,則SKIPIF1<0,SKIPIF1<0.由于SKIPIF1<0且SKIPIF1<0可知,SKIPIF1<0.若SKIPIF1<0,則SKIPIF1<0,得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0中要么有1個是4其余3個是0,要么4個都是1,這與樣本數據互不相同矛盾;若SKIPIF1<0,則SKIPIF1<0,取SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0滿足題意;若SKIPIF1<0,則SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,只有SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0滿足SKIPIF1<0,但此時不滿足SKIPIF1<0;若SKIPIF1<0,則SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,不滿足SKIPIF1<0;綜上可知,SKIPIF1<0,SKIPIF1<0,即樣本數據的最大值為13.故答案為:139.(2022·江蘇南京·模擬預測)已知樣本數據SKIPIF1<0的平均數SKIPIF1<0與方差SKIPIF1<0滿足如下關系式:SKIPIF1<0,若已知15個數SKIPIF1<0的平均數為6,方差為9;現從原15個數中剔除SKIPIF1<0這5個數,且剔除的這5個數的平均數為8,方差為5,則剩余的10個數SKIPIF1<0的方差為___________.【答案】SKIPIF1<0【詳解】根據題目所給的條件SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以剩余10個數的平均數為5.SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以這10個數的方差為SKIPIF1<0.故答案為:SKIPIF1<0突破五:總體百分位數1.(2022·天津河西·三模)學校組織班級知識競賽,某班的12名學生的成績(單位:分)分別是:58、67、73、74、76、82、82、87、90、92、93、98,則這12名學生成績的第三四分位數是(
)A.88分 B.89分 C.90分 D.91分【答案】D【詳解】12名學生成績由小到大排列為58、67、73、74、76、82、82、87、90、92、93、98,SKIPIF1<0,SKIPIF1<0這12名學生成績的第三四分位數是SKIPIF1<0,故選:D2.(2022·天津市第四十七中學模擬預測)為了了解居民用電情況,通過抽樣,獲得了某城市SKIPIF1<0戶居民的月平均用電量(單位:度),以SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0分組的頻率分布直方圖如下圖.該樣本數據的55%分位數大約是(
)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0【答案】C【詳解】由直方圖的性質可得:SKIPIF1<0,解得SKIPIF1<0,由已知,設該樣本數據的55%分位數大約是SKIPIF1<0,由SKIPIF1<0,解得SKIPIF1<0.故選:C.3.(2022·全國·模擬預測)據某地區氣象局發布的氣象數據,未來某十天內該地區每天最高溫度(單位:℃)分別為:31,29,24,27,26,25,24,26,26,23,則這組數據的第40百分位數為(
)A.27 B.26.5 C.25.5 D.25【答案】C【詳解】先將這些數據按照從小到大進行排序,分別為23,24,24,25,26,26,26,27,29,31,又SKIPIF1<0,所以該組數據的第40百分位數為排序后的數列的第4個數和第5個數的平均數,即SKIPIF1<0,故選:C.4.(2022·海南華僑中學模擬預測)2022年4月24日是第七個“中國航天日”,今年的主題是“航天點亮夢想”.某校組織學生參與航天知識競答活動,某班8位同學成績如下:7,6,8,9,8,7,10,m.若去掉m,該組數據的第25百分位數保持不變,則整數SKIPIF1<0的值可以是___________(寫出一個滿足條件的m值即可).【答案】7或8或9或10(填上述4個數中任意一個均可)【詳解】7,6,8,9,8,7,10,m,若去掉m,該組數據從小到大排列為:6,7,7,8,8,9,10,則SKIPIF1<0,故第25百分位數為第二個數即7,所以7,6,8,9,8,7,10,m,第25百分位數為7,而SKIPIF1<0,所以7為第二個數與第三個數的平均數,所以SKIPIF1<0的值可以是7或8或9或10.故答案為:7或8或9或10.5.(2022·天津市寧河區蘆臺第一中學模擬預測)某射擊運動員SKIPIF1<0次的訓練成績分別為:SKIPIF1<0,則這SKIPIF1<0次成績的第SKIPIF1<0百分位數為__________.【答案】SKIPIF1<0【詳解】該射擊運動員SKIPIF1<0次的訓練成績從小到大依次為SKIPIF1<0,因為SKIPIF1<0,所以這SKIPIF1<0次成績的第SKIPIF1<0百分位數為SKIPIF1<0.故答案為:SKIPIF1<0突破六:回歸直線方程1.(2022·陜西·交大附中模擬預測(文))設某大學的女生體重SKIPIF1<0(單位:SKIPIF1<0)與身高SKIPIF1<0(單位:SKIPIF1<0)具有線性相關關系,根據一組樣本數據SKIPIF1<0,用最小二乘法建立的回歸方程為SKIPIF1<0,則下列結論中正確結論的個數是(
)①SKIPIF1<0與SKIPIF1<0具有正的線性相關關系;②回歸直線過樣本點的中心SKIPIF1<0;③若該大學某女生身高增加SKIPIF1<0,則其體重約增加SKIPIF1<0;④若該大學某女生身高為SKIPIF1<0,則可斷定其體重必為SKIPIF1<0.A.1 B.2 C.3 D.4【答案】C【詳解】由于線性回歸方程中x的系數為0.85,因此y與x具有正的線性相關關系,故①正確;因為回歸直線必過樣本點的中心SKIPIF1<0,所以②正確;由線性回歸方程的意義知,某女生的身高增加1cm,其體重約增加0.85kg,故③正確;當某女生的身高為170cm時,其體重估計值是58.79kg,這不是確定值,因此④不正確.故選:C.2.(2022·四川·成都七中模擬預測(文))根據一組樣本數據SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,求得經驗回歸方程為SKIPIF1<0,且SKIPIF1<0.現發現這組樣本數據中有兩個樣本點(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求得的經驗回歸直線l的斜率為1.2,則(
)A.變量x與y具有正相關關系B.去除兩個誤差較大的樣本點后,重新求得的經驗回歸方程為SKIPIF1<0C.去除兩個誤差較大的樣本點后,y的估計值增加速度變快D.去除兩個誤差較大的樣本點后,相應于樣本點(2,3.75)的殘差為0.05【答案】A【詳解】解:對A:SKIPIF1<0經驗回歸方程為SKIPIF1<0,SKIPIF1<0,SKIPIF1<0變量SKIPIF1<0與SKIPIF1<0具有正相關關系,故選項A正確;對B:當SKIPIF1<0時,SKIPIF1<0,所以樣本中心為SKIPIF1<0,SKIPIF1<0去掉兩個樣本點為SKIPIF1<0和SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0樣本中心不變,SKIPIF1<0去除后重新求得的經驗回歸直線SKIPIF1<0的斜率為1.2,SKIPIF1<0SKIPIF1<0,解得SKIPIF1<0,故去除兩個誤差較大的樣本點后,重新求得的回歸方程為SKIPIF1<0,故選項B錯誤;對C:SKIPIF1<0,SKIPIF1<0去除兩個誤差較大的樣本點后,SKIPIF1<0的估計值增加速度變慢,故選項C錯誤;對D:SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0去除兩個誤差較大的樣本點后,相應于樣本點(2,3.75)的殘差為SKIPIF1<0,故選項D錯誤.故選:A.3.(2022·重慶八中模擬預測)某種活性細胞的存活率SKIPIF1<0(SKIPIF1<0)與存放溫度SKIPIF1<0(℃)之間具有線性相關關系,樣本數據如下表所示:存放溫度SKIPIF1<0(℃)104SKIPIF1<0SKIPIF1<0存活率SKIPIF1<0(SKIPIF1<0)20445680經計算,回歸直線的斜率為SKIPIF1<0,若這種活性細胞的存放溫度為SKIPIF1<0℃,則其存活率的預報值為(
)A.32% B.33% C.34% D.35%【答案】C【詳解】設回歸直線方程為SKIPIF1<0,由表中數據可得,SKIPIF1<0.因為回歸直線經過樣本點中心SKIPIF1<0,則SKIPIF1<0.所以當SKIPIF1<0時,SKIPIF1<0.故選:C.4.(2022·江西贛州·一模(理))袁隆平院士是我國的雜交水稻之父,他一生致力于雜交水稻的研究,為解決中國人民的溫飽和保障國家糧食安全做出了重大的貢獻.某雜交水稻研究小組先培育出第一代雜交水稻,再由第一代培育出第二代,第二代培育出第三代,以此類推.已知第一代至第四代雜交水稻的每穗總粒數分別為197粒,193粒,201粒,209粒,且親代與子代的每穗總粒數成線性相關.根據以上信息,預測第五代雜交水稻每穗的總粒數為(
)(注:①親代是產生后一代生物的生物,對后代生物來說是親代,所產生的后一代叫子代:②SKIPIF1<0,SKIPIF1<0)A.211 B.212 C.213 D.214【答案】C【詳解】由題意,設親代每穗總粒數SKIPIF1<0,子代的每穗總粒數SKIPIF1<0,則SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0所以線性回歸方程為SKIPIF1<0當SKIPIF1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廠區公共財物管理制度
- 工地施工衛生管理制度
- 公司職業健康管理制度
- 專家點評2024年公路工程試題及答案
- 縣級動物疫苗管理制度
- 廣東公司文件管理制度
- 健全完善機關管理制度
- 學校公務用車管理制度
- 公司涉外日常管理制度
- 嵌入式系統的硬件調試方法試題及答案
- 2025-2030中國共享單車服務行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025年法律職業資格(客觀題)重點考點大全
- 舜宇校招面試題目及答案
- 2024年直播電商高質量發展報告
- 【MOOC答案】《大學籃球(四)》(華中科技大學)章節作業期末慕課答案
- 2025年FRM金融風險管理師考試專業試卷(真題)預測與解析
- 浙江專升本免試題目及答案
- 圖像分割與目標檢測結合的醫學影像分析框架-洞察闡釋
- 中等職業學校英語課程標準
- 煙臺汽車工程職業學院《藥理學實驗方法學》2023-2024學年第一學期期末試卷
- 2025年上海市安全員-B證(項目負責人)考試題及答案
評論
0/150
提交評論