




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統計案例分析及典型例題§11。1抽樣方法基礎基礎自測1。為了了解所加工的一批零件的長度,抽取其中200個零件并測量了其長度,在這個問題中,總體的一個樣本是。答案200個零件的長度2。某城區有農民、工人、知識分子家庭共計2004戶,其中農民家庭1600戶,工人家庭303戶,現要從中抽取容量為40的樣本,則在整個抽樣過程中,可以用到下列抽樣方法:①簡單隨機抽樣,②系統抽樣,③分層抽樣中的。答案①②③3.某企業共有職工150人,其中高級職稱15人,中級職稱45人,初級職稱90人?,F采用分層抽樣抽取容量為30的樣本,則抽取的各職稱的人數分別為.答案3,9,184。某工廠生產A、B、C三種不同型號的產品,其相應產品數量之比為2:3:5,現用分層抽樣方法抽出一個容量為n的樣本,樣本中A型號產品有16件,那么此樣本的容量n=.答案80——典例剖析一^——例1某大學為了支援我國西部教育事業,決定從2007應屆畢業生報名的18名志愿者中,選取6人組成志愿小組.請用抽簽法和隨機數表法設計抽樣方案。解抽簽法:第一步:將18名志愿者編號,編號為1,2,3,…,18。第二步:將18個號碼分別寫在18張外形完全相同的紙條上,并揉成團,制成號簽;第三步:將18個號簽放入一個不透明的盒子里,充分攪勻;第四步:從盒子中逐個抽取6個號簽,并記錄上面的編號;第五步:所得號碼對應的志愿者,就是志愿小組的成員。隨機數表法:第一步:將18名志愿者編號,編號為01,02,03,…,18。第二步:在隨機數表中任選一數作為開始,按任意方向讀數,比如第8行第29列的數7開始,向右讀;第三步:從數7開始,向右讀,每次取兩位,凡不在01—18中的數,或已讀過的數,都跳過去不作記錄,依次可得到12,07,15,13,02,09。第四步:找出以上號碼對應的志愿者,就是志愿小組的成員。例2某工廠有1003名工人,從中抽取10人參加體檢,試用系統抽樣進行具體實施.解(1)將每個人隨機編一個號由0001至1003.(2)利用隨機數法找到3個號將這3名工人剔除。(3)將剩余的1000名工人重新隨機編號由0001至1000.(4)分段,取間隔k=3=100將總體均分為10段,每段含100個工人。10(5)從第一段即為0001號到0100號中隨機抽取一個號1.(6)按編號將1,100+1,200+1,-,900+1共10個號碼選出,這10個號碼所對應的工人組成樣本.例3 (14分)某一個地區共有5個鄉鎮,人口3萬人,其中人口比例為3:2:5:2:3,從3萬人中抽取一個300人的樣本,分析某種疾病的發病率,已知這種疾病與不同的地理位置及水土有關,問應采取什么樣的方法?并寫出具體過程。TOC\o"1-5"\h\z解應采取分層抽樣的方法。 3分過程如下:(1)將3萬人分為五層,其中一個鄉鎮為一層。 5分(2)按照樣本容量的比例隨機抽取各鄉鎮應抽取的樣本。300X&=60(人);300X2=40(人);15 15300Xf=100(人);300X2=40(人);15 15300X&=60(人), 10分15因此各鄉鎮抽取人數分別為60人,40人,100人,40人,60人。 12分(3)將300人組到一起即得到一個樣本。 14分練習:一、填空題1。(安慶模擬)某校高中生共有900人,其中高一年級300人,高二年級200人,高三年級400人,現分層抽取容量為45的樣本,那么高一、高二、高三年級抽取的人數分別為。答案15,10,202。某牛奶生產線上每隔30分鐘抽取一袋進行檢驗,則該抽樣方法為①;從某中學的30名數學愛好者中抽取3人了解學習負擔情況,則該抽樣方法為②。那么①,②分別為.答案系統抽樣,簡單隨機抽樣3。下列抽樣實驗中,最適宜用系統抽樣的是(填序號)。①某市的4個區共有2000名學生,且4個區的學生人數之比為3:2:8:2,從中抽取200人入樣②某廠生產的2000個電子元件中隨機抽取5個入樣③從某廠生產的2000個電子元件中隨機抽取200個入樣④從某廠生產的20個電子元件中隨機抽取5個入樣答案③4.(2013?重慶文)某校高三年級有男生500人,女生400人,為了解該年級學生的健康情況,從男生中任意抽取25人,從女生中任意抽取20人進行調查,這種抽樣方法是.答案分層抽樣法5。某中學有高一學生400人,高二學生300人,高三學生200人,學校團委欲用分層抽樣的方法抽取18名學生進行問卷調查,則下列判斷不正確的是(填序號)。①高一學生被抽到的概率最大②高三學生被抽到的概率最大③高三學生被抽到的概率最?、苊棵麑W生被抽到的概率相等答案①②③6。某商場有四類食品,其中糧食類、植物油類、動物性食品類及果蔬類分別有40種、10種、30種、20種,現從中抽取一個容量為20的樣本進行食品安全檢測,若采用分層抽樣的方法抽取樣本,則抽取的植物油類與果蔬類食品種數之和是.答案67.(天津文,11)一個單位共有職工200人,其中不超過45歲的有120人,超過45歲的有80人.為了調查職工的健康狀況,用分層抽樣的方法從全體職工中抽取一個容量為25的樣本,應抽取超過45歲的職工人。答案108.將參加數學競賽的1000名學生編號如下0001,0002,0003,-\1000,打算從中抽取一個容量為50的樣本,按系統抽樣的方法分成50個部分,如果第一部分編號為0001,0002,?-,0020,從第一部分隨機抽取一個號碼為0015,則第40個號碼為。答案07959。某政府機關有在編人員100人,其中副處級以上干部10人,一般干部70人,工人20人,上級機關為了了解政府機構改革意見,要從中抽取一個容量為20的樣本,試確定用何種方法抽取,如何抽???解用分層抽樣抽取。(1)720:100=1:5,???10=2,70=14,20=45 5 5???從副處級以上干部中抽取2人,一般干部中抽取14人,從工人中抽取4人。(2)因副處級以上干部與工人人數較少,可用抽簽法從中分別抽取2人和4人;對一般干部可用隨機數表法抽取14人。(3)將2人、4人、14人編號匯合在一起就得到了容量為20的樣本.10.某單位有工程師6人,技術員12人,技工18人,要從這些人中抽取一個容量為n的樣本。如果采用系統抽樣法和分層抽樣法抽取,不用剔除個體;如果樣本容量增加一個,則在采用系統抽樣時,需要在總體中先剔除1個個體,求樣本容量n。解總體容量為6+12+18=36。當樣本容量是n時,由題意知,系統抽樣的間隔為36,分層抽樣的比例n是n,抽取工程師nX6=n(人),TOC\o"1-5"\h\z36 36 6抽取技術人員旦X12=n(人),36 3抽取技工旦X18=n(人)。36 2所以n應是6的倍數,36的約數即n=6,12,18,36。當樣本容量為(n+1)時,在總體中剔除1人后還剩35人,系統抽樣的間隔為王,因為工必須是整n+1 n+1數,所以n只能取6,即樣本容量為6.總體分布的估計與總體特征數的估計基基礎自測1。一個容量為20的樣本,已知某組的頻率為0.25,則該組的頻數為答案529I]582。(2008?山東理)右圖是根據《山東統計年鑒2007》中的資料作成的1997年至2006年我3026省城鎮居民百戶家庭人口數的莖葉圖。圖中左邊的數字從左到右分別表示城鎮居民百戶310247家庭人口數的百位數字和十位數字,右邊的數字表示城鎮居民百戶家庭人口數的個位數字。從圖中可以得到1997年至2006年我省城鎮居民百戶家庭人口數的平均數為。答案303。63。在抽查產品的尺寸過程中,將其尺寸分成若干組,[a,b)是其中的一組,抽查出的個體在該組上的頻率為m,該組在頻率分布直方圖的高為h,則|a—b1=。答案mh4。(2008?山東文,9)從某項綜合能力測試中抽取100人的成績,統計如表,則這100人成績的標準差為。分數54321人數2010303010答案2,1055.為了了解某地區高三學生的身體發育情況,抽查了該地區100名年齡為17。5歲?18歲的男生體重(kg),得到頻率分布直方圖如下:根據上圖可得這100名學生中體重在[56。5,64。5)的學生人數是答案40典型例題:例1在學校開展的綜合實踐活動中,某班進行了小制作評比,作品上交時間為5月1日至30日,評委會把同學們上交作品的件數按5天一組分組統計,繪制了頻率分布直方圖(如圖所示),已知從左到右各長方形高的比為2:3:4:6:4:1,第三組的頻數為「物組距12,請解答下列問題: —(1)本次活動共有多少件作品參加評比? rT1611152]2631I[期
(2)哪組上交的作品數量最多?有多少件?(3)經過評比,第四組和第六組分別有10件、2件作品獲獎,問這兩組哪組獲獎率高?解⑴第三組的頻率為:^二;又因為第三組的頻數為12,???參評作品數為12=60。15(2)根據頻率分布直方圖,可以看出第四組上交的作品數量最多,共有^乂二:口改件)。(3)第四組的獲獎率是18二;,第六組上交的作品數量為^乂丁彳一二以件),???第六組的獲獎率為2=%顯然第六組的獲獎率高.39例4(14分)某化肥廠甲、乙兩個車間包裝肥料,在自動包裝傳送帶上每隔30min抽取一包產品,稱其重量,分別記錄抽查數據如下:甲:102, 101, 99, 98, 103, 98, 99;乙:110,115, 90, 85, 75, 115, 110。(1)這種抽樣方法是哪一種?(2)將這兩組數據用莖葉圖表示;(3)將兩組數據比較,說明哪個車間產品較穩定。解(1)因為間隔時間相同,故是系統抽樣。(2)莖葉圖如下:卜:|?!汗?K:|3:■! 1 I:'II(3)甲車間:平均值:TOC\o"1-5"\h\z-=1(102+101+99+98+103+98+99)=100, 7分哲7方差:s2=1((102-100)2+(101-100)2+…+(99-100)2]心3。4286. 9分7乙車間:平均值:-=1(110+115+90+85+75+115+110)=100, 11分“27方差:s2=1[(110—100)2+(115—100)2+…+(110—100)2]心228.5714。 13分7,:“J12,s12Vs/,?,?甲車間產品穩定。 14分練習:1。為了了解小學生的體能情況,抽取了某小學同年級部分學生進行跳繩測試,將所得數據整理后,畫出頻率分布直方圖如圖所示,已知圖中從左到右前三個小組的頻率分別是0.1,0。3,0。4,第一小組的頻數為5.代016-組跑 0.012- O.OOK- 0.004. ?74.599,5124.5(1)求第四小組的頻率;(2)參加這次測試的學生人數是多少?(3)在這次測試中,學生跳繩次數的中位數落在第幾小組內?解(1)第四小組的頻率=1—(0。1+0.3+0.4)=0.2。(2)設參加這次測試的學生人數是n,則有n二第一小組頻數=5+0。1=50(人)。第一小組頻率(3)因為0.1X50=5,0.3X50=15,0。4X50=20,0。2X50=10,即第一、第二、第三、第四小組的頻數分別為5、15、20、10,所以學生跳繩次數的中位數落在第三小組內。練習:一、填空題1。下列關于頻率分布直方圖的說法中不正確的是。
①直方圖的高表示取某數的頻率②直方圖的高表示該組上的個體在樣本中出現的頻率③直方圖的高表示該組上的個體數與組距的比值④直方圖的高表示該組上的個體在樣本中出現的頻率與組距的比值答案①②③2。甲、乙兩名新兵在同樣條件下進行射擊練習,每人打5發子彈,命中環數如下:甲:6,8,9,9,8;乙:10,7,7,7,9.則這兩人的射擊成績比穩定.答案甲乙4.某班50名學生在一次百米測試中,成績全部介于13秒與19秒之間,將測試結果分成六組:右圖是得到的頻率分布直方圖.設成績小于17秒的學生人數占全班總人數的百分比為x,成績大于等于15秒且小于17秒的學生人數為y,則從頻率分布直方圖中可分析出x和y分別為。答案0。9,356。甲、乙兩名同學在5次體育測試中的成績統計的莖葉圖如圖所示,若甲、 甲||乙乙兩人的TOC\o"1-5"\h\z一,,、,+ 8727 8平均成績68 28分別是x甲、乂乙,則x甲X/比穩定. 29 15答案(乙甲7.(上海,9)已知總體的各個體的值由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且總體的中位數為10.5。若要使該總體的方差最小,則a、b的取值分別是.答案10.5、10。5二、解答題10。為了了解高一學生的體能情況,某校抽取部分學生進行一分鐘跳繩次數測試,將所得數據整理后,畫出頻率分布直方圖(如圖所示),圖中從左到右各小長方形面積之比為2:4:17:15:9:3,第二小組頻數為12。
痂率坦距痂率坦距(1)第二小組的頻率是多少?樣本容量是多少?(2)若次數在110以上(含110次)為達標,試估計該學校全體高一學生的達標率是多少?⑶在這次測試中,學生跳繩次數的中位數落在哪個小組內?請說明理由。解(1)由于頻率分布直方圖以面積的形式反映了數據落在各小組內的頻率大小,因此第二小組的頻率為: 4 二0。08。2+4+17+15+9+3又因為頻率二第二小組頻數,樣本容量所以樣本容量二第二小組頻數=皿=150。第二小組頻率0.08(2)由圖可估計該學校高一學生的達標率約為17+15+9+3 X100%=88%。2+4+17+15+9+3(3)由已知可得各小組的頻數依次為6,12,51,45,27,9,所以前三組的頻數之和為69,前四組的頻數之和為114,所以跳繩次數的中位數落在第四小組內.基基礎自測線性回歸方程基基礎自測1.下列關系中,是相關關系的為(填序號).①學生的學習態度與學習成績之間的關系;②教師的執教水平與學生的學習成績之間的關系;③學生的身高與學生的學習成績之間的關系;④家庭的經濟條件與學生的學習成績之間的關系。答案①②2。為了考察兩個變量x、y之間的線性相關關系,甲、乙兩同學各自獨立地做10次和15次試驗,并利用最小二乘法求得回歸直線分別為11和12.已知在兩人的試驗中發現變量x的觀測數據的平均值恰好相等,都為S,變量y的觀測數據的平均值也恰好相等,都為t,那么下列說法中正確的是(填序號)。①直線11,12有交點(s,t)②直線11,12相交,但是交點未必是03)③直線11,12由于斜率相等,所以必定平行④直線11,12必定重合答案①3。下列有關線性回歸的說法,正確的是(填序號).①相關關系的兩個變量不一定是因果關系②散點圖能直觀地反映數據的相關程度③回歸直線最能代表線性相關的兩個變量之間的關系④任一組數據都有回歸直線方程答案①②③4.下列命題:①線性回歸方法就是由樣本點去尋找一條貼近這些樣本點的直線的數學方法;②利用樣本點的散點圖可以直觀判斷兩個變量的關系是否可以用線性關系表示;③通過回歸直線亍=b*+0及回歸系數b,可以估計和預測變量的取值和變化趨勢.其中正確命題的序號是。答案①②③5.已知回歸方程為y=0.50x-0.81,則x=25時,y的估計值為.答案11。69典例剖析例1下面是水稻產量與施化肥量的一組觀測數據:施化肥量15202530354045水稻產量320330360410460470480(1)將上述數據制成散點圖;(2)你能從散點圖中發現施化肥量與水稻產量近似成什么關系嗎?水稻產量會一直隨施化肥量的增加而增長嗎?解(1)散點圖如下:
TOC\o"1-5"\h\z5W .??400- ,*3如 ..20010()0-5161520253035 4550x(2)從圖中可以發現施化肥量與水稻產量具有線性相關關系,當施化肥量由小到大變化時,水稻產量由小變大,圖中的數據點大致分布在一條直線的附近,因此施化肥量和水稻產量近似成線性相關關系,但水稻產量只是在一定范圍內隨著化肥施用量的增加而增長。例2(14分)隨著我國經濟的快速發展,城鄉居民的生活水平不斷提高,為研究某市家庭平均收入與月平均生活支出的關系,該市統計部門隨機調查了10個家庭,得數據如下:家庭編號12345678910xi(收入)千元0。81.11。31.51.51.82.02。22。42。8yi(支出)千元0。71。01.21。01。31。51。31.72.02.5⑴判斷家庭平均收入與月平均生活支出是否相關?(2)若二者線性相關,求回歸直線方程。解(1)作出散點圖:¥332,51,5O2¥332,51,5O2LO.月支出/千元平均收入/千兀觀察發現各個數據對應的點都在一條直線附近,所以二者呈線性相關關系.(2)x=-1(0。8+1.1+1。3+1。5+1。5+1.8+2。0+2.2+2.4+2.8)=1。74,x107=±(0.7+1.0+1。2+1。0+1。3+1。5+1。3+1。7+2.0+2。5)=1。42,10分X--x^x.y.一nx?yb= '0.8136,x2jx2-nx2ii=1
a=1。42-1。74X0。8136'0。0043, 13分???回歸方程小=0.8136x+0。0043。 14分例3下表提供了某廠節能降耗技術改造后生產甲產品過程中記錄的產量x(噸)與相應的生產能耗y(噸)標準煤的幾組對照數據。x3456y2。5344。5(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,用最小二乘法求出y關于x的線性回歸方程亍=bx+a;(3)已知該廠技改前100噸甲產品的生產能耗為90噸標準煤。試根據(2)求出的線性回歸方程,預測生產100噸甲產品的生產能耗比技改前降低多少噸標準煤?(參考數值:3X2。5+4X3+5X4+6X4.5=66。5)解(1)散點圖如下圖:TOC\o"1-5"\h\zH(噸)4$ *4 ?353' ?2.5 ?T1.5I-0.52.5+3+4+4.52.5+3+4+4.5=3。5(2)x=3+4+5+6=4.5,y=4Xxy=3X2。5+4X3+4X5+6X4。5=66.5。iii=1Xx2=32+42+52+62=86ii=1X--x-^x.y.一4x?yi=111=66.5—4義3.5義4.5=0.7X 86-4x4.52X2xi-4x2i=1a=y—bx=3。5-0。7X4。5=0。35。???所求的線性回歸方程為y=0。7x+0.35。
(3)現在生產100噸甲產品用煤y=0。7X100+0。35=70。35,???降低90—70。35=19.65(噸)標準煤。 知能遷移一1。科研人員為了全面掌握棉花新品種的生產情況,查看了氣象局對該地區年降雨量與年平均氣溫的統計數據(單位分別是mm,℃),并作了統計。年平均氣溫12。5112。8412。8413。6913.3312。7413.05年降雨量748542507813574701432(1)試畫出散點圖;(2)判斷兩個變量是否具有相關關系。解 (1)作出散點圖如圖所示,y900孔)(卜7()()6005tX)51心1313.5’14年平居氣溫(2)由散點圖可知,各點并不在一條直線附近,所以兩個變量是非線性相關關系。2。在研究硝酸鈉的可溶性程度時,對于不同的溫度觀測它在水中的溶解度,得觀測結果如下:溫度儀)010205070溶解度(y)66.776.085.0112.3128。0由資料看y與x呈線性相關,試求回歸方程。=66.7+76.0+85.0+112.3+128.0=93。6.£8809。乙匕一5x?y8809。4=1 —0。£乙x2-5x2i=1a=;—b-=93.6—0o8809X30=67。173。ay x
???回歸方程為$=0。8809x+67。173.3.某企業上半年產品產量與單位成本資料如下:月份產量(千件)單位成本(元)127323723471437354696568(1)求出線性回歸方程;(2)指出產量每增加1000件時,單位成本平均變動多少?(3)假定產量為6000件時,單位成本為多少元?解(1)n=6,£xi=21,£匕=426,x=3.5,廠71,i=1 i=1£6xi2=79,£6xi$i=1481,i=1 i=1/\ b=£/\ b=£x"$xiyx-6x?yi=1 =£^-^x2-6x2i1481-6義3.5義7179-6x3.52=—1。82。i=1£=Lb?=71+1o82X3。5=77。37。ayx回歸方程為y=/bx=77。37-1。82x.(2)因為單位成本平均變動b=-1.82<0,且產量x的計量單位是千件,所以根據回歸系數b的意義有:產量每增加一個單位即1000件時,單位成本平均減少1.82元。(3)當產量為6000件時,即乂=6,代入回歸方程:y=77。37—1.82X6=66.45(元)當產量為6000件時,單位成本為66.45元.活頁作業一一、填空題1。觀察下列散點圖,則①正相關;②負相關;③不相關。它們的排列順序與圖形對應順序是答案a,c,b2?;貧w方程『1。5x-15,則下列說法正確的有個.①-二1。5--15②15是回歸系數a③1。5是回歸系數a④x=10時,y=0答案13。(2009.湛江模擬)某地區調查了2?9歲兒童的身高,由此建立的身高y(cm)與年齡x(歲)的回歸模型為R=8。25x+60.13,下列敘述正確的是.①該地區一個10歲兒童的身高為142。63cm②該地區2?9歲的兒童每年身高約增加8.25cm③該地區9歲兒童的平均身高是134.38cm④利用這個模型可以準確地預算該地區每個2~9歲兒童的身高答案②4.三點(3,10),(7,20),(11,24)的回歸方程是。答案小=1。75x+5。755。某人對一地區人均工資x(千元)與該地區人均消費y(千元)進行統計調查,y與x有相關關系,得到回歸直線方程『0.66x+1.562。若該地區的人均消費水平為7.675千元,估計該地區的人均消費額占人均工資收入的百分比約為。答案83%6.某化工廠為預測產品的回收率y,需要研究它和原料有效成分含量x之間的相關關系,現取8對觀測值,計算,得8x=52, 8y =228, 8x2=478, 8xy =1849,則其線性回歸方程為。TOC\o"1-5"\h\zi i i iii1 i1 i1 i1答案y=11。47+2。62x7。有下列關系:①人的年齡與他(她)擁有的財富之間的關系;②曲線上的點與該點的坐標之間的關系;③蘋果的產量與氣候之間的關系;④森林中的同一種樹木,其斷面直徑與高度之間的關系。其中,具有相關關系的是 .答案①③④8.已知關于某設備的使用年限x與所支出的維修費用y(萬元),有如下統計資料:使用年限x23456維修費用y2。23.85。56。57.0若y對x呈線性相關關系,則回歸直線方程y=bx+a表示的直線一定過定點.答案(4,5)二、解答題9.期中考試結束后,記錄了5名同學的數學和物理成績,如下表:學科\ABCDE數學8075706560物理7066686462(1)數學成績和物理成績具有相關關系嗎?(2)請你畫出兩科成績的散點圖,結合散點圖,認識(1)的結論的特點。解 (1)數學成績和物理成績具有相關關系。(2)以乂軸表示數學成績,y軸表示物理成績,可得相應的散點圖如下:尸物理成填.,處-506Q7GWiF故學成績
由散點圖可以看出,物理成績和數學成績對應的點不分散,大致分布在一條直線附近。10。以下是某地搜集到的新房屋的銷售價格y和房屋的面積x的數據:房屋面積X(m2)11511080135105銷售價格y(萬元)24。821。618。429。222(1)畫出數據對應的散點圖;(2)求線性回歸方程,并在散點圖中加上回歸直線。解 (1)數據對應的散點圖如圖所示:V 2X+L8I42(2)-二109,-=23o2,25X2V 2X+L8I42(2)-二109,-=23o2,25X2=60975,i=125%V=12952,xiyii=12 --x-^x.y.-5x?ybT 2X^x,2-5x2
i心0.1962i=1a二y—bx-1.8142???所求回歸直線方程為y=0。1962x+1。8142.11.某公司利潤y與銷售總額x(單位:千萬元)之間有如下對應數據:X10151720252832y11.31。822.62.73。3(1)畫出散點圖;⑵求回歸直線方程;(3)估計銷售總額為24千萬元時的利潤。解(1)散點圖如圖所示:2 L,I*白510152025(2)-=1(10+15+17+20+25+28+32)=21,7=1(1+1。3+1。8+2+2.6+2。7+3。3)=2.1,7X%2=102+152+172+202+252+282+322=3447,ii=1X%y=10X1+15X1.3+17X1。8+20X2+25X2.6+28X2。7+32X3。3=346.3,i,ii=1X-%-yx.y.一7x?y104,,='=346.3—7x21x2.1?0。104,X_ 3447-7x212^■^x?-7x2i=1£=;—br=2o1-0.104X21=—0.084,ay x??y=0。104x-0.084。(3)把x=24(千萬元)代入方程得,y=2.412(千萬元)。??估計銷售總額為24千萬元時,利潤為2。412千萬元。12。某種產品的廣告費支出x與銷售額y(單位:百萬元)之間有如下對應數據:x24568y3040605070(1)畫出散點圖;(2)求回歸直線方程;(3)試預測廣告費支出為10百萬元時,銷售額多大?解(1)根據表中所列數據可得散點圖如下:7Q-TOC\o"1-5"\h\z60- *30-4fl- *30- ?
(2)列出下表,并用科學計算器進行有關計算:i12345xi24568yi3040605070xiyi60160300300560因此,x=25=5,~=,250=50,x5y5£x2=145,Xy2=13500,寸xy=1380.i i iii=1 i=1 i=1£「一x-yx.y.一5x?y=6.5;于是可得:b=i=1,, =1380一5*5*50=6.5;1 _ 145-5*5*5x^x2-5x2
ii=1a=y—bx=50-6。5X5=17。5.因此,所求回歸直線方程為:y=6。5x+17.5。(3)根據上面求得的回歸直線方程,當廣告費支出為10百萬元時,y=6.5X10+17.5=82。5(百萬元),即這種產品的銷售收入大約為82。5百萬元.§11.4統計案例基基礎自測1。對有線性相關關系的兩個變量建立的回歸直線方程 y=a+bx中,回歸系數b與0的大小關系為。(填序號)①大于或小于②大于③小于①大于或小于②大于③小于 ④不小于答案①2。如果有90%的把握說事件A和B有關系,那么具體計算出的數據為22。706.(用“>”“<”,“二”填空)答案>3.對兩個變量y與x進行回歸分析,分別選擇不同的模型,它們的相關系數r如下,其中擬合效果最好的模型是。①模型I的相關系數r為0。98②模型H的相關系數r為0。80③模型HI的相關系數r為0。50④模型W的相關系數r為0.25答案①4。下列說法中正確的有:①若r>0,則x增大時,y也相應增大;②若r<0,則x增大時,y也相應增大;③若r=1或r=—1,則x與y的關系完全對應(有函數關系),在散點圖上各個點均在一條直線上。答案①③ 典例剖析一^* 例1 (14分)調查339名50歲以上人的吸煙習慣與患慢性氣管炎的情況,獲數據如下:患慢性氣管炎未患慢性氣管炎總計吸煙43162205不吸煙13121134合計56283339試問:(1)吸煙習慣與患慢性氣管炎是否有關?(2)用假設檢驗的思想給予證明.(1)解根據列聯表的數據,得到TOC\o"1-5"\h\z2=n(ad-bc)2 2分(a+b)(a+c)(d+b)(d+c)=339x(43x⑵-162X13)2=7。469〉6。635 6分205x56x283x134所以有99%的把握認為“吸煙與患慢性氣管炎有關”。 9分
(2)證明假設“吸煙與患慢性氣管炎之間沒有關系”,由于事件A={X2三6。635}心0。01,即A為小概率事件,而小概率事件發生了,進而得假設錯誤,這種推斷出錯的可能性約有1%。14分例2一臺機器使用時間較長,但還可以使用.它按不同的轉速生產出來的某機械零件有一些會有缺點,每小時生產有缺點零件的多少,隨機器運轉的速度而變化,下表為抽樣試驗結果:轉速x(轉/秒)1614128每小時生產有缺點的零件數y(件)11985(1)對變量y與x進行相關性檢驗;(2)如果y與x有線性相關關系,求回歸直線方程;(3)若實際生產中,允許每小時的產品中有缺點的零件最多為10個,那么,機器的運轉速度應控制在什么范圍內?解(1)-二12。5,-二8。25,243=438,4--=412.5,i=124x2二660,24y2二291,iii=1 i=12-所以r=Jx.y.-4x?所以r=i=1'(£x2_4x438-412.5<(660-625)x(291-272.25)二25438-412.5<(660-625)x(291-272.25)二25.5心25.50心0.9954。<656,25 25.62因為r>r°005,所以y與x有很強的線性相關關系。y=0。7286x—0。8571。(3)要使y<10=0。7286x-0。8571W10,所以x<14.9013。所以機器的轉速應控制在14.9013轉/秒以下.'i=1 i=1
例3下表是某年美國舊轎車價格的調查資料,今以x表示轎車的使用年數,y表示相應的年均價格,求y關于x的回歸解作出散點圖如圖所示.解作出散點圖如圖所示.使用年數x12345678910年均價格y(美元)2651194314941087765538484290226204了碑均彷格30002000I500I0005州5 10 15爐使用年數可以發現,各點并不是基本處于一條直線附近,因此,y與x之間應是非線性相關關系。與已學函數圖象比較,用q=ebxa來刻畫題中模型更為合理,令z=lnq,則z=bx+a,題中數據變成如下表所示:y zyzax12345678910z7.8837.5727。3096.9916。6406。2886。1825。6705。4215。318相應的散點圖如圖所示,從圖中可以看出,變換的樣本點分布在一條直線附近,因此可以用線性回歸方程擬合。4W年均價格的對數?*?5 …43-5 10 15Jt/使用洋數由表中數據可得r\—00996。|r|>r .認為x與z之間具有線性相關關系,由表中數據得b\一0。0。05298,a'8.165,所以f=—0。298x+8。165,最后回代f=ln”即q=e-o.298x+8.i65為所求。a z zyy知能遷移1。某班主任對全班50名學生學習積極性和對待班級工作的態度進行了調查,統計數據如下表所示:積極參加班級工作不太主動參加班級工作合計學習積極性高18725學習積極性一般61925合計242650(1)如果隨機抽查這個班的一名學生,那么抽到積極參加班級工作的學生的概率是多少?抽到不太主動參加班級工作且學習積極性一般的學生的概率是多少?(2)試運用獨立性檢驗的思想方法分析:學生的學習積極性與對待班級工作的態度是否有關系?說明理由.解(1)隨機抽查這個班的一名學生,有50種不同的抽查方法,由于積極參加班級工作的學生有18+6=24人,所以有24種不同的抽法,因此由古典概型的計算公式可得抽到積極參加班級工作的學生的概率是P=皂=12,又因為不太主動參加班級工作且學習積極性一般的學生有19人,所以抽到不太15025主動參加班級工作且學習積極性一般的學生的概率是P=19.250(2)由浮統計量的計算公式得浮=50x(18X19-6X7)2\11.538,由于11.538>10。828,所以可以有99.9%24x26x25x25的把握認為“學生的學習積極性與對待班級工作的態度有關系〃。2.某個體服裝店經營某種服裝,一周內獲純利y(元)與該周每天銷售這種服裝的件數x之間的一組數據如下:x3456789y66697381899091已知X42=280,X,2=45309,Sxiyi=3487,此時r005=00754。i=1 i=1 i=1(1)求x,y;(2)判斷一周內獲純利潤y與該周每天銷售件數x之間是否線性相關,如果線性相關,求出回歸直
線方程.解(1)-=1(3+4+5+6+7+8+9)=6,7-=1(66+69+73+81+89+90+91)\79。86。7(2)根據已知Xx2=280, Xy2=45309,E^y=3487,i=1 i=1 i=1得相關系數r= 3487—7x6x79.86-0.973。?v'(280—7x62)(45309—7x79.862)由于0。973>0.754,所以純利潤y與每天銷售件數x之間具有顯著線性相關關系。利用已知數據可求得回歸直線方程為y=4.746x+51。386.3。某種書每冊的成本費y(元)與印刷冊數x(千冊)有關,經統計得到數據如下:x123510203050100200y10.155.524。082.852。111。621.411。301。211。15檢驗每冊書的成本費y與印刷冊數的倒數1之間是否具有線性相關關系,如有,求出y對x的回歸方x程。解首先作變量置換,令u二工,題目所給數據變成如下表所示的10對數據:然后作相關性檢驗。經計算得r然后作相關性檢驗。經計算得r-0.9998>0性相關關系.由公式得a-1。125,b-8。973,所以y=1.125+8。973u,最后回代u=1,x可得y=1.125+8973,x這就是題目要求的y對x的回歸曲線方程。。75,從而認為u與y之.. 間具有線卜一?0246B10X回歸曲線的圖形如圖所示,它是經過平移的反比例函數圖xu10.50.330。20.10。050.030。020。010O005y10。155。524。082.852。111.621.411。301。211.15象的一個分支.—活頁作業—-—一、填空題1。對于獨立性檢驗,下列說法中正確的是.①%2的值越大,說明兩事件相關程度越大②%2的值越小,說明兩事件相關程度越?、郏?W2。706時,有90%的把握說事件A與B無關④%2>6.635時,有99%的把握說事件A與B有關答案①②④2.工人月工資y(元)依勞動生產率x(千元)變化的回歸方程為亍=50+80x,下列判斷正確的是①勞動生產率為1000元時,工資為130元②勞動生產率提高1000元時,工資平均提高80元③勞動生產率提高1000元時,工資平均提高130元④當月工資為210元時,勞動生產率為2000元答案②3。下面是2X2列聯表:y1y2合計x1a2173x2222547合計b46120則表中a,b的值分別為.答案52,744。實驗測得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為。答案『x+15。在一次試驗中,當變量x的取值分別為1,1,1,1時,變量y的值分別為2,3,4,5,則y與1的回歸23 4 x曲線方程為。答案廣1+1x6。在一次對性別與說謊是否有關的調查中,得到如下數據:說謊不說謊合計男6713女8917合計141630根據表中數據,得到如下結論中不正確的是.①在此次調查中有95%的把握認為是否說謊與性別有關②在此次調查中有99%的把握認為是否說謊與性別有關③在此次調查中有99。5%的把握認為是否說謊與性別有關④在此次調查中沒有充分的證據顯示說謊與性別有關答案①②③7。為了判斷高中三年級學生是否選修文科與性別的關系,現隨機抽取50名學生,得到如下2X2列聯表:理科文科男1310女720已知P(12三3。841)心0。05,P(%2三5。024)心0。025。根據表中數據,得到%2=50X。3X20-1°X7)2'4。844。23x27x20x30則認為選修文科與性別有關系出錯的可能性為。答案5%8。為了探究電離輻射的劑量與人體的受損程度是否有關,用兩種不同劑量的電離輻射照射小白鼠,在照射后14天的結果如下表所示:死亡存活合計第一種劑量141125第二種劑量61925合計203050進行統計分析時的統計假設是:答案小白鼠的死亡與劑量無關二、解答題9.在一次飛機航程中調查男女乘客的暈機情況,其二維條形圖如圖:(1)寫出2X2列聯表;(2)判斷暈機與性別是否有關?解⑴暈機不暈機合計男107080女102030合計2090110(2)X2=110x(10X20-70x10)2'6。366>5.024,故有97。5%的把握認為“暈機與性別有關”。20x90x30x8010。某地10戶家庭的年收入和年飲食支出的統計資料如下表:年收入x(萬元)24466677810年飲食支出y(萬元)0.91。41。62。02。11。91。82。12。22。3(1)根據表中數據,確定家庭的年收入和年飲食支出之間是否具有相關關系;若具有相關關系求出y與x的回歸直線方程;(2)如果某家庭年收入為9萬元,預測其年飲食支出。 口4-解(1)由題意知,年收入x為解釋變量,年飲食支出y為預報變量,作散3-點圖(如圖所示).從圖中可以看出,樣本點呈條狀分布,年收入和年飲食支..匕,■,TOC\o"1-5"\h\z出有比較好的線性相關關系,因此可以用回歸直線方程刻畫它們之間的關系。1 _o12345678孑mX:-=6,-=1.83,£%2=406,£y2=35。13,£%丫=117.7,i i iii=1 i=1 i=1???b\0。172,a=v—b7=1。83-0.172X6=0.798。ay 人從而得到回歸直線方程為y=0。172x+0。798。(2)當x=9時,y=2.346。因此,某家庭年收入9萬元,其年飲食支出大約為2.346萬元。11.測得某國家10對父子身高(單位:英寸)如下:父親身高(x)60626465666768707274兒子身高(y)63。665。26665。566.967。167。468。370。170(1)對變量y與x進行相關性檢驗;(2)如果y與x之間具有線性相關關系,求回歸直線方程;(3)如果父親的身高為73英寸,估計兒子的身高。解(1)-二66。8,廠67。01,£%2=44794,£y2=44941.93,iii=1 i=1%y=4476。268,%2=4462。24,y2-4490.34, £%iyi=44842。4。i=1£/— %-^x.y.一10%?y所以r=,i=ii昌一10%2)(£y2_10y2)*i=1 i=1=_ 44842.4—10x4476.27y;(44794—44622.4)(44941.93—44903.4)=79.72 -0。9804.66611.748因為r>%05,所以y與x之間具有線性相關關系。(2)設回歸直線方程為y=b%+a.£/1-%iyi—10%?y由八.1' =44842.4—44762.7由b=十匕 F_ 44794—44622.40%2一10%2ii=1=S-0。4646。171.6a=y—b%=67。01-0.4646X66。8-35.9747.故所求的回歸直線方程為y=0.4646x+35.9747.(3)當x=73英寸時,y=0.4646X73+35。9747-69。9,所以當父親身高為73英寸時,估計兒子的身高約為69.9英寸。12.在調查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分別利用圖形和獨立性檢驗的方法來判斷色盲與性別是否有關?你所得到的結論在什么范圍內有效?解根據題目所給的數據作出如下的列聯表:色盲不色盲合計男38442480女6514520合計449561000根據列聯表作出相應的二維條形圖:600-色盲不色百400200-從二維條形圖來看,在男人中患色盲的比例為至,要比女人中患色盲的比例上大。480 520其差值為到__6_'0。068,差值較大。480520因而,我們可以認為“患色盲與性別是有關的〃.根據列聯表所給的數據可以有a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=1000x(38x514-6x442)2\27。1.480x520x44x956由27.1>10。828,所以我們有99。9%的把握認為患色盲與性別有關系,這個結論只對所調查的480名男人和520名女人有效。單元檢測十一一、填空題(本大題共14小題,每小題5分,共70分)1。某班的78名同學已編號1,2,3,…,78,為了解該班同學的作業情況,老師收取了學號能被5整除的15名同學的作業本,這里運用的抽樣方法是.答案系統抽樣法2.一組數據的方差為S2,將這組數據中的每個數據都擴大3倍,所得到的一組數據的方差是.答案9s23。某地區有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,為了掌握各商店的營業情況,要從中抽取一個容量為20的樣本,若采用分層抽樣的方法,抽取的中型商店數有家.答案54.下圖是某中學高一年級1200名學生身高的頻率分布直方圖的一部分,則身高在[160,170]的學生大約有名。物率答案5105。某人5次上班途中所花的時間(單位:分鐘)分別為x,y,10,11,9。已知這組數據的平均數為10,方差為2,則|x—y1的值為。答案46。有以下兩個問題:(1)某社區有1000個家庭,其中高收入家庭有250戶,中等收入家庭有560戶,低收入家庭有190戶,為了了解社會購買力的某項指標,要從中抽取一個容量為200的樣本;(2)從20人中抽取6人參加座談會,給出下列抽樣方法:a隨機抽樣;b系統抽樣;c分層抽樣.上述兩個問題應采用的抽樣方法分別為(填代號).答案c,a7.下圖為甲、乙兩名籃球運動員每場比賽得分情況的莖葉圖,則甲和乙得分的中位數的和是分。甲甲4445495662195答案578。下列說法:①將一組數據中的每個數據都加上或減去同一個常數后,方差恒不變;②設有一個回歸方程亍=3-5x,變量x增加一個單位時,y平均增加5個單位;③線性回歸方程f=bx+a必過(XT)④曲線上的點與該點的坐標之間具有相關關系;⑤在一個2X2列聯表中,由計算得/=13.079,則其兩個變量間有關系的可能性是90%。其中錯誤的個數是。答案39.(2008?陜西文)某林場有樹苗30000棵,其中松樹苗4000棵,為調查樹苗的生長情況,采用分層抽樣的方法抽取一個容量為150的樣本,則樣本中松樹苗的數量為。答案2010。甲、乙、丙三名射箭運動員在某次測試中各射箭20次,三人的測試成績如下表甲的成績環數78910頻數5555乙的成績環數78910頻數6446丙的成績環數78910頻數4664s1、s/s3分別表示甲、乙、丙三名運動員這次測試成績的標準差 ,則有s1,s2,s3的大小關系為。答案S2>S1>S311。在樣本的頻率分布直方圖中,一共有4個小長方形,這4個小長方形的面積由小到大構成等差數列{an},且a2=2a1,若樣本容量為400,則小長方形中面積最大的一組的頻數等于。答案16012。(2008?廣東文,11)為了調查某廠工人生產某種產品的能力,隨機抽查了20位工人某天生產該產品的數量,產品數量的分組區間為[45,55),[55,65),[65,75),[75,85),[85,95).由此得到頻率分布直方圖如圖所示,則這20名工人中一天生產該產品數量在[55,75)的人數是。頻率產品數量頻率產品數量答案1313。如果數據x1,x2,…,xn的平均數為-,方差為S2,則2x1+3,2x2+3,…,2xn+3的平均數和方差為,。答案2-+34s214。(2008?湖南文,12)從某地區15000位老人中隨機抽取500人,其生活能否自理的情況如下表所示。人、別生活能否自』理數'\男女能一178278不能2321則該地區生活不能自理的老人中男性比女性約多人.答案60二、解答題(本大題共6小題,共90分)15。(14分)一次科技知識競賽,兩組學生成績統計如下:分數5060708090100人數甲組251013146乙組441621212已經算得兩個組的平均分都是80分,請你根據所學過的統計知識,進一步判斷兩個組在這次競賽中的成績誰優誰次?并說明理由。解(1)從眾數看,甲為90分,乙為70分,甲組成績較好;(2)從中位數看,兩組中位數都為80分,但在80分(含80分)以上,甲組有33人,乙組有26人,甲組人數多于乙組人數,甲組成績較好;(3)從方差看,=172,§乙=256,甲組成績波動較小,較穩定;(3)從方差看,(4)從得滿分情況來看,甲組人數6人,乙組人數12人,成績較好者應為乙組。16.(14分)某重點中學高中各班級學生人數如下表所示:\ 年級'、班\高一年級高二年級高三年級1班4546482班4854553班525052學校計劃召開學生代表座談會。請根據上述基本數據,設計一個容量為總體容量的-1的抽樣方案。20解由表中基本數據可知,高一學生總數為145人,高二學生總數為150人,高三學生總數為155人,第一步:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 旅游類自媒體賬號定制化運營及推廣補償協議
- 裝修安裝免責協議書
- 道路損壞補償協議書
- 車輛洗車承包協議書
- 貸款展期還款協議書
- 車禍出院賠償協議書
- 車輛協助解壓協議書
- 車輛損傷賠付協議書
- 餐飲物業轉讓協議書
- 人才引進安家費協議書
- 08J907 潔凈廠房建筑構造
- 中醫內科學:汗證
- 2024年藥學服務技能大賽考試題庫大全-上(單選題)
- 山東省菏澤市鄄城縣2023-2024學年八年級下學期7月期末歷史試題
- 醫療設備巡檢和維修保養管理制度
- 2024年云南省中考歷史試卷(含答案)
- 初中歷史資本主義制度的初步確立 作業設計
- 浙江省溫州市2024年高一下學期期末教學質量統測英語試題(B)含解析
- 教科版科學五年級下冊《課本問題課后研討題》參考答案
- 醫療收費收據樣式(醫院基層)
- 能源英語面面觀 知到智慧樹網課答案
評論
0/150
提交評論