




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、題庫11、A、C、2、單項選擇題(每題調查時間是指(調查資料所屬的時間調查工作的期限A、C、3、統計學題庫及題庫答案2分,共20分)B、D、對某城市工業企業未安裝設備進行普查,工業企業全部未安裝設備每個工業企業的未安裝設備進行調查的時間調查資料報送的時間 總體單位是(B、D、對比分析不同性質的變量數列之間的變異程度時A、全距 B、平均差C企業每一臺未安裝設備每一個工業企業,應使用(、標準差D、變異系數則樣本容量()在簡單隨機重復抽樣條件下,若要求允許誤差為原來的73,B、擴大為原來的 2/3倍D、擴大為原來的 2.25倍,已知職工家庭平均每月每人生活費收入的標準差為0.9545,極限誤差為1元
2、,在簡單重復抽樣條件下,應抽選A、擴大為原來的3倍C、擴大為原來的4/9倍某地區組織職工家庭生活抽樣調查12元,要求抽樣調查的可靠程度為()。A 576 戶 B 、 144 戶、100 戶 D、288 戶當一組數據屬于左偏分布時,則(A、平均數、中位數與眾數是合而為一的B、眾數在左邊、平均數在右邊眾數的數值較小,平均數的數值較大D、眾數在右邊、平均數在左邊某連續變量數列,其末組組限為500以上,又知其鄰組組中值為480,則末組的組中值8、( )A、520 B 、510C、500用組中值代表組內變量值的一般水平有一定的假定性,即(A、各組的次數必須相等B、變量值在本組內的分布是均勻的C組中值能取
3、整數各組必須是封閉組D、490X-X2,2,Xn是來自總體N(,)的樣本,樣本均值X服從)分布A、N( , 2)B.、N(0,1)C、 N(n ,n 2)2N(,一)n10、測定變量之間相關密切程度的指標是(A、估計標準誤C、相關系數二、多項選擇題(每題 2分,共10分)B、兩個變量的協方差D、兩個變量的標準差1、抽樣推斷中,樣本容量的多少取決于()。A、總體標準差的大小B、允許誤差的大小C、抽樣估計的把握程度D、總體參數的大小E、抽樣組織形式2、 抽樣估計中的抽樣誤差()。A、是不可避免要產生的B、是可能通過改進調查方式來消除的C是可以事先計算出來的D、只能在調查結束后才能計算的E、其大小是
4、可能控制的在什么條件下,加權算術平均數等于簡單算術平均數(B、D、各組變量值不等 各組次數都為1A、各組次數相等C變量數列為組距數列E各組次數占總次數的比重相等 總體平均數的假設檢驗方法通常有(A、Z檢驗法B、t檢驗法2檢驗法F檢驗法E、指出下列分組哪些是屬性分組( 人口按性別分組D、A、D、幾何檢驗法)企業按產值多少分組C、家庭收入水平分組產品按質量等級分組B、C、在業人員按文化程度分組 三、填空題(每空 2分,共20分)1、 統計分組的關鍵問題是正確選擇 與劃分。2、 對某村6戶居民家庭共30人進行調查,所得的結果是,人均收入400元,其離 差平方和為480,則標準差是 ,標準差系數是 。
5、3、 抽樣推斷的主要內容有 和兩個方面。4、 假設檢驗中的兩類錯誤分別稱為 和5、 相關系數 r的取值范圍是到。四、簡答題(每題 5分,共20分)1、眾數、中位數、均值的特點與應用場合是什么?2、什么是假設檢驗的 P值?如何根據 P值作出假設檢驗的結論?3、為什么要計算標準差系數?4、單因素方差分析的步驟是什么?五、計算題(每題10分,共30分)1、某班學生統計學原理考試成績次數分布如下:要求:根據上表資料,計算相應的的數字,填入表中空格。22、 根據有關調查,北京市每天每個家庭上網的時間服從正態分布N(4,1 )。現從北京市家庭中隨機抽取16戶,測得平均每天每戶家庭上網時間為 4.5小時。試
6、在0.05的顯著性水平 下判斷北京市家庭上網的時間是否有顯著提高?(Ze05 1.645,Z0.025 1.96)3、 從100家自選商場銷售額資料(x,億元)和利潤額(y,億元)資料計算得知:n=100,刀X=10,E Y=20,E X2=1.5,刀Y2=50,EXY=3o根據以上數據,求出利潤額對銷售額的直線回歸方程。題庫2、單項選擇題(每題 2分,共20分)1、統計學自身的發展,沿著兩個不同的方向,形成()A、描述統計學與理論統計學B、理論統計學與推斷統計學C、理論統計學與應用統計學D、描述統計學與推斷統計學2、 某地區為了掌握地區水泥生產的質量情況,擬對占該地區水泥總產量的80%的五個
7、大型水泥廠的生產情況進行調查,這種調查方式是()A普查 B典型調查 C抽樣調查 D重點調查3、 用組中值與次數求坐標點連接而成的統計圖是()A直方圖B條形圖C曲線圖D折線圖4、 離中趨勢指標中,最容易受極端值影響的是()A極差B平均差C標準差D標準差系數5、 一組數據的偏態系數為1.3,表明該組數據的分布是()A正態分布B平頂分布C左偏分布D右偏分布6、抽樣平均誤差說明抽樣指標與總體指標之間的()A實際誤差B平均誤差C實際誤差的平方D 允許誤差7、假設檢驗是檢驗()的假設是否成立。A樣本方差B總體指標C樣本方差D樣本平均數&用組中值代表組內變量值的一般水平有一定的假定性,即()A、各組的次數必
8、須相等B、變量值在本組內的分布是均勻的C組中值能取整數D、各組必須是封閉組9、總體平均數的假設檢驗方法,在小樣本,且方差未知時,通常采用()A、Z檢驗法B、t檢驗法檢驗法D、F檢驗法10、年勞動生產率x (千元)和工人工資 y=10+70x,這意味著年勞動生產率每提高1千元時,工人工資平均()A、增加70元B、減少70元C、增加80元D、減少80元、多項選擇題(每題 2分,共10分)1、 概率抽樣調查()A、是一種非全面調查B、其目的是根據抽樣結果推斷總體數量特征C它具有經濟性、時效性、準確性和靈活性等特點D、其調查單位是隨機抽取的E、抽樣推斷的結果往往缺乏可靠性2、常用的樣本指標有()A樣本
9、平均數B樣本成數C抽樣誤差D樣本方差E標準差3、在什么條件下,加權算術平均數等于簡單算術平均數()。A、各組次數相等B、各組變量值不等C變量數列為組距數列D、各組次數都為1E、各組次數占總次數的比重相等4、總體平均數的假設檢驗方法通常有()2A、Z檢驗法B、 t檢驗法C、檢驗法D、F檢驗法E、幾何檢驗法5、中位數是()A由標志值在變量數列中所處的位置決定的B根據標志值出現的次數決定的C總體單位水平的平均值D總體一般水平的代表值 E不受總體中極端數值的影響三、填空題(每空 2分,共20分)1、 一個完整的統計工作過程可以劃分為、四個階段。2、 當變量數列中算術平均數大于眾數時,這種變量數列的分布
10、呈分布;反之,算術平均數小于眾數時,變量數列的分布呈分布。3、 評價點估計量好壞的標準有、和。4、 相關系數,用于反映條件下,兩變量相關關系的密切程度和方向的統計指 標。四、簡答題(每題 5分,共20分)1、 離中趨勢的指標有哪些(至少列出三個),它們之間有何區別?2、影響抽樣誤差的因素有哪些?3、相關分析和回歸分析的聯系與區別?4、假設檢驗一般有哪些步驟?五、計算題(每題10分,共30分)1、某班級分甲、乙兩個學習小組,在統計學考試中,甲小組平均成績75分,標準差11.5,乙小組成績資料如表:成績(分)人數(人)60以下260-70570-80880-90690以上4合計25(1)計算乙小組
11、的平均成績。(2)以盡可能精確的方法比較兩小組平均成績的代表性。2、根據歷史的統計,某種產品的次品率為2%。如果要求置信水平為 95.45%的置信區間,并要求允許誤差不超過4%,應抽取多大的樣本?( P(Z 2) 95.45%)3、從100家自選商場銷售額資料(x,億元)和利潤額(y,億元)資料計算得知:n=100,刀 X=10,刀 Y=20,刀 X2=1.5,E Y2=50,刀 XY=3。根據以上數據,(1)求出利潤額對銷售額的直線回歸方程;(2) 預測當銷售額為 0.5億元時,利潤額在置信度為95.45%的預測區間(已知預測標準誤 差為0.05億元)。題庫3一、單項選擇題(每題 2分,共2
12、0分)1. 某地進行私營商業企業經營情況調查,則調查對象是()A該地所有商業企業B該地所有私營商業企業C該地每一私營商業企業D該地每一商業企業2. 統計分組的關鍵問題是()A確定分組標志和劃分各組界限B確定組距和組數C確定組距和組中值D確定全距和組距3用組中值與次數求坐標點連接而成的統計圖是()B條形圖D折線圖A直方圖C曲線圖4. 離中趨勢指標中,最容易受極端值影響的是()A 極差B平均差C標準差D標準差系數5. 所謂大樣本是指樣本單位數在()及以上。A 30 個B 50 個C 80 個D 100 個6. 抽樣指標與總體指標之間抽樣誤差的可能范圍是()A抽樣平均誤差B抽樣極限誤差D置信區間C區
13、間估計范圍7. 原假設為真,我們卻拒絕它的概率為()A 1- BC 1D8. 假設檢驗是檢驗()的假設是否成立。B總體指標D樣本平均數A樣本方差C樣本方差9. 下面的函數關系是()A銷售人員測驗成績與銷售額大小的關系B圓周的長度決定于它的半徑C家庭的收入和消費的關系D數學成績與統計學成績的關系10.年勞動生產率x (千兀)和工人工資(兀)y-30+70x,這意味著年勞動生產率每提高1千兀時,工人工資平均()A 增加70元B 減少70元C增加100元D 減少100元、多項選擇題(每題 2分,共10分)1詢問調查法有以下幾種()A訪冋調查B郵寄調查C電話調查D實驗法 E觀察法2某單位100名職工按
14、工資額分為300 以下、300-400、400-600、600-800、800 以上等五個組。這一分組()A是等距分組B是異距分組C末組組中值為800D 相鄰的組限是重疊的E 某職工工資600元,應計在600-800元組內3. 在各種平均數中,不受極端值影響的平均數是()A算術平均數B調和平均數C中位數D幾何平均數E眾數4. 在總體1000個單位中,抽取20個單位進行調查,下列各項正確的是( )A樣本單位數是20個B樣本個數是20個C 一個樣本有20個單位D樣本容量是20個E是一個小樣本5. 下列哪些變量之間的關系為相關關系()A家庭收入與消費支出關系B圓的面積與它的半徑關系C廣告支出與商品銷
15、售額關系D單位產品成本與利潤關系E在價格固定情況下,銷售量與商品銷售額關系三、填空題(每空 2分,共20分)1、 統計學按方法的構成可以分 與。2、 組距式變量數列,根據各組的組距是否相等可以分為和3、 直方圖是用的寬度和高度來表示頻數分布的圖形。4、 標準差系數是 與之比。5、 常用的總體指標有 、四、簡答題(每題 5分,共20分)1、統計調查方案包括有哪幾個方面的內容?2、數據的計量尺度分幾類?它們之間有什么區別與聯系?3、標準差與標準差系數各是什么含義?衡量數據的離散程度時,如何選擇?4、必要的抽樣數目受哪些因素的影響?五、計算題(每題10分,共30分)1.2006年某月份甲、乙兩農貿市
16、場某農產品價格和成交額、成交量資料如下:品種價格(元/斤)甲市場成交額(萬元)乙市場成交量(萬斤)甲1.21.22乙1.42.81丙1.51.51合計一5.54試問哪一個市場農產品的平均價格高?并說明理由。2、 某食品廠用自動裝袋機包裝食品,每袋標準重量為50克,每隔一定時間抽取包裝袋進行 檢驗。現抽取10袋,測得其重量為(單位:克);49.8,51,50.5,49.5,49.2,50.2,51.2,50.3,49.7, 50.6若每袋重量服從正態分布,每袋重量是否符合要求。(=0.05, t.0252.2622 )3、某10戶家庭樣本具有下列收入和食品支出(元 /天)數據:收入x203032
17、40455356586574支出y79811121413151716試求出以最小二乘法計算的回歸方程,并預測當x=5時y的值。題庫4一、單項選擇題(每題 2分,共20分)1、 .人口普查的調查單位是()。A .全部人口B.每個人C. 全部人口數D.每戶家庭;2、將由顯著性水平所規定的拒絕域平分為兩部分,置于概率分布的兩邊,每邊占顯著性水 平的二分之一,這是()。A.、單側檢驗B、雙側檢驗C右單側檢驗D、左單側檢驗3、產品質量的檢查應該采用()。A、重點調查的方法;B、典型調查的方法;C普查的方法;D、抽樣檢驗的方法;4某組向上累計次數表示()A、大于該組上限的次數有多少;B、大于該組下限的次數
18、有多少;C小于該組上限的次數有多少;1 越大,則置信上限與D、小于該組下限的次數有多少;5、對正態總體均值進行區間估計時,其它條件不變,置信水平置信下限的差()A、越大B、越小C、不變D、不確定6、在其它條件不變的情況下,如果允許抽樣平均誤差比原來擴大2倍,則樣本容量(A.擴大為原來的4倍C縮小為原來的二分之一B.擴大為原來的2倍D.縮小為原來的四分之一7、某年某地區甲乙兩類職工的月平均收入分別為1060元和3350元,標準差分別為 230元680則職工月平均收入的離散程度( )B、乙類較大D、不確定A、甲類較大C兩類相同&所謂顯著水平是指()A、原假設為真時將其接受的概率;B、原假設不真時將
19、其舍棄的概率;C原假設為真時將其舍棄的概率;D、原假設不真時將其接受的概率;9、在一兀線性回歸方程 y a bx中,b表示()A、當當x增加一個單位時,y增加a的數量;B、當1 y增加一個單位時,x增加b的數量;C當1 x增加一個單位時,y的平均增加量;D、當當y增加一個單位時,x的平均增加量10 在其他條件相同的前提下:不重復抽樣誤差()A、大于重復抽樣誤差B小于重復抽樣誤差C等于重復抽樣誤差D、與重復抽樣誤差何者更大無法判定、多項選擇題(每題2分,共10分)1頻率是()A概率B各組次數C非負數D自然數 E各組的次數占總體單位數的比重2.下列的表述正確的有()A. 總體是唯一確定的,樣本是隨
20、機的B. 總體指標是確定不變的C. 抽樣指標是樣本量的函數D. 抽樣指標也是隨機變量E. 抽樣指標是確定不變的3若一組數據的偏度系數是-0.25,則下列說法正確的有()A平均數、中位數與眾數是分離的B眾數在左邊、平均數在右邊C數據的極端值在右邊,數據分配曲線向右延伸D眾數在右邊、平均數在左邊E數據的極端值在左邊、數據分配曲線向左延伸4. 進行方差分析需要滿足的假設條件有()A每次試驗都是獨立進行B各樣本都來自正態總體C各總體的方差相等D各樣本的樣本量相等E各總體分布相互獨立5. 人的血壓與體重之間存在一定的相關關系,這種相關屬于()A正相關B單相關C負相關D復相關E完全相關三、填空題(每空 2
21、分,共20分)1、 統計調查按調查對象包括的范圍不同可分為 與。2、 測定峰度系數3= 3時,次數分布曲線為 ;為3 3時,為曲線。3、 當時,加權算術平均數等于簡單算術平均數。4、總體方差越大,抽樣誤差就;總體方差越小,抽樣誤差5、當變量數列中算術平均數大于眾數時,這種變量數列的分布呈 分布;反之,算術平均數小于眾數時,變量數列的分布呈 分布。四、簡答題(每題 5分,共20分)1、什么是統計學?怎樣理解統計學與統計數據的關系?2、如何對任意兩個總體平均數的代表性進行比較?3、影響抽樣誤差的因素有哪些?4、什么是假設檢驗的 P值?如何根據 P值來作出假設檢驗的結論?五、計算題(每題10分,共3
22、0分)要求:根據表中資料計1、隨機抽查某企業 100名職工,其月工資資料如下表 月工資額(百元)n職工數(人)5 84算職工月工資的平均數、標8 1010準差和離散系數。10128012 14314183合計1002、從500名初中生中隨機抽出100名測量身高,通過計算得樣本身高平均值 X為1.65米, 樣本標準差s為0.073,在概率為95.45%的保證程度下,對這些初中生的身高作出區間估計。(0( 2) =0.9545 )3、對9位青少年的身高y與體重x進行觀測,并已得出以下數據 :y 13.54 y222.9788 x 472x228158 xy 803.02要求:以身高為因變量,體重為
23、自變量,建立線性回歸方程。題庫5一、單項選擇題(每題 2分,共20分)1. 統計學的方法分為()A描述統計學與理論統計學B理論統計學與推斷統計學C理論統計學與應用統計學D描述統計學與推斷統計學2. 某蕊片廠為了掌握該廠的產品質量,擬進行一次質量大檢查,這種檢查應選擇 ( )A統計報表 B重點調查 C全面調查 D抽樣調查3. 下列分組中按品質標志分組的是()A 人口按年齡分組B產品按質量優劣分組C企業按固定資產原值分組D鄉鎮按工業產值分組4. 在分組時,若有某個數據的值正好等于相鄰組的下限時,一般應將其歸在( )A 上限所在組B 下限所在組C任意一組均可D另設新組5. 方差是數據中各變量值與其算
24、術平均的()B離差平方的平均數D 離差平均數的絕對值A離差絕對值的平均數C離差平均數的平方6. 一組數據的偏態系數為-1.3,表明該組數據的分布是()A正態分布B平頂分布C左偏分布D右偏分布7.原假設為假,我們卻不拒絕它的概率為()A1-BC 1 D8. 在簡單隨機重復抽樣條件下,若要求抽樣誤差為原來的1/2,則樣本容量()A擴大為原來的5倍B擴大為原來的2倍C擴大為原來的4倍D擴大為原來的2.5倍9.假設檢驗和區間估計之間的關系,卜列說法止確的是()A雖然概念不同,但實質相同B兩者兀全沒有關系C互相對應關系D不能從數量上討論它們之間的對應關系10當相關系數r=0時,表明()A現象之間完全相關
25、B相關程度較小C現象之間完全相關D無直線相關關系、多項選擇題(每題 2分,共10分)1.不屬于詢問調查法有()A訪問調查B郵寄調查C電話調查D實驗法E觀察法2.非全面調查是指()A普查B全面統計報表C重點調查D典型調查E抽樣調查3.變量數列中頻率應滿足的條件是()A各組頻率大于1B各組頻率大于0C各組頻率之和等于 1D各組頻率之和小于1E各組頻率之和大于 14.在500位同學中,抽取100名同學進行調查,下列各項正確的是()A樣本單位數是1000個B樣本個數是100個C 一個樣本有100個單位D樣本容量是100個E是一個大樣本5. 下列哪些變量之間的關系為函數關系()A家庭收入與消費支出關系B
26、圓的面積與它的半徑關系C廣告支出與商品銷售額關系D單位產品成本與利潤關系E在價格固定情況下,銷售量與商品銷售額關系三、填空題(每空 2分,共20分)1、 統計數據大體上可分為 與兩種類型。2、 數據的計量尺度由低級到高級可以分為、 、和。3、 當滿足 條件,加權算術平均數等于簡單算術平均數。4、參數點估計的方法有與。5、相關系數的取值范圍是 。四、簡答題(每題 5分,共20分)1、簡述平均數、眾數、中位數三者的特點與應用場合?2、什么是隨機原則?在抽樣調查中為什么要遵循隨機原則?3、什么是離散系數?它的計算有什么意義?4、什么是假設檢驗的 P值?如何根據 P值來作出假設檢驗的結論?五、計算題(
27、每題10分,共30分)1根據下表數據,計算 10名工人日加工零件數均值、標準差。按零件數分組人數01021020520303合計102、 根據過去大量資料,西安市每天每個家庭看電視的時間服從正態分布N(4,1 )。現從西安市家庭中隨機抽取 16戶,測得平均每天每戶家庭看電視時間為4.5小時。試在0.05的顯著性水平下判斷西安市家庭看電視的時間是否有顯著提高?( Z0.05匸645 )3、檢查5位同學統計學的學習時間與成績分布如下表:每周學習時數x4671013學習成績y4060507090試求出以最小二乘法計算的回歸方程,并預測當每周學習時數為8時,統計學成績。題庫6一、單項選擇題(每題 2分
28、,共20分)1、研究如何對現象的數量特征進行計量、觀察、概括和表述的理論和方法屬于A、應用統計學C、推斷統計學B、描述統計學D、理論統計學2、若各個標志值都擴大2倍,而頻數都減少為原來的1/3 ,則平均數A、擴大2倍B、減少到1/3C、不變 D、減少到1/23、 在處理快艇的6次試驗數據中,得到下列最大速度值:27、38、30、37、35、31.則最大艇速的均值的無偏估計值為( )A、32.5B 33C 39.6D、304、若兩個變量的平均水平接近,標準差越大的變量,其A、平均值的代表性越好B、離散程度越大C穩定性越高D、離散程度越小5、對正態總體均值進行區間估計時,其它條件不變,置信水平1
29、越小,則置信上限與置信下限的差()A、越大B、越小C、不變D、不確定6、 方差分析中的原假設是關于所研究因素( )A、各水平總體方差是否相等B、各水平的理論均值是否相等C同一水平內部數量差異是否相等D、同一水平內部數值相等7、某年某地區甲乙兩類職工的月平均收入分別為1060元和3350元,標準差分別為 230 元和 680 元,則職工月平均收入的離散程度( )A、甲類較大B、乙類較大C兩類相同D、不確定在假設檢驗中,500, H1 :500,則此檢驗是( )A、左側檢驗C雙側檢驗9、某專家小組成員的年齡分別為( )A、 45B、 40B、右側檢驗D、不知道29,45,35,43,45,58,他
30、們年齡的中位數為C、44D、4310、某次考試學生的考試成績X近似服從正態分布,X N 78,64,則可認為有大約95.45% 的學生考試成績分布的范圍是C (62,94)D、(70,90)、多項選擇題(每題 2分,共10分)1.估計量的評價標準是()A無偏性B有效性C一致性D客觀性 E及時性2.下列哪些屬于全面調查()A、 (70, 80)B、(70, 86)A普查 B全面統計報表C重點調查D典型調查E抽樣調查3. 下列關于變量數列中頻率的說明不正確的是()A各組頻率大于1B各組頻率大于0C各組頻率之和等于1D各組頻率之和小于1E各組頻率之和大于14. 總體平均數的假設檢驗方法通常有()2A
31、 Z檢驗法 B t檢驗法 C 檢驗法D F檢驗法 E幾何檢驗法5收入與消費存在一定的相關關系,這種相關屬于()A正相關B單相關C負相關D復相關E完全相關、填空題(每空 2分,共20 分)2、加權算術平均數受兩個因素的影響,一個是個是1、統計詞有三種涵義,即、與3、 在假設檢驗中,把符合H的總體判為不符合 H加以拒絕,這類錯誤稱為錯誤;把不符合 H的總體當作符合 H而接受,這類錯誤稱為 錯誤;顯著性水平 是用來控制犯第類錯誤的概率。4、 直線相關系數等于零,說明兩變量之間 ;直線相關系數等于-1,說明兩變量之間 。四、簡答題(每題 5分,共20分)1、統計學的確對我們的生活的各個方面起著重要的作
32、用,但如果有意或者無意地誤用統計學方法,其結論則會帶來更大的欺騙性。為了避免這種情況的發生,請根據你的了解,寫出1個誤用統計學方法的例子,并說明應該如何正確應用方法?2、隨機抽樣的含義與特點?3、什么是標準差系數?在什么場合下計算標準差系數?4、說明單因素方差分析中,總離差平方和、水平項離差平方和、誤差項離差平方和的含義 與三者的關系? 五、計算題(每題10分,共30分)1、隨機抽查某企業100名職工,其月工資資料如下表月工資額(百元)職工數(人)要求:根據表中資料計5 84算職工月工資的平均數、標8 1010準差和離散系數。10-128012 14314183合計1002、 某快餐店對顧客的
33、平均花費進行抽樣調查,隨機抽取了 49名顧客構成一個簡單隨機樣本,調查結果為:樣本平均花費為12.6元,標準差為2.8元。試以95.45%的置信水平估計該快餐店顧客的總體平均花費數額的置信區間;(0( 2) =0.9545 )3、 從某一行業中隨機抽取5家企業,所得產品產量與生產費用的數據如下:產品產量(臺)Xi4050507080生產費用(萬元)130140145150156yi要求:利用最小二乘法求出估計的回歸方程。附:X 58y 144.25 217900 “ Xii 15 2i1yi 1043615Xii 1y 42430題庫一答案一、選擇題(每題2分,共20分)1. B 2.C3.D
34、4.D5.A6.D 7A 8.B9.D10.C二、多項選擇題(每題2分,共10分)1. ABCE 2.ACE3.ADE4.AB5.ADE三、填空題(每空2分,共20分)1. 分組標志、組矩2. 4 元、0.013. 參數估計、假設檢驗4. 棄真錯誤、納偽錯誤5. -1,1四、簡答題(每題5分,共20分)1.答:(1 )眾數是一組數據分布的峰值,是一種位置代表值。其優點是不受極端值影響。其缺點是具有不唯一性。(1分)(2)中位數是一組數據中間位置上的代表值,也是位置代表值,其特點是不受數據極端值的影響。(1分)(3)均值是就全部數據計算的,它具有優良的數學性質,是實際中應用最廣泛的集中趨勢測度值
35、。其主要缺點是易受數據極端值的影響。(1分)應用場合:當數據呈對稱分布或接近對稱分布時,三個代表值相等或接近相等,這時應選擇均值作為集中趨勢的代表值;當數據為偏態分布,特別是當偏斜的程度較大時,應選擇眾數或中位數等位置代表值,這時它們的代表性要比均值好。此外,均值只適用于定距或定比尺度的數據,而對于定類和定比尺度的數據則無法計算均值,但卻可以計算眾數和中位數。(2分)2. 答:拒絕原假設的最小的顯著性水平,被稱為觀察到的顯著性水平(2分)。p值檢驗:若p,不能拒絕H。;若p,拒絕H。(3分)。3.3.答:標準差是反映數據分散程度的絕對值,其數值的大小一方面取決于原變量值本身水 平高低的影響,也
36、就是與變量的均值大小有關。(2 分)。因此,對于平均水平不同或計量單位不同的不同組別的變量值,是不能直接用上述離散程度的測度值直接進行比較的。為了消除變量值水平高低和計量單位不同對離散程度測度值 的影響,而需要計算標準差系數(3分)。4、答:方差分析的步驟:首先,計算出總離差平方和(SST)誤差項離差平方和(SSE)水平項離差平方和(SSA。SST反映全部數據總的誤差程度;SSE反映隨機誤差的大小;SSA反映隨機誤差和系統誤差的大小,三者之間的關系:SST= SSA SSE第二,計算SSE的均方MSE,SSA的均方MSA。將MSA和MSE進行對比,即得到所需要的F檢驗統計量。第三,將統計量的值
37、F與給定的顯著性水平 a的臨界值Fa進行比較,作出對原假設H0的決策。五、計算題(每題10分,共30分)1.解:(全對,給10分,錯一空扣1分)考分人數比率向上累計向下累計人數(人)比率(%)人數(人)比率(%)60以下25.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090以上820.040100.0820.0合計40100.0一一一一檢驗統計量ZX U/、:n4.5_41/ .162 (3 分)2.解:根據題意:提出假設:H:u 4,Hi:u 4 (2 分)由=0.05,查表臨界
38、值Z Z0.o51.645由于Z= 2Z =1.645,所以應拒絕Ho而接受Hi,即北京市家庭每天上網的時間LL1Y/n 巴 X/n Y空 口 0 (4 分)100 100確有顯著提高。(5分)3.解:* “ X丫2X【WO 3 10 爭 2 (4 分)n X2 ( X)2100 1.5 102樣本回歸方程:* 2X (2分)題庫二答案一、選擇題(每題2分,共20分)1. C 2.D3.D4.A5.D6.B 7B 8.B9.B10.A二、多項選擇題(每題2分,共10分)1. ABCD2.ABD3.ADE4.AB5.ADE三、填空題(每空2分,共20分)1. 統計設計、統計調查、統計整理、統計分
39、析2. 右偏、左偏3. 無偏性、有效性、一致性4. 線性相關四、簡答題(每題5分,共20分)1.答:離中趨勢的常用指標包括:全距、平均差、標準差與標準差系數(2分)。(1)全距:計算簡單、但容易受極端數值的影響,不能全面反映所有標志值的差異及分布狀況, 準確度 差(2分)。(2)平均差:不易受極端數值的影響,能綜合反映全部單位標志值的實際差異程度;缺點:用絕對值的形式消除各標志值與算術平均數離差的正負值問題,不便于作數學 處理和參與統計分析運算(2分)。(3)標準差:不易受極端數值的影響,能綜合反映全部 單位標志值的實際差異程度;用平方的方法消除各標志值與算術平均數離差的正負值問題, 可方便地
40、用于數學處理和統計分析運算(2分)。(4)離散系數:用來對比不同水平的同類現象,特別是不同類現象總體平均數代表性的大小(2分)。2答:總體各單位的差異程度(即標準差的大小),總體各單位的差異程度越大,抽樣誤差越大(4分);樣本單位數的多少,樣本單位數越大,抽樣誤差越小(2分);抽樣方法:不重復抽樣的抽樣誤差比重復抽樣的抽樣誤差小(2分);抽樣組織方式:簡單隨機抽樣的誤差最大(2分)。3答:相關分析,就是用一個指標來表明現象相互依存關系的密切程度。回歸分析,就是根 據相關關系的具體形態, 選擇一個合適的數學模型, 來近似地表達變量間的平均變化關系(2分)。(1)兩者有密切的聯系。它們不僅有共同的
41、研究對象,而且在具體應用時,必須互相補充。相關分析需要依靠回歸分析來表明現象數量相關的具體形式,而回歸分析則需要依靠相關分析來表明現象數量變化的相關程度(4分)。(2)相關分析與回歸分析在研究目的和方法上是有明顯區別的。相關分析研究變量之間相關的方向和相關的程度。 但是相關分析不能指出變量間相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況。回歸分析則是研究變量之間相互關系的具體形式,確定一個相關的數學方程式,根據這個數學方程式從已知變量推測未知量,從而為估算和預測提供了一個重要的方法(4分)。4、答:基本步驟:1提出原假設和備擇假設 (2分)2確定適當的檢驗統計量 (2分)
42、3規定顯著性水平 a,確定臨界值(2分)4計算檢驗統計量的值 (2分)5作出統計決策(2分)五、計算題(每題10分,共30分)1解:(1)乙班的平均分數:x乙xf37505075 (5 分)乙班平均分數的標準差:22 彳警 9.79乙班平均分數的標準差系數:9797513,05% (3 分)(2 )比較哪個班的平均分數更有代表性:9 9因為甲 9912.22%小于81所以甲班的平均分數更有代表性(9.79752分)。13.05%2解:已知:P(1 P) 0,020.98 , p4%。(5 分)1 = 95.45%即 Z/2必要的抽樣數目:nz2/2P(1 P)22 0.020.980.0424
43、9 (件)(5 分)3解:卩2n XY X Yn X2 ( X)2100 3 10 20100 1.5 102片Y/n 也 X/n Y 巴X202 100100100樣本回歸方程:屮2X (6分)將有關數據代入回歸方程,得:*2X2 0.51 (億元)置信度為95.45%的利潤額的預測區間可為:1 2 0.05 Y 1 2 0.05,即 0.9(元)Y 1.1(元)(4分)題庫三答案一、選擇題(每題2分,共20分)1. B2.A3.D4.A5.A6.A7.D8.B9.B10.A二、多項選擇題(每題2分,共10分)1. ABC2. BDE3.CE 4.ACDE5.ACD三、填空題(每空2分,共2
44、0分)1. 描述統計推斷統計 學2. 等距式分組、異距式分組3. 矩形4. 標準差、均值5. 總體均值、總體比例、總體方差四、簡答題(每題5分,共20分)1答:完整的統計調查方案包括:(1)確定調查目的,即為什么調查(2分);(2)確定調查對象和調查單位,即向誰調查(2分);(3)確定調查項目和調查表,即調查什么(2分);(4)其他內容,包括調查的時間與組織安排等(4分)。2答:數據的計量尺度由低級到高級、由粗略到精確分為四個層次,即定類尺度、定序尺度、定距尺度和定比尺度。定類尺度,是最粗略、計量層次最低的計量尺度,它是按照事物的某種屬性對其進行平行的分類或分組。各類別之間是平等的并列關系,無
45、法區分優劣或大小。(1分)定序尺度,它是對事物之間等級差或順序差別的一種測度。該尺度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優劣或順序。該尺度的計量結果只能比較大小,不能進行加、減、乘、除數學運算。(1分)定距尺度,它不僅能將事物區分為不同類型并進行排序,而且可以準確地指出類別之間的差距是多少。該尺度的計量結果表現為數值,并可以計算差值,因而,其結果可以進行加減運算。定距尺度沒有一個絕對零點,不能進行乘、除運算。(1分)定比尺度,與定距尺度屬于同一層次,其計量的結果也表示為數值。由于有絕對的零點, 可以進行加、減、乘、除運算。(1分)上述四種計量尺度對事物的計量層次是由低級到高級
46、、由粗略到精確逐步遞進的。高層次的計量尺度可以計量低層次計量尺度能夠計量的事物,但不能反過來。(1分)3答:標準差是反映數據分散程度的絕對值,其數值的大小一方面取決于原變量值本身水平高低的影響,也就是與變量的均值大小有關。變量值絕對水平越高, 離散程度的測度值自然也就大,絕對水平越低,離散程度的測度值自然也就小;另一方面,它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。(2分)標準差系數是標準差與均值的比較,是一個無量綱的相對數, 用于反映與比較數據的離散程度。(1分)因此,對于平均水平不同或計量單位不同的不同組別的變量值,是不能直接用上述離散程度的測度
47、值直接進行比較的。為了消除變量值水平高低和計量單位不同對離散程度測度值 的影響,而需要計算標準差系數。(2分)4、答:必要抽樣數目受以下因素影響:2(1)總體方差。其他條件不變的條件下,總體單位的差異程度大,則應多抽,反之可少抽一些(1分)。(2) 允許誤差范圍乂或p。允許誤差增大,意味著推斷的精度要求降低,在其他條件不變的情況下,必要的抽樣數目可減少;反之,縮小允許誤差,就要增加必要的抽樣數目(1 分)。(3)置信度(1-)。在其他條件不變的情況下,要提高推斷的置信程度,就必須增 加抽樣數目(1分)。(4) 抽樣方法。相同條件下,采用重復抽樣應比不重復抽樣多抽一些樣本單位(1分)。(5)抽樣
48、組織方式。由于不同抽樣組織方式有不同的抽樣誤差,在誤差要求相同的情況下,不同抽樣組織方式所必需的抽樣數目也不同(1分)。五、計算題(每題10分,共30分)1解:1.解:品種價格(元/斤)甲市場乙市場成交額(m)成交量(m/x)成交量(f)成交額(xf)甲1.21.2122.4乙1.42.8211.4丙1.51.5111.5合計一5.5445.3甲市場平均價格x -mmx5.541.375(元)(3分)乙市場平均價格x -xf5.31.325(元)(3分)f4說明:兩個市場銷售單價是相同的, 銷售總量也是相同的, 影響兩個市場平均價格高低不同 的原因就在于各種價格的農產品在兩個市場的成交量不同。
49、甲市場銷售價格較高的乙產品最多,而乙市場銷售價格最低的甲產品最多,因而使得甲市場的平均價格高于乙市場。這就是權數在平均數形成中所起的權衡輕重的作用(4分)。2解:根據題意:提出假設:H:u 50, Hi:u 50檢驗統計量 t x_u_ 50.2_50 0.9733S/你 0.65M/10由=0.05,查表臨界值 t /2 t0.025 2.2622由于t = 0.9733t /2=2.2622,所以不應拒絕 H。,即每袋重量符合要求。3解:bn xy2n xx yTX10 6275473 122210 249594730.195 (4 分)ay bx12.2 0.915 47.32.9765(4 分)yca bx12.97560.195x當x5時ya bx 2.97560.195 53.95元(2 分)題庫四答案、選擇題(每題2分,共20 分)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 付費會員特色活動方案
- 仙桃拍照活動方案
- 代發薪單位活動方案
- 代表先行活動方案
- 代賬公司轉介紹活動方案
- 以往節日促銷活動方案
- 企業中秋晚會活動方案
- 企業下沉活動方案
- 企業公司團建策劃方案
- 企業減重達人活動方案
- 人工智能在數據治理中的應用-洞察闡釋
- 古代武舉考試試題及答案
- 《社會保險政策解讀》課件
- 兒童言語康復試題及答案
- 2025-2030中國藍莓市場銷售策略分析與發展前景研究研究報告
- 廣東省深圳市龍華區2024年中考道德與法治二模試卷(含答案)
- 人才梯隊建設的重要性計劃
- 行吊操作安全培訓
- 第三代半導體材料的應用現狀與未來展望
- 2025年云南祿勸國有資本投資開發集團有限公司招聘筆試參考題庫附帶答案詳解
- GB/T 6433-2025飼料中粗脂肪的測定
評論
0/150
提交評論