統計學題庫及題庫答案-2022年整理_第1頁
統計學題庫及題庫答案-2022年整理_第2頁
統計學題庫及題庫答案-2022年整理_第3頁
統計學題庫及題庫答案-2022年整理_第4頁
統計學題庫及題庫答案-2022年整理_第5頁
已閱讀5頁,還剩37頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、42/42 統計學題庫及題庫答案題庫1一、單項選擇題(每題2分,共20分)1、調查時間是指( )A、調查資料所屬的時間 B、進行調查的時間 C、調查工作的期限 D、調查資料報送的時間 2、對某城市工業企業未安裝設備進行普查,總體單位是( )。 A、工業企業全部未安裝設備 B、企業每一臺未安裝設備 C、每個工業企業的未安裝設備 D、每一個工業企業 3、對比分析不同性質的變量數列之間的變異程度時,應使用( )。A、全距 B、平均差 C、標準差 D、變異系數4、在簡單隨機重復抽樣條件下,若要求允許誤差為原來的2/3,則樣本容量()A、擴大為原來的3倍B、擴大為原來的2/3倍C、擴大為原來的4/9倍D

2、、擴大為原來的2.25倍5、某地區組織職工家庭生活抽樣調查,已知職工家庭平均每月每人生活費收入的標準差為12元,要求抽樣調查的可靠程度為0.9545,極限誤差為1元,在簡單重復抽樣條件下,應抽選( )。A、576戶 B、144戶 C、100戶 D、288戶6、當一組數據屬于左偏分布時,則()A、平均數、中位數與眾數是合而為一的B、眾數在左邊、平均數在右邊C、眾數的數值較小,平均數的數值較大D、眾數在右邊、平均數在左邊7、某連續變量數列,其末組組限為500以上,又知其鄰組組中值為480,則末組的組中值為( )。 A、520 B、 510 C、 500 D、4908、用組中值代表組內變量值的一般水

3、平有一定的假定性,即( )A、各組的次數必須相等B、變量值在本組內的分布是均勻的C、組中值能取整數D、各組必須是封閉組9、是來自總體的樣本,樣本均值服從( )分布A、 B.、 C.、 D、10、測定變量之間相關密切程度的指標是( ) A、估計標準誤 B、兩個變量的協方差 C、相關系數 D、兩個變量的標準差 二、多項選擇題(每題2分,共10分)1、抽樣推斷中,樣本容量的多少取決于( )。 A、總體標準差的大小 B、允許誤差的大小 C、抽樣估計的把握程度 D、總體參數的大小 E、抽樣組織形式 2、抽樣估計中的抽樣誤差( )。 A、是不可避免要產生的 B、是可能通過改進調查方式來消除的 C、是可以事

4、先計算出來的 D、只能在調查結束后才能計算的 E、其大小是可能控制的 3、在什么條件下,加權算術平均數等于簡單算術平均數( )。A、各組次數相等 B、各組變量值不等 C、變量數列為組距數列 D、各組次數都為1 E、各組次數占總次數的比重相等4、總體平均數的假設檢驗方法通常有()A、Z檢驗法B、t檢驗法C、檢驗法D、F檢驗法E、幾何檢驗法5、指出下列分組哪些是屬性分組()A、人口按性別分組B、企業按產值多少分組C、家庭收入水平分組D、在業人員按文化程度分組E、產品按質量等級分組三、填空題(每空2分,共20分)1、統計分組的關鍵問題是正確選擇 與劃分 。2、對某村6戶居民家庭共30人進行調查,所得

5、的結果是,人均收入400元,其離差平方和為480,則標準差是 ,標準差系數是 。3、抽樣推斷的主要內容有 和 兩個方面。4、假設檢驗中的兩類錯誤分別稱為 和 。5、相關系數r的取值范圍是 到 。四、簡答題(每題5分,共20分)1、眾數、中位數、均值的特點與應用場合是什么?2、什么是假設檢驗的P值?如何根據P值作出假設檢驗的結論?3、為什么要計算標準差系數? 4、單因素方差分析的步驟是什么?五、計算題(每題10分,共30分)1、某班學生統計學原理考試成績次數分布如下:要求:根據上表資料,計算相應的的數字,填入表中空格。2、根據有關調查,北京市每天每個家庭上網的時間服從正態分布。現從北京市家庭中隨

6、機抽取16戶,測得平均每天每戶家庭上網時間為4.5小時。試在0.05的顯著性水平下判斷北京市家庭上網的時間是否有顯著提高?()3、從100家自選商場銷售額資料(x,億元)和利潤額(y,億元)資料計算得知:n=100,X=10,Y=20,X2=1.5,Y2=50,XY=3。根據以上數據,求出利潤額對銷售額的直線回歸方程。題庫2一、單項選擇題(每題2分,共20分)1、統計學自身的發展,沿著兩個不同的方向,形成()A、描述統計學與理論統計學B、理論統計學與推斷統計學C、理論統計學與應用統計學D、描述統計學與推斷統計學2、某地區為了掌握地區水泥生產的質量情況,擬對占該地區水泥總產量的80%的五個大型水

7、泥廠的生產情況進行調查,這種調查方式是()A普查B典型調查C抽樣調查D重點調查3、用組中值與次數求坐標點連接而成的統計圖是()A直方圖B條形圖C曲線圖D折線圖4、離中趨勢指標中,最容易受極端值影響的是()A極差B平均差C標準差D標準差系數5、一組數據的偏態系數為1.3,表明該組數據的分布是()A正態分布B平頂分布C左偏分布D右偏分布6、抽樣平均誤差說明抽樣指標與總體指標之間的()A實際誤差B平均誤差C實際誤差的平方D允許誤差7、假設檢驗是檢驗()的假設是否成立。 A樣本方差B總體指標C樣本方差D樣本平均數8、用組中值代表組內變量值的一般水平有一定的假定性,即( )A、各組的次數必須相等B、變量

8、值在本組內的分布是均勻的C、組中值能取整數D、各組必須是封閉組9、總體平均數的假設檢驗方法,在小樣本,且方差未知時,通常采用()A、Z檢驗法B、t檢驗法C、檢驗法D、F檢驗法10、年勞動生產率x(千元)和工人工資y=10+70 x,這意味著年勞動生產率每提高1千元時,工人工資平均()A、增加70元B、減少70元C、增加80元D、減少80元 二、多項選擇題(每題2分,共10分)1、概率抽樣調查 ( )A、是一種非全面調查B、 其目的是根據抽樣結果推斷總體數量特征C、它具有經濟性、時效性、準確性和靈活性等特點D、其調查單位是隨機抽取的 E、抽樣推斷的結果往往缺乏可靠性2、常用的樣本指標有( )A樣

9、本平均數B樣本成數C抽樣誤差D樣本方差E標準差3、在什么條件下,加權算術平均數等于簡單算術平均數( )。A、各組次數相等 B、各組變量值不等 C、變量數列為組距數列 D、各組次數都為1 E、各組次數占總次數的比重相等4、總體平均數的假設檢驗方法通常有( )A、Z檢驗法B、t檢驗法C、檢驗法D、F檢驗法E、幾何檢驗法5、中位數是( )A由標志值在變量數列中所處的位置決定的B根據標志值出現的次數決定的C總體單位水平的平均值D總體一般水平的代表值E不受總體中極端數值的影響三、填空題(每空2分,共20分)1、一個完整的統計工作過程可以劃分為、四個階段。2、當變量數列中算術平均數大于眾數時,這種變量數列

10、的分布呈分布;反之,算術平均數小于眾數時,變量數列的分布呈分布。3、評價點估計量好壞的標準有、和。4、相關系數,用于反映條件下,兩變量相關關系的密切程度和方向的統計指標。四、簡答題(每題5分,共20分)1、離中趨勢的指標有哪些(至少列出三個),它們之間有何區別?2、影響抽樣誤差的因素有哪些?3、相關分析和回歸分析的聯系與區別?4、假設檢驗一般有哪些步驟?五、計算題(每題10分,共30分)1、某班級分甲、乙兩個學習小組,在統計學考試中,甲小組平均成績75分,標準差11.5,乙小組成績資料如表:成績(分)人數(人)60以下60-7070-8080-9090以上25864合計25(1)計算乙小組的平

11、均成績。(2)以盡可能精確的方法比較兩小組平均成績的代表性。2、根據歷史的統計,某種產品的次品率為2%。如果要求置信水平為95.45%的置信區間,并要求允許誤差不超過4%,應抽取多大的樣本?()3、從100家自選商場銷售額資料(x,億元)和利潤額(y,億元)資料計算得知:n=100,X=10,Y=20,X2=1.5,Y2=50,XY=3。根據以上數據,(1)求出利潤額對銷售額的直線回歸方程;(2)預測當銷售額為0.5億元時,利潤額在置信度為95.45%的預測區間(已知預測標準誤差為0.05億元)。題庫3一、單項選擇題(每題2分,共20分) 1.某地進行私營商業企業經營情況調查,則調查對象是(

12、)A該地所有商業企業B該地所有私營商業企業C該地每一私營商業企業D該地每一商業企業2. 統計分組的關鍵問題是( )A確定分組標志和劃分各組界限B確定組距和組數C確定組距和組中值D確定全距和組距3用組中值與次數求坐標點連接而成的統計圖是( )A直方圖B條形圖C曲線圖D折線圖4. 離中趨勢指標中,最容易受極端值影響的是( )A極差B平均差C標準差D標準差系數5. 所謂大樣本是指樣本單位數在( )及以上。A30個B50個C80個D100個 6. 抽樣指標與總體指標之間抽樣誤差的可能范圍是( )A抽樣平均誤差 B抽樣極限誤差C區間估計范圍 D置信區間7. 原假設為真,我們卻拒絕它的概率為( )A1BC

13、1D8. 假設檢驗是檢驗( )的假設是否成立。A樣本方差B總體指標C樣本方差D樣本平均數9. 下面的函數關系是( )A銷售人員測驗成績與銷售額大小的關系B圓周的長度決定于它的半徑C家庭的收入和消費的關系D數學成績與統計學成績的關系10. 年勞動生產率x(千元)和工人工資(元)y=30+70 x,這意味著年勞動生產率每提高1千元時,工人工資平均( )A增加70元B減少70元C增加100元D減少100元 二、多項選擇題(每題2分,共10分)1.詢問調查法有以下幾種( )A訪問調查B郵寄調查C電話調查D實驗法E觀察法2.某單位100名職工按工資額分為300以下、300-400、400-600、600

14、-800、800以上等五個組。這一分組( )A是等距分組B是異距分組C末組組中值為800D相鄰的組限是重疊的E某職工工資600元,應計在600-800元組內3.在各種平均數中,不受極端值影響的平均數是( )A算術平均數 B調和平均數C中位數 D幾何平均數E眾數4.在總體1000個單位中,抽取20個單位進行調查,下列各項正確的是( )A樣本單位數是20個B樣本個數是20個C一個樣本有20個單位D樣本容量是20個E是一個小樣本5.下列哪些變量之間的關系為相關關系( )A家庭收入與消費支出關系B 圓的面積與它的半徑關系C廣告支出與商品銷售額關系D單位產品成本與利潤關系E在價格固定情況下,銷售量與商品

15、銷售額關系三、填空題(每空2分,共20分)1、統計學按方法的構成可以分_與_。2、組距式變量數列,根據各組的組距是否相等可以分為_和_。3、直方圖是用_的寬度和高度來表示頻數分布的圖形。4、標準差系數是_與_之比。5、常用的總體指標有_、_、_。四、簡答題(每題5分,共20分)1、統計調查方案包括有哪幾個方面的內容?2、數據的計量尺度分幾類?它們之間有什么區別與聯系?3、標準差與標準差系數各是什么含義?衡量數據的離散程度時,如何選擇?4、必要的抽樣數目受哪些因素的影響?五、計算題(每題10分,共30分)2006年某月份甲、乙兩農貿市場某農產品價格和成交額、成交量資料如下:品種價格(元/斤)甲市

16、場成交額(萬元)乙市場成交量(萬斤)甲1.21.22乙1.42.81丙1.51.51合計5.54試問哪一個市場農產品的平均價格高?并說明理由。2、某食品廠用自動裝袋機包裝食品,每袋標準重量為50克,每隔一定時間抽取包裝袋進行檢驗。現抽取10袋,測得其重量為(單位:克);49.8,51,50.5,49.5,49.2,50.2,51.2,50.3,49.7,50.6若每袋重量服從正態分布,每袋重量是否符合要求。(0.05,)3、某10戶家庭樣本具有下列收入和食品支出(元/天)數據:收入x20303240455356586574支出y79811121413151716試求出以最小二乘法計算的回歸方程

17、,并預測當x=5時y的值。題庫4一、單項選擇題(每題2分,共20分)1、人口普查的調查單位是( )。A .全部人口 B.每個人 C.全部人口數 D.每戶家庭;2、將由顯著性水平所規定的拒絕域平分為兩部分,置于概率分布的兩邊,每邊占顯著性水平的二分之一,這是()。A.、單側檢驗 B、雙側檢驗 C、右單側檢驗 D、左單側檢驗 3、產品質量的檢查應該采用( )。A、重點調查的方法; B、典型調查的方法;C、普查的方法; D、抽樣檢驗的方法;4某組向上累計次數表示( )A、大于該組上限的次數有多少;B、大于該組下限的次數有多少;C、小于該組上限的次數有多少;D、小于該組下限的次數有多少;5、對正態總體

18、均值進行區間估計時,其它條件不變,置信水平越大,則置信上限與置信下限的差( ) A、越大 B、越小 C、不變 D、不確定6、在其它條件不變的情況下,如果允許抽樣平均誤差比原來擴大2倍,則樣本容量( )。A.擴大為原來的4倍 B. 擴大為原來的2倍C.縮小為原來的二分之一 D. 縮小為原來的四分之一7、某年某地區甲乙兩類職工的月平均收入分別為1060元和3350元,標準差分別為230元和680元,則職工月平均收入的離散程度 ( )A、甲類較大 B、乙類較大 C、兩類相同 D、不確定8、所謂顯著水平是指 ( )A、原假設為真時將其接受的概率; B、原假設不真時將其舍棄的概率;C、原假設為真時將其舍

19、棄的概率;D、原假設不真時將其接受的概率;9、在一元線性回歸方程中,b表示( )A、當x增加一個單位時,y增加a的數量;B、當y增加一個單位時,x增加b的數量;C、當x增加一個單位時,y的平均增加量;D、當y增加一個單位時,x的平均增加量.10在其他條件相同的前提下:不重復抽樣誤差( )A、大于重復抽樣誤差 B、小于重復抽樣誤差C、等于重復抽樣誤差 D、與重復抽樣誤差何者更大無法判定二、多項選擇題(每題2分,共10分)1.頻率是( )A概率B各組次數C非負數D自然數E各組的次數占總體單位數的比重2. 下列的表述正確的有( )A. 總體是唯一確定的,樣本是隨機的B. 總體指標是確定不變的C. 抽

20、樣指標是樣本量的函數D. 抽樣指標也是隨機變量E. 抽樣指標是確定不變的3.若一組數據的偏度系數是-0.25,則下列說法正確的有()A平均數、中位數與眾數是分離的B眾數在左邊、平均數在右邊C數據的極端值在右邊,數據分配曲線向右延伸D眾數在右邊、平均數在左邊E數據的極端值在左邊、數據分配曲線向左延伸4. 進行方差分析需要滿足的假設條件有( )A每次試驗都是獨立進行B各樣本都來自正態總體C 各總體的方差相等D各樣本的樣本量相等E各總體分布相互獨立5.人的血壓與體重之間存在一定的相關關系,這種相關屬于( )A正相關B 單相關C負相關D復相關E完全相關三、填空題(每空2分,共20分)1、統計調查按調查

21、對象包括的范圍不同可分為_與_。2、測定峰度系數3時,次數分布曲線為_;為3時,為_;3時,為_曲線。3、當_時,加權算術平均數等于簡單算術平均數。4、總體方差越大,抽樣誤差就_;總體方差越小,抽樣誤差_。5、當變量數列中算術平均數大于眾數時,這種變量數列的分布呈_分布;反之,算術平均數小于眾數時,變量數列的分布呈_分布。四、簡答題(每題5分,共20分)1、什么是統計學?怎樣理解統計學與統計數據的關系?2、如何對任意兩個總體平均數的代表性進行比較?3、影響抽樣誤差的因素有哪些?4、什么是假設檢驗的P值?如何根據P值來作出假設檢驗的結論?五、計算題(每題10分,共30分)1、隨機抽查某企業100

22、名職工,其月工資資料如下表 月工資額(百元)職工數(人)要求:根據表中資料計算職工月工資的平均數、標準差和離散系數。588101012121414184108033合計1002、從500名初中生中隨機抽出100名測量身高,通過計算得樣本身高平均值為1.65米,樣本標準差s為0.073,在概率為95.45%的保證程度下,對這些初中生的身高作出區間估計。(2)=0.9545)3、對9位青少年的身高y與體重x進行觀測,并已得出以下數據: , 要求:以身高為因變量,體重為自變量,建立線性回歸方程。題庫5一、單項選擇題(每題2分,共20分)1.統計學的方法分為( )A描述統計學與理論統計學B理論統計學與

23、推斷統計學C理論統計學與應用統計學D描述統計學與推斷統計學2.某蕊片廠為了掌握該廠的產品質量,擬進行一次質量大檢查,這種檢查應選擇( )A統計報表B重點調查C全面調查D抽樣調查3.下列分組中按品質標志分組的是( )A人口按年齡分組B產品按質量優劣分組C企業按固定資產原值分組D鄉鎮按工業產值分組4. 在分組時,若有某個數據的值正好等于相鄰組的下限時,一般應將其歸在( )A上限所在組B下限所在組C任意一組均可D另設新組5.方差是數據中各變量值與其算術平均的( )A離差絕對值的平均數B離差平方的平均數C離差平均數的平方D離差平均數的絕對值6. 一組數據的偏態系數為-1.3,表明該組數據的分布是( )

24、A正態分布B平頂分布C左偏分布D右偏分布7. 原假設為假,我們卻不拒絕它的概率為( )A1BC1D8.在簡單隨機重復抽樣條件下,若要求抽樣誤差為原來的1/2,則樣本容量( )A擴大為原來的5倍B擴大為原來的2倍C擴大為原來的4倍D擴大為原來的2.5倍9. 假設檢驗和區間估計之間的關系,下列說法正確的是( )A雖然概念不同,但實質相同B兩者完全沒有關系C互相對應關系D不能從數量上討論它們之間的對應關系10. 當相關系數r=0時,表明( )A現象之間完全相關B相關程度較小C現象之間完全相關D無直線相關關系二、多項選擇題(每題2分,共10分)1.不屬于詢問調查法有( )A訪問調查B郵寄調查C電話調查

25、D實驗法E觀察法2. 非全面調查是指()A普查B全面統計報表C重點調查D典型調查E抽樣調查3.變量數列中頻率應滿足的條件是( )A各組頻率大于1 B各組頻率大于0C各組頻率之和等于1 D各組頻率之和小于1E各組頻率之和大于14.在500位同學中,抽取100名同學進行調查,下列各項正確的是( )A樣本單位數是1000個B樣本個數是100個C一個樣本有100個單位D樣本容量是100個E是一個大樣本5.下列哪些變量之間的關系為函數關系( )A家庭收入與消費支出關系B 圓的面積與它的半徑關系C廣告支出與商品銷售額關系D單位產品成本與利潤關系E在價格固定情況下,銷售量與商品銷售額關系三、填空題(每空2分

26、,共20分)1、統計數據大體上可分為_與_兩種類型。2、數據的計量尺度由低級到高級可以分為_、_、_和_。3、當滿足_條件,加權算術平均數等于簡單算術平均數。4、參數點估計的方法有_與_。5、相關系數的取值范圍是_。四、簡答題(每題5分,共20分)1、簡述平均數、眾數、中位數三者的特點與應用場合?2、什么是隨機原則?在抽樣調查中為什么要遵循隨機原則?3、什么是離散系數?它的計算有什么意義?4、什么是假設檢驗的P值?如何根據P值來作出假設檢驗的結論?五、計算題(每題10分,共30分)1.根據下表數據,計算10名工人日加工零件數均值、標準差。按零件數分組人數01021020520303合計102、

27、根據過去大量資料,西安市每天每個家庭看電視的時間服從正態分布。現從西安市家庭中隨機抽取16戶,測得平均每天每戶家庭看電視時間為4.5小時。試在0.05的顯著性水平下判斷西安市家庭看電視的時間是否有顯著提高?()3、檢查5位同學統計學的學習時間與成績分布如下表:每周學習時數x4671013學習成績y4060507090試求出以最小二乘法計算的回歸方程,并預測當每周學習時數為8時,統計學成績。題庫6一、單項選擇題(每題2分,共20分)1、研究如何對現象的數量特征進行計量、觀察、概括和表述的理論和方法屬于( ) A、應用統計學 B、描述統計學 C、推斷統計學 D、理論統計學2、若各個標志值都擴大2倍

28、,而頻數都減少為原來的1/3,則平均數 ( )A、擴大2倍B、減少到1/3 C、不變 D、減少到1/23、在處理快艇的6次試驗數據中,得到下列最大速度值:27、38、30、37、35、31.則最大艇速的均值的無偏估計值為 ( ) A、32.5 B、33 C、39.6 D、304、若兩個變量的平均水平接近,標準差越大的變量,其 ( )A、平均值的代表性越好 B、離散程度越大 C、穩定性越高 D、離散程度越小5、對正態總體均值進行區間估計時,其它條件不變,置信水平越小,則置信上限與置信下限的差( ) A、越大 B、越小 C、不變 D、不確定6、方差分析中的原假設是關于所研究因素 ( )A、各水平總

29、體方差是否相等 B、各水平的理論均值是否相等C、同一水平內部數量差異是否相等D、同一水平內部數值相等7、某年某地區甲乙兩類職工的月平均收入分別為1060元和3350元,標準差分別為230元和680元,則職工月平均收入的離散程度 ( )A、甲類較大 B、乙類較大 C、兩類相同 D、不確定8、在假設檢驗中,若,則此檢驗是 ( )A、左側檢驗 B、右側檢驗 C、雙側檢驗 D、不知道9、某專家小組成員的年齡分別為29,45,35,43,45,58,他們年齡的中位數為 ( )A、45 B、40 C、44 D、4310、某次考試學生的考試成績近似服從正態分布,則可認為有大約95.45%的學生考試成績分布的

30、范圍是 ( )A、(70,80) B、(70,86) C、(62,94) D、(70,90)二、多項選擇題(每題2分,共10分)1.估計量的評價標準是( )A無偏性B有效性C一致性D客觀性E及時性2. 下列哪些屬于全面調查( )A普查B全面統計報表C重點調查D典型調查E抽樣調查3.下列關于變量數列中頻率的說明不正確的是( )A各組頻率大于1 B各組頻率大于0C各組頻率之和等于1 D各組頻率之和小于1E各組頻率之和大于14. 總體平均數的假設檢驗方法通常有( )AZ檢驗法Bt檢驗法C檢驗法DF檢驗法E幾何檢驗法5.收入與消費存在一定的相關關系,這種相關屬于( )A正相關B 單相關C負相關D復相關

31、E完全相關三、填空題(每空2分,共20分)1、統計詞有三種涵義,即_、_與_。2、加權算術平均數受兩個因素的影響,一個是_,一個是_。3、在假設檢驗中,把符合的總體判為不符合加以拒絕,這類錯誤稱為_錯誤;把不符合的總體當作符合而接受,這類錯誤稱為_錯誤;顯著性水平是用來控制犯第_類錯誤的概率。4、直線相關系數等于零,說明兩變量之間_;直線相關系數等于-1,說明兩變量之間_。四、簡答題(每題5分,共20分)1、統計學的確對我們的生活的各個方面起著重要的作用,但如果有意或者無意地誤用統計學方法,其結論則會帶來更大的欺騙性。為了避免這種情況的發生,請根據你的了解,寫出1個誤用統計學方法的例子,并說明

32、應該如何正確應用方法?2、隨機抽樣的含義與特點?3、什么是標準差系數?在什么場合下計算標準差系數?4、說明單因素方差分析中,總離差平方和、水平項離差平方和、誤差項離差平方和的含義與三者的關系?五、計算題(每題10分,共30分)1、隨機抽查某企業100名職工,其月工資資料如下表 月工資額(百元)職工數(人)要求:根據表中資料計算職工月工資的平均數、標準差和離散系數。588101012121414184108033合計1002、某快餐店對顧客的平均花費進行抽樣調查,隨機抽取了49名顧客構成一個簡單隨機樣本,調查結果為:樣本平均花費為12.6元,標準差為2.8元。試以95.45%的置信水平估計該快餐

33、店顧客的總體平均花費數額的置信區間;(2)=0.9545)3、從某一行業中隨機抽取5家企業,所得產品產量與生產費用的數據如下:產品產量(臺)xi4050507080生產費用(萬元)yi130140145150156要求:利用最小二乘法求出估計的回歸方程。附: 題庫一答案一、選擇題(每題2分,共20分)B2.C3.D4.D5.A6.D7A8.B9.D10.C二、多項選擇題(每題2分,共10分)1.ABCE2.ACE3.ADE4.AB5.ADE三、填空題(每空2分,共20分)分組標志、組矩4元、0.01參數估計、假設檢驗棄真錯誤、納偽錯誤-1,1四、簡答題(每題5分,共20分)1.答:(1)眾數是

34、一組數據分布的峰值,是一種位置代表值。其優點是不受極端值影響。其缺點是具有不唯一性。(1分)(2)中位數是一組數據中間位置上的代表值,也是位置代表值,其特點是不受數據極端值的影響。(1分)(3)均值是就全部數據計算的,它具有優良的數學性質,是實際中應用最廣泛的集中趨勢測度值。其主要缺點是易受數據極端值的影響。(1分)應用場合:當數據呈對稱分布或接近對稱分布時,三個代表值相等或接近相等,這時應選擇均值作為集中趨勢的代表值;當數據為偏態分布,特別是當偏斜的程度較大時,應選擇眾數或中位數等位置代表值,這時它們的代表性要比均值好。此外,均值只適用于定距或定比尺度的數據,而對于定類和定比尺度的數據則無法

35、計算均值,但卻可以計算眾數和中位數。(2分)答:拒絕原假設的最小的顯著性水平,被稱為觀察到的顯著性水平(2分)。(3分)。3.答:標準差是反映數據分散程度的絕對值,其數值的大小一方面取決于原變量值本身水平高低的影響,也就是與變量的均值大小有關。(2分)。因此,對于平均水平不同或計量單位不同的不同組別的變量值,是不能直接用上述離散程度的測度值直接進行比較的。為了消除變量值水平高低和計量單位不同對離散程度測度值的影響,而需要計算標準差系數(3分)。4、答:方差分析的步驟:首先,計算出總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和 (SSA)。SST反映全部數據總的誤差程度;S

36、SE反映隨機誤差的大小;SSA反映隨機誤差和系統誤差的大小,三者之間的關系:SSTSSASSE。第二,計算SSE的均方MSE,SSA的均方MSA。將MSA和MSE進行對比,即得到所需要的F檢驗統計量。第三,將統計量的值F與給定的顯著性水平a的臨界值Fa進行比較,作出對原假設H0的決策。五、計算題(每題10分,共30分)1.解:(全對,給10分,錯一空扣1分)考分人數比率向上累計向下累計人數(人)比率(%)人數(人)比率(%)60以下25.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.0

37、90以上820.040100.0820.0合計40100.02.解:根據題意:提出假設:(2分)檢驗統計量(3分)由0.05,查表臨界值由于Z2=1.645,所以應拒絕而接受H1,即北京市家庭每天上網的時間確有顯著提高。(5分)3.解:(4分)(4分)樣本回歸方程:(2分)題庫二答案一、選擇題(每題2分,共20分)C2.D3.D4.A5.D6.B7B8.B9.B10.A二、多項選擇題(每題2分,共10分)1.ABCD2.ABD3.ADE4.AB5.ADE三、填空題(每空2分,共20分)統計設計、統計調查、統計整理、統計分析右偏、左偏無偏性、有效性、一致性線性相關四、簡答題(每題5分,共20分)

38、1. 答:離中趨勢的常用指標包括:全距、平均差、標準差與標準差系數(2分)。(1)全距:計算簡單、但容易受極端數值的影響,不能全面反映所有標志值的差異及分布狀況,準確度差(2分)。(2)平均差:不易受極端數值的影響,能綜合反映全部單位標志值的實際差異程度;缺點:用絕對值的形式消除各標志值與算術平均數離差的正負值問題,不便于作數學處理和參與統計分析運算(2分)。(3)標準差:不易受極端數值的影響,能綜合反映全部單位標志值的實際差異程度;用平方的方法消除各標志值與算術平均數離差的正負值問題,可方便地用于數學處理和統計分析運算(2分)。(4)離散系數:用來對比不同水平的同類現象,特別是不同類現象總體

39、平均數代表性的大小(2分)。2.答:總體各單位的差異程度(即標準差的大小),總體各單位的差異程度越大,抽樣誤差越大(4分);樣本單位數的多少,樣本單位數越大,抽樣誤差越小(2分);抽樣方法:不重復抽樣的抽樣誤差比重復抽樣的抽樣誤差小(2分);抽樣組織方式:簡單隨機抽樣的誤差最大(2分)。3.答:相關分析,就是用一個指標來表明現象相互依存關系的密切程度。回歸分析,就是根據相關關系的具體形態,選擇一個合適的數學模型,來近似地表達變量間的平均變化關系(2分)。(1)兩者有密切的聯系。它們不僅有共同的研究對象,而且在具體應用時,必須互相補充。相關分析需要依靠回歸分析來表明現象數量相關的具體形式,而回歸

40、分析則需要依靠相關分析來表明現象數量變化的相關程度(4分)。(2)相關分析與回歸分析在研究目的和方法上是有明顯區別的。相關分析研究變量之間相關的方向和相關的程度。但是相關分析不能指出變量間相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況。回歸分析則是研究變量之間相互關系的具體形式,確定一個相關的數學方程式,根據這個數學方程式從已知變量推測未知量,從而為估算和預測提供了一個重要的方法(4分)。4、答:基本步驟:1.提出原假設和備擇假設(2分)2.確定適當的檢驗統計量(2分)3.規定顯著性水平,確定臨界值(2分)4.計算檢驗統計量的值(2分)5.作出統計決策(2分)五、計算題(

41、每題10分,共30分)1.解:(1)乙班的平均分數: (5分) 乙班平均分數的標準差: 乙班平均分數的標準差系數:(3分)(2)比較哪個班的平均分數更有代表性:因為小于所以甲班的平均分數更有代表性(2分)。解:已知:,。(5分)195.45%即。必要的抽樣數目:(件)(5分)3.解:樣本回歸方程:(6分)將有關數據代入回歸方程,得:(億元)置信度為95.45%的利潤額的預測區間為:,即0.9(元)Y1.1(元)(4分)。題庫三答案一、選擇題(每題2分,共20分)1.B2.A3.D4.A5.A6.A7.D8.B9.B10.A二、多項選擇題(每題2分,共10分)1.ABC2. BDE3.CE4.A

42、CDE5.ACD三、填空題(每空2分,共20分)描述統計學、推斷統計學等距式分組、異距式分組矩形標準差、均值總體均值、總體比例、總體方差四、簡答題(每題5分,共20分)1. 答:完整的統計調查方案包括:(1)確定調查目的,即為什么調查(2分);(2)確定調查對象和調查單位,即向誰調查(2分);(3)確定調查項目和調查表,即調查什么(2分);(4)其他內容,包括調查的時間與組織安排等(4分)。2.答:數據的計量尺度由低級到高級、由粗略到精確分為四個層次,即定類尺度、定序尺度、定距尺度和定比尺度。定類尺度,是最粗略、計量層次最低的計量尺度,它是按照事物的某種屬性對其進行平行的分類或分組。各類別之間

43、是平等的并列關系,無法區分優劣或大小。(1分)定序尺度,它是對事物之間等級差或順序差別的一種測度。該尺度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優劣或順序。該尺度的計量結果只能比較大小,不能進行加、減、乘、除數學運算。(1分)定距尺度,它不僅能將事物區分為不同類型并進行排序,而且可以準確地指出類別之間的差距是多少。該尺度的計量結果表現為數值,并可以計算差值,因而,其結果可以進行加減運算。定距尺度沒有一個絕對零點,不能進行乘、除運算。(1分)定比尺度,與定距尺度屬于同一層次,其計量的結果也表示為數值。由于有絕對的零點,可以進行加、減、乘、除運算。(1分)上述四種計量尺度對事物的計量

44、層次是由低級到高級、由粗略到精確逐步遞進的。高層次的計量尺度可以計量低層次計量尺度能夠計量的事物,但不能反過來。(1分)3.答:標準差是反映數據分散程度的絕對值,其數值的大小一方面取決于原變量值本身水平高低的影響,也就是與變量的均值大小有關。變量值絕對水平越高,離散程度的測度值自然也就大,絕對水平越低,離散程度的測度值自然也就小;另一方面,它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。(2分)標準差系數是標準差與均值的比較,是一個無量綱的相對數,用于反映與比較數據的離散程度。(1分)因此,對于平均水平不同或計量單位不同的不同組別的變量值,是不能直接用上

45、述離散程度的測度值直接進行比較的。為了消除變量值水平高低和計量單位不同對離散程度測度值的影響,而需要計算標準差系數。(2分)4、答:必要抽樣數目受以下因素影響:(1)總體方差。其他條件不變的條件下,總體單位的差異程度大,則應多抽,反之可少抽一些(1分)。(2)允許誤差范圍。允許誤差增大,意味著推斷的精度要求降低,在其他條件不變的情況下,必要的抽樣數目可減少;反之,縮小允許誤差,就要增加必要的抽樣數目(1分)。(3)置信度(1)。在其他條件不變的情況下,要提高推斷的置信程度,就必須增加抽樣數目(1分)。(4)抽樣方法。相同條件下,采用重復抽樣應比不重復抽樣多抽一些樣本單位(1分)。(5)抽樣組織

46、方式。由于不同抽樣組織方式有不同的抽樣誤差,在誤差要求相同的情況下,不同抽樣組織方式所必需的抽樣數目也不同(1分)。五、計算題(每題10分,共30分)1.解:解:品種價格(元/斤)甲市場乙市場成交額(m)成交量(m/x)成交量(f)成交額(xf)甲1.21.2122.4乙1.42.8211.4丙1.51.5111.5合計5.5445.3甲市場平均價格(元)(3分)乙市場平均價格(元)(3分)說明:兩個市場銷售單價是相同的,銷售總量也是相同的,影響兩個市場平均價格高低不同的原因就在于各種價格的農產品在兩個市場的成交量不同。甲市場銷售價格較高的乙產品最多,而乙市場銷售價格最低的甲產品最多,因而使得

47、甲市場的平均價格高于乙市場。這就是權數在平均數形成中所起的權衡輕重的作用(4分)。2.解:根據題意:提出假設:檢驗統計量由0.05,查表臨界值由于t0.9733=1.645,所以應拒絕而接受H1,即西安市家庭每天看電視的時間確有顯著提高。(5分)3.解:(4分)(4分)當分(2分)題庫五答案一、選擇題(每題2分,共20分)1.B2.A3.B4.B5.B6.B7.A8.A9.C10.C二、多項選擇題(每題2分,共10分)1.ABC2. AB3.ADE4.AB5.AB 三、填空題(每空2分,共20分)統計工作、統計數據、統計學變量水平、權數各組權數相等所有單位、全面調查無線性相關、完全負相關四、簡答題(每題5分,共20分)1. 答:有關數據均值的計算。當數據呈較嚴重偏態分布時,用平均數則代表性很差(2分)。正確使用的原則:(1)眾數:不受極端值影響,具有不惟一性,數據分布偏斜程度較大時應用(1分)。(2)中位數:不受極端值影響,數據分布偏斜程度較大時應用(1分)。(3)平均數:易受極端值影響,數學性質優良,數據對稱分布或接近對稱分布時應用(1分)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論