統計學(第六版)賈俊平--課后習題答案_第1頁
統計學(第六版)賈俊平--課后習題答案_第2頁
統計學(第六版)賈俊平--課后習題答案_第3頁
統計學(第六版)賈俊平--課后習題答案_第4頁
統計學(第六版)賈俊平--課后習題答案_第5頁
已閱讀5頁,還剩66頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章導論1.1.1(4)順序變量.(1)總體是該市所有職工家庭的集合;樣本是抽中的2000個職工家庭的集合。(1)總體是所有IT從業者的集合.(1)總體是所有在網上購物的消費者的集合。(3)參數是所有在網上購物者的月平均花費。(5)推斷統計方法.第二章數據的搜集資料稱為“二手資料”。使用二手資料時需要注意:資料的原始搜集人、搜集資料的目的、搜集資料的途徑、搜集資料的時間,要注意數據的定義、含義、計算口徑和計算方法,避免況下適合采用非概率抽樣.概率抽樣是指抽樣時按一定概率以隨機原則抽取樣本。每個單位被抽中的概率已知或可以計算,當用樣本對總體目標量進行估計時,要考慮到每個單位樣本被抽中的概率,概率抽樣的技術含量和成本都比較高。如果調查的目的在于掌握和研究總體的數量特征,得到總體非概率抽樣是指抽取樣本時不是依據隨機原則,而是根據研究目的對數據的要求,采用更深入的數量分析提供準備。非概率抽樣也適合市場調查中的概念測試.自填式優點:調查組織者管理容易,成本低,可以進行較大規模調查,對被調查者可以刻選擇方便時間答卷,減少回答敏感問題的壓力。缺點:返回率低,調查時間長,在數據搜集過程中遇到問題不能及時調整。分發揮調查員的作用。缺點:成本比較高,對調查過程的質量控制有一定難度。對于敏感問題,被訪者會有壓力。有限,調查時間不宜過長,問卷要簡單,被訪者不愿回答時,不宜勸服.5.請舉出(或設計)幾個實驗數據的例子。不同飼料對牲畜增重有無影響,新舊技術的機器對組裝同一產品所需時間的影響。6.你認為應當如何控制調查中的回答誤差?對于理解誤差,要注意表述中的措辭,學習一定的心里學知識。對于記憶誤差,盡量縮短所涉及問題的時間范圍。對于有意識誤差,調查人員要想法打消被調查者得思想顧慮,調查人員要遵守職業道德,為被調查者保密,盡量避免敏感問題。7.怎樣減少無回答?請通過一個例子,說明你所考慮到的減少無回答的具體措施。對于隨機誤差,可以通過增加樣本容量來控制。對于系統誤差,做好預防,在調查前做好各方面的準備工作,盡量把無回答率降到最低程度。無回采取補救措施。比如要收回一百份,就要做好一百二十份或一百三十份問卷的準備,當被調查者不愿意回答時,可以通過一定的方法勸服被訪者,還可以通過饋贈小禮品等的方式提高第三章數據的圖表搜集一、思考題3.2分類數據和順序數據的整理和顯示方如果是兩個或兩個以上變量可以制作交叉表.對于分類數據可以繪制條形圖、帕累托圖、餅對于順序數據,可以計算各種的頻數、頻率,以及累計頻數、累計頻率.可根據需要繪制條形圖、餅圖、環形圖等。3。3數值型數據的分組方法有哪些?簡述組距分組的步驟.答:單變量值分組和組距分組。其中組距分組:第一步,確定組數,組數多少由數據的根據分組整理出頻數分布表,注意遵循“不重不漏"和“上限不在內”的原則.答:1,條形圖使用圖形的長度表示各類別頻數的多少,其寬度固定,直方圖用面積表示型數據.3。5繪制線圖應注意問題?0開始,數據與0距離過大的話用折斷符號折斷。3。6餅圖和環形圖的不同?答:餅圖只能顯示一個樣本或總體各部分所占比例,環形圖可以同時繪制多個樣本或總3.7莖葉圖比直方圖的優勢,他們各自的應用場合?3表中的上下兩條橫線一般用粗線,中間的其他用細線(1)表中數據屬于順序數據。(2)用Excel制作一張頻數分布表.服務等級家庭數目(個)(3)繪制一張條形圖,反映評價等級的分布。)個30(數家0家服務等級好較好一般較差差服務等級服務等級的條形圖(4)繪制評價等級的帕累托圖。率0一般較好較差差好其他售后服務等級的帕累托圖150.00%100.00%50.00%0.00%頻3.2某行業管理局所屬40個企業2002年的產品銷售收入數據如下:(1)根據上面的數據進行適當的分組,編制頻數分布表,并計算出累積頻數和累積頻率。組距最大值—最小值)÷組數=(152—87)÷6=10。83,取103、分組頻數表銷售收入銷售收入頻率%向上累計頻率%252537。55922。5782。5492。525。097。51-—企業進行分組.頻率%向上累計頻率%先進企業一般企業977。5落后企業9-—3.3某百貨公司連續40天的商品銷售額如下:單位:萬元要求:根據上面的數據進行適當的分組,編制頻數分布表,并繪制直方圖。組距最大值—最小值)÷組數=(49—25)÷6=4,取53、分組頻數表(根據實際資料,調整成分5個組)銷售收入(萬元)頻率%44662。5922。56--頻率(天)頻率(天)5030-3535-4040-4545以上商店40天銷售額的直方圖150.00%100.00%50.00%0.00%頻率累積%銷售額(萬元)30以下3.4利用下面的數據構建莖葉圖和箱線圖。答:莖葉圖FrequencyStem&Leaf68889993。00箱線圖燈泡壽命燈泡壽命22%660-67057%670-680613%680-690690—70084%720—73094%730—740397%3—直方圖頻率(個)50120.00%100.00%80.00%60.00%40.00%20.00%0.00%燈泡壽命(小時)燈泡壽命的直方圖從直方圖看,數據的分布呈左偏分布.2,取k=7組距最大值—最小值)÷組數=(61—40)÷7=3,取33、分組頻數表(根據實際資料,調整成分5個組)頻率%33439977——520.00%00.00%43以下43-4646-4949-5252-5555-5858以上食品重量的直方圖從直方圖看,數據的分布呈雙峰分布.頻率%向上累計頻率%557849-59969—79624-—率頻50誤差的直方圖從直方圖看,數據的分布呈左偏分布,取k=7組距最大值—最小值)÷組數=(9+25)÷7=4.86,取5氣溫(℃)氣溫(℃)(?25,-20)66840.00(-10.-5)(?5.0)(0,5)4(5,10)7——50氣溫的直方圖從直方圖看,數據的分布呈左偏分布.年齡分布直方圖年齡分布直方圖5018~1920~2122~2425~2930~3435~3940~4445~59自學考試人員年齡分布集中在20-24之間,分3。10503。12(1)復式條形圖202086420優良中及格不及格人數人數環形圖優良中良中(2)甲班成績分布圖近似正態分布,分布較均衡;乙班成績分布圖右偏.優20不及格5中及格中0福美來夏利捷達松花江富康哈飛路寶進口車銷售排行前10名進口車銷售排行前10名68603030230豐田現代日產奔馳寶馬大眾汽車克萊斯勒本田雷克薩斯6奧迪402080國產車銷售排行前10名4%19%福美來夏利4%19%福美來夏利捷達松花江富康哈飛路寶高爾夫東方之子長安奧拓愛麗舍6%7%7%19%10%13%10%13%進口車銷售排行前10名4%2%1%4%5%7%7%15%23%32%豐田現代奔馳寶馬大眾汽車克萊斯勒本田雷克薩斯奧迪國內生產總值國內生產總值01995199619971998199920002001200220032004第一、二、三產業國內生產總值8000070000600005000040000300002000001995199619971998199920002001200220032004第一產業第二產業第三產業第四章習題答案平均數:9.6(4)峰度—0.25,偏度—0.69(1)眾數:19;23L位置=-=6.25.所以Q=19+0.25^0=19Q位置=75=18.75,所以Q=25+2^0。75=26。5(3)標準差:6。654.3(1)莖葉圖略(3)第一種方式的離散系數v=-=─—=0.28第二種方式的離散系數v=-=─=0.10所以,第二種排隊方式等待時間更集中。(4)選擇第二種,因為平均等待的時間短,而且等待時間的集中程度高(2)QL位置==7。5.所以QL=258+0.25^3=258.75Q位置=90=22.5,所以Q=284+7^0.75=289.254.5.總成本/元總成本/元產品名稱ABC單位成本產量ΣMifi6600甲企業總平均成本x=i=1=──=19.41(元)ΣMifi6255多,所以把總平均成本提高了。(x_x)2f400~500450421890022860ΣMifi51200Σ(x-x)2*f利潤總額標準差σ=nΣ(M-x)4fii44Σ(M-x)3fΣ5(M-426.67)3fiiii33(3)不同,調查1000名的樣本容量得到最4。8對于不同的總體的差異程度的比較采用標準差系數,計算如下:(1)女生的體重差異大,因為離散系數大;磅,標準差為11.05磅ii=i==i=ziiii;產量0。22。20可以看出,周一和周六兩天生產線失去了控制。4.11(1)采用離散系數,因為如果比較身高差異,兒童和成年人屬于不同的總體;所以,兒童的身高差異更大.4。12(1)對集中程度和離散程度分別評價,選擇集中趨勢數值大的,而且離散程度數值小數量的離散系數只有0.012,所以選擇A方法。4。13(1)用離散系數(3)高科技⑴變量之間確實存在著數量上的依存關系;⑵變量之間數量上的關系是不確定、不嚴格強度如何?⑷樣本所反映的變量之間的關系能否代表11.3.在進行相關分析時,對總體主要有以下兩個假定:⑴兩個變量之間是線性關系;⑵兩個變量都是隨機變量。間的相關系數r相等;⑶相關系數與原點和尺度無關;⑷相關系數是線性關聯或線性相依的一個度量,它不能用于描述非線性關系;⑸相關系數只是兩個變量之間線性關聯的一個度數為零;但r=0不等于說兩個變量是獨立的。即零相關并不一定意味著獨立性。11.5.在實際的客觀現象分析研究中,相關系數一般都是利用樣本數據計算的,因而關系數的可靠性,因此要進行顯著性檢驗.11.6.相關系數顯著性檢驗的步驟:⑴提出假設;⑵計算檢11.7.回歸模型是對統計關系進行定量描述的一種數學模型,例如:對于具有線性關系和誤差項ε的方程稱為回歸模型。回歸方程是對變量之間統計關系進行定量描述的一種數學表達式.指具有相關的隨機變量和固定變量之間關系的方程.當總體回歸系數未知時,必須用樣本數據去估計,用樣本統計量代替回歸方程中的未知參數,就得到了估計的回歸方程。互獨立。即εN(0,2)。11.9.參數最小二乘法的基本原理是:因變量的觀測值與估計值之間的離差平方和最分,是不能由回歸直線來解釋的部分。它們之間的關系是:總平方和=回歸平方和+殘差平方和.11.11.回歸平方和占總平方和的比例稱為判定系數。判定系數測量了回歸直線對觀測過均方回歸與均方殘差之比,構造F檢驗統計量,提出假設,根據顯著性水平,作出判斷。t檢驗是回歸系數的顯著性檢驗,要檢驗自變量對因變量的影響是否顯著,通過構造t檢驗統計量,提出假設,根據顯著性水平,作出判斷。11.13.線性關系檢驗的步驟:⑴提出假設;H:β=0;⑵構造F檢驗統計量;s11.15.置信區間估計是對x的一個給定值x,求出y的平均值的區間估計。預測區00估計的區間長度通常較短,而預測區間估計的區間長度要長,也就是說,估計y的平均值比11.16.殘差分析在回歸分析中的作用:回歸分析是確定兩種或兩種以上變量間的定量關系的一種統計分析方法.判斷回歸模型的擬合效果是回歸分析的重要內容,在回歸分析中,通常用殘差分析來判斷回歸模型的擬合效果,并判定關于誤差項的正態假設是否成立。二、練習題20020016012080400050100150產量從散點圖可以看出,產量與生產費用之間為正的線性相關關系。計算檢驗的統計量222C2C絕原假設。表明產量與生產費用之間的線性關系顯著.100100806040200010203040復習時間從散點圖可以看出,復習時間與考試分數之間為正的線性相關關系。表明復習時間與考試分數之間有較強的正線性相關關系。=90%表示,在因變量y取值的變差中,有90%可以由x與y之間的線性關系來解s=0.5表示,當用x來預測y時,平均e11.51)散點圖如下:66543210050010001500運送距離從散點圖可以看出,運送距離與運送時間之間為正的線性相關關系。表明運送距離與運送時間之間有較強的正線性相關關系。MultipleR0.9489430。900492AdjustedRSquare0.888054標準誤差0.480023觀測值MSFSignificanceF72.395852.79E—05Coefficients標準誤差P-value0.1181290。332620。74797XVariable10。0035850.0004218.5085752.79E-050。002613111.61)散點圖如下:1400014000120001000080006000400020000010000200003000040000人均GDP從散點圖可以看出,人均GDP與人均消費水平為正的線性相關關系。表明人均GDP與人均消費水平之間有非常強的正線性相關關系。MultipleR0.9981280.996259AdjustedRSquare0。995511標準誤差247.3035觀測值7方差分析MSFSignificanceF1568144496981750764814449692.91E—07Coefficients標準誤差P-valueXVariable1734.69280。3086830.00845991E—071GDP每增加1元,人均消費水平平均增加0.308683元。均GDP決定的.性關系顯著.置信區間為:20(x(xx)20Σ(xx)2in即(1990.7,2565。5)。(x(xx)20Σ(xx)200i27即(1580.3,2975。9)11.71)散點圖如下:140140120100806040200020406080100航班正點率從散點圖可以看出,航班正點率與被投訴次數之間為負的線性相關關系。MultipleR0。8686430。75454AdjustedRSquare0。723858標準誤差觀測值方差分析MSFSignificanceF24.591870。001108殘差22Coefficients標準誤差P-value430.18925.962029—4.95900.000337XVariable1—4。7006221%,(3)回歸系數檢驗的P—Value=0.0011置信區間為:(x(xx)20Σ(xx)2in即(37.7,70.7)(x(xx)20Σ(xx)2in2即(7.6,100。8)MultipleR0.79510。6322AdjustedRSquare0.6117標準誤差2.6858觀測值方差分析dfSSMSFSignificanceF1223.1403223。140330.93322.79889E-05殘差352。9855Coefficients標準誤差P-valueXVariable149.31770。24920.04480。00000.00001R2=63.22%,表明在出租率的變差中被出租率與租金之間為63.22%,回歸方程的擬合程度一般。估計標準誤差s=2.6858表示,當用月租金來預測出租率時,平均的預測誤差為2。e6858%,表明預測誤差并不大。著。回歸系數檢驗的P—value=0.0000<a=0.05,表明回歸系數顯著,即月租金是影響出租率的顯著性因素.11.91)方差分析表中所缺的數值如下變差來源殘差11422708。640158。071642866。67MS1422708。64015.807—F354.277—-SignificanceF2。17E-09—-表明汽車銷售量的變差中有86.60%是由于廣告費用的變動引起的。1每增加一個單位,銷售量平均增加1.420211個單位.(5)由于SignificanceF=2.關系顯著.MultipleR0.9681670.937348AdjustedRSquare0.916463標準誤差3。809241觀測值5方差分析dfSSMSFSignificanceF0.006785殘差3443.53094Coefficients標準誤差P-value4.399428XVariable12.3029320.3437476.6994910.006785e11.111)檢驗統計量:(4)根據相關系數與判定系數之間的關系可知,4(xx)2nn0Σ(xx)20i即(15。95,18.05)(2)預測區間為:011n(xx)20Σ(xx)2i2即(14。65,19.35)MultipleR0.9476630.898064AdjustedRSquare0.881075標準誤差觀測值8方差分析MSFSignificanceF殘差167696215.50。000344Coefficients標準誤差P—valueXVariable1-46.29182.096101—0。7.2705330.5024020(x(xx)20Σ(xx)2in2即(270.65,685。04).回歸1回歸1殘差32.5210.50-0.5-1-1.5回歸1殘差210-0.5-1.5結論:回歸1的殘差基本上位于一條水平帶中間,說明變量之間的線性假設以及對誤差項正態假設是成立,用一元線性回歸方程描述變量間的關系是合適的。(2)由于SignificanceF=0。020〈C=0.05,表明廣告費支出與銷售額之間的線性(3)殘差圖0XVariable1殘差從圖上看,關于誤差項ε的假定不滿足。kk銷售額y銷售額y400銷售額y從廣告費支出x與銷售額y關系的散點圖上看,用二次函數或其它曲線模型會更好.第十二章多元線性回歸12.1解釋多元回歸模型、多元回歸方程、估計的多元回歸方程的含義。答:設因變量為y,k個自變量分別為x,x,…,x,描述因變量y如何依賴于自變ββ0本統計量本統計量 ,去估計回歸方程中的未知參數β,β,…,β時,就得到了估計的多元回歸方程=+x+x+…+x.答:(1)誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。(3)誤差項ε是一個服從正態分布的隨機變量,且相互獨立,即ε~N(0,σ2).12。3解釋多重判定系數和調整的多重判定系數的含義和作用.答:多重判定系數R2是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個統計量,反映了在因變量的變差中被估計的回歸方程所解釋的比例。為避免增加自變量而高估R2,統計學家提出用樣本量n和自變量的個數k去調整R2,計算出調整的多重判定系數R2=1(1a量和模型中自變量的個數進行調整后,在因變量的變差中被估計的回歸方程所解釋的比例。12。5多重共線性對回歸分析有哪些影響?答:首先,變量之間高度相關時,可能會使回歸的結果混亂,甚至會把分析引入歧途;其次,多重共線性可能對參數估計值的正負號產生影響,特別是β的正負號有可能同預期的i(2)當模型的線性關系檢驗(F檢驗)顯著時,幾乎所有回歸系數β的t檢驗卻不i(3)回歸系數的正負號與預期的相反.答1)將一個或多個相關的自變量從模型中剔除,使保留的自變量盡可能不相關.(2)如果要在模型中保留所有的自變量,那就應該:避免根據t統計量對單個參數β進行檢驗;對因變量y值的推斷(估計或預測)限定在自變量樣本值的范圍內。二、練習題1a表示,在x不變的條件下,x每增加1個單位,會使y平均減少0。049714個單位;928169個單位。多重判定系數R2和調整的多重判定系數R2顯示:該多元回歸方程的擬合效果較差,在a因變量y的變差中,能被估計的回歸方程所解釋的比例很少。t檢驗表明,自變量aa用樣本量和模型中自變量的個數進行調整后,在因變量y的變差中,能被估計的回歸方程所解釋的比例為63。0463%.xx212xx313(3對因變量y的影響均顯著,但x對因變量y的影響不顯著。211221aa(3)上述(1)和(2)所建立的估計的回歸方程,電視廣告費用的系數符號相同但數值11表示,電視廣告費用x表示,電視廣告費用x1表示,在報紙廣告費用x不變的條件下,電視廣告費用x每增加1萬元,會使月銷售收入y平均增加2.290184萬元.(4)根據問題(2)所建立的估計的回歸方程,在月銷售收入的總變差中,被估計的回歸方程所解釋的比例是88.6650%.(5)根據問題(2)所建立的估計的回歸方程,,故β顯著。1,故β顯著.2a22.386461kg/hm2;。C,會使早稻收獲量y平均增加327。671713kg/hm2。(3)可能存在.因為自變量春季降雨量x與春季溫度x的簡單線性相關系數為0.965067。且模型的線性關系檢驗(F檢驗)顯著,但回歸系數的t檢驗不顯著。1a(2)在銷售價格的總變差中,被估計的回歸方程所解釋的比例是87。83%.,故回歸系數β不顯著。1,故回歸系數β顯著。2,故二元回歸模型的線性關系顯著.,故β顯著,22nn-21-r2xx2故無證據表明二者之間存在線性關系。y,x2xx1-r22故無證據表明二者之間存在線性關系。對預測y無用.a這與(3)所得結論不相同。x1,x2x2故無證據表明銷售價格與購進價格之間存在線性關系。x2故無證據表明銷售價格與銷售費用之間存在線性關系。(2)根據(1)中結果,用購進價格和銷售費用來預測銷售價格無用。aF檢驗表明,y與x、x之間的線性關系不顯著。t檢驗表明,自變量x、x對因變量y的影響均顯著.(4)調整的多重判定系數R2顯示:在用樣本量和模型中自變量的個數進行調整后,在a因變量y的變差中,能被估計的回歸方程所解釋的比例僅為24。4537%.這與(2)中的判斷x1,x2第十四章統計指數計量產量單位成本(元)報告期報告期報告期6基期6。2基期產品名稱(1)計算產量與單位成本個體指數。(2)計算兩種產品產量總指數以及由于產量增加而增加的生產費用.(3)計算兩種產品單位成本總指數以及由于成本降低而節約的生產費用。解:指數(%)產量單位成本指數(%)產量單位成本臺件報告期報告期單價(元)銷售數量(2)分析銷售量和價格變動對銷售額影響的絕對值和相對值。q0q1p0p1 -Σpq31475Σpq31475Σpq28800Σpq-Σpq=28800-26000=2800(元)3.試根據下列資料分別用拉氏指數和帕氏指數計算銷售量指數及價格指數。基期報告期銷售數量基期報告期甲乙丙甲乙丙銷售量Σpq0.40。360.50。6Σpqp1pqpq10=—銷售量指數Σpq480Σpq11=Σ11=4。某公司三種產品的有關資料如下表,試問三種產品產量平均增長了多少,產量增長產品名稱個體產量指數產品名稱個體產量指數基期產值(萬元)報告期產值(萬元)解:q1q0qkqΣqpΣq1=Σq1p0=Σp

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論