統計學第四版答案(賈俊平)_第1頁
統計學第四版答案(賈俊平)_第2頁
統計學第四版答案(賈俊平)_第3頁
統計學第四版答案(賈俊平)_第4頁
統計學第四版答案(賈俊平)_第5頁
已閱讀5頁,還剩16頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、請舉出統計應用的幾個例子: 1、用統計識別作者:對于存在爭議的論文,通過統計量推出作者 2、用統計量得到一個重要發現:在不同海域鰻魚脊椎骨數量變化不大,推斷所有各個不同海域內的鰻魚是由海洋中某公共場所繁殖的       3、挑戰者航天飛機失事預測 請舉出應用統計的幾個領域:  1、在企業發展戰略中的應用    2、在產品質量管理中的應用 3、在市場研究中的應用      

2、60; 在財務分析中的應用  在經濟預測中的應用 你怎么理解統計的研究內容: 1、統計學研究的基本內容包括統計對象、統計方法和統計規律。  2、統計對象就是統計研究的課題,稱謂統計總體。 3、統計研究方法主要有大量觀察法、數量分析法、抽樣推斷法、實驗法等。 統計規律就是通過大量觀察和綜合分析所揭示的用數量指標反映的客觀現象的本質特征和發展規律。 舉例說明分類變量、順序變量和數值變量: 分類變量:表現為不同類別的變量稱為分類變量,如“性別”表現為“男”或“女”,“企業所屬的行業”表現為“制造業”、

3、“零售業”、“旅游業”等,“學生所在的學院”可能是“商學院”、“法學院”等 順序變量:如果類別有一定的順序,這樣的分類變量稱為順序變量,如考試成績按等級分為優、良、中、及格、不及格,一個人對事物的態度分為贊成、中立、反對。這里的“考試成績等級”、“態度”等就是順序變量。 數值變量:可以用數字記錄其觀察結果,這樣的變量稱為數值變量,如“企業銷售額”、“生活費支出”、“擲一枚骰子出現的點數”。 定性數據和定量數據的圖示方法各有哪些: 1、定性數據的圖示:條形圖、帕累托圖、餅圖、環形圖 2、定量數據的圖示: a、分組數據看分布:直方圖

4、60;b、未分組數據看分布:莖葉圖、箱線圖、垂線圖、誤差圖 c、兩個變量間的關系:散點圖 d、比較多個樣本的相似性:雷達圖和輪廓圖 直方圖與條形圖有何區別: 1、條形圖中的每一個矩形表示一個類別,其寬度沒有意義,而直方圖的寬度則表示各組的組距。 2、由于分組數據具有連續性,直方圖的各矩形通常是連續排列,而條形圖則是分開排列。 3、條形圖主要用于展示定性數據,而直方圖則主要用于展示定量數據。 一組數據的分布特征可以從哪幾個方面進行描述: 1、數據的水平,反映數據的集中程度 2、數據的差異,反映各數據的離散程

5、度 3、分布的形狀,反映數據分布的偏態和峰態 說明平均數、中位數和眾數的特點及應用場合: 平均數也稱為均值,它是一組數據相加后除以數據的個數而得到的結果。平均數是度量數據水平的常用統計量,在參數估計以及假設檢驗中經常用到。 中位數是一組在數據排序后處于中間位置上的數值,用Me表示。中位數是用中間位置上的值代表數據水平,其特點是不受極端值影響,在研究收入分配中很有用。 眾數與數據出現的次數有關,著眼于對各數據出現的頻率的考察,其大小只與這組數據中的部分數據有關,其特點是不受極端值的影響,具有不惟一性,一組數據中可能會有一個人眾數,也可能會有多個或

6、沒有。 為什么要計算離散系數: 極差、平均差、方差和標準差等都是反映數據分散程度的絕對值,其數值的大小取決于原變量值本身水平高低的影響。 它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。 因此,為消除變量值水平高低和數量單位不同對離散程度的測度值的影響,需要計算離散系數。 舉例說明離散型隨機變量和連續性隨機變量: 離散型隨機變量:設X是一個隨機變量,如果它全部可能的取值只有有限個或可數無窮個,則稱X為一個離散型隨機變量。 包括二項分布、泊松分布、超幾何分布,如一定時間內某航空公司接到的

7、訂票電話數 連續型概率分布:包括正態分布、均勻分布和指數分布。 敘述正態分布曲線的特點: 正態曲線的圖形是關于x=u對稱的鐘形曲線,且峰值在x=u處。   正態分布的兩個參數u和一旦確定,正態分布的具體形式也惟一確定,不同參數取值的正態分布構成一個完整的“正態分布族”。   當X的取值向橫軸左右兩個方向無限延伸時,正態曲線的左右兩個尾端也無限漸近橫軸,但理論上永遠不會與之相交。   正態隨機變量在特定區間上取值的概率由正態曲線下的面積給出,而且其曲線下的總面積等于1解釋中心極

8、限定理的含義:隨著樣本量n的增大(通常要求n>=30),不論原來的總體是否服從正態分布,樣本均值的概率分布都將趨于正態分布,其分布的期望值為總體均值u,方差為總體方差的1/n。這一定理可表述為:從均值為u、方差為2的總體中,抽取樣本量為n的隨機樣本,當n充分大時(通常要求n>=30),樣本均值的分布近似服從均值為u,方差為2/n的正態分布。說明區間估計的基本原理:區間估計,是在點估計的基礎上給出總體參數估計的一個估計區間,該區間通常是由樣本統計量加減估計誤差得到的。與點估計不同,進行區間估計時,根據樣本統計量的抽樣分布,可以對統計量與總體參數的接近程度給出的一個概率度量。 

9、;  簡述評價估計量的標準: 無偏性:它是指估計量抽樣分布的期望值等于被估計的總體參數;    有效性:它是指估計量的方差盡可能小;   一致性:它是指隨著樣本量的增大,點估計量的值越來越接近被估計總體的參 數解釋置信水平的含義 :置信水平,是指總體參數值落在樣本統計值某一區內的概率;而置信區間是指在某一置信水平下,樣本統計值與總體參數值間誤差范圍。置信區間越大,置信水平越高。  簡述樣本量與置信水平、總體方差、估計誤差的關系 樣本量與置信水平成

10、正比,在其他條件不變的情況下,置信水平越大,所需的樣本量也就越大; 樣本量與總體方差成正比,總體的差異越大,所要求的樣本量也越大;  樣本量與估計誤差的平方成正比,即允許的估計誤差的平方越大,所要求的樣本量就越大。   解釋原假設和備擇假設: 原假設:它通常是研究者想收集證據予以推翻的假設,用H0表示,原假設所表達的含義總是指參數沒有變化或變量之間沒有關系,等號“=”總放在原假設上。 備擇假設:通常指研究者想收集證據予以支持的假設,用H1或Ha表示。備擇假設所表達的含義是總體參數發生了變化或變量之間有某種關系。備擇

11、假設的形式總是為H1:uu0,H1:u<u0或u>u0 第一類錯誤和第二類錯誤分別是指什么?它們發生的概率大小之間存在怎樣的關系: 第類錯誤(棄真錯誤):原假設為真時拒絕原假設時所犯的錯誤  第類錯誤(取偽錯誤):原假設為假時未拒絕原假設   當樣本容量n確定后,當變小時,則檢驗的拒絕域變小,相應的接受域會變大,因此值也就隨之變大;相反,若變小,則又會變大   樣本量的大小與顯著性有怎樣的關系: 顯著性水平與樣本的大小密切相關,相關量越大,檢驗統計量的值也就越大,顯著性水平

12、越小,就越有可能拒絕原假設。 相關分析主要解決哪些問題: 變量之間是否存在關系   如果存在關系,它們之間是什么樣的關系   變量之間的關系強度如何   樣本所反映的變量之間的關系能否代表總體變量之間的關系 解釋回歸模型和估計的回歸方程的含義: 回歸模型是描述因變量y如何依賴于自變量x和誤差項的方程。回歸方程是描述因變量y的期望值如何依賴于自變量x的方程。估計的回歸方程是利用最小二乘法,根據樣本數據求出的回歸方程的估計。 簡述參數最小二乘估計的基本原理:&

13、#160;       這一公式的x和y的n對觀察值,用于描述其關系的直線有多條,用距離觀測點最近的一條直線,用它來表示x與y之間的關系與實際數據的誤差比其它任何直線都小。根據這一思想確定直線中未知常數  和  的方法稱為最小二乘法什么是P值?利用P值進行檢驗和利用統計量進行檢驗有什么不同? 如果能把犯第類錯誤的真實概率算出來,就可以直接用這個概率做出決策。而不需要管什么事先給定的顯著性水平,這個犯第類錯誤的真實概率就是P值。 不同:統計量檢驗是根據事先確定的顯著性

14、水平圍成的拒絕域作出決策,不論檢驗統計量的值是大是小,只要把它落入拒絕域就拒絕原假設H。否則就不拒絕H。這樣,無論統計量落在拒絕域的什么位置,你也只能說犯第一錯誤的概率為,而用P值檢驗則能把犯第類錯誤的真實概率算出來。獲得數據的概率抽樣方法有哪些(1)簡單隨機抽樣簡單隨機抽樣又稱純隨機抽樣,是指在特定總體的所有單位中直接抽取n個組成樣本。它最直觀地體現了抽樣的基本原理,是最基本的概率抽樣。(2)系統抽樣系統抽樣也稱等距抽樣或機械抽樣,是按一定的間隔距離抽取樣本的方法。(3)分層抽樣分層抽樣也叫分類抽樣,就是先將總體的所有單位依照一種或幾種特征分為若干個子總體,每一個子總體即為一類,然后從每一類

15、中按簡單隨機抽樣或系統隨機抽樣的辦法抽取一個子樣本,稱為分類樣本,它們的集合即為總體樣本。(4)整群抽樣整群抽樣又稱聚類抽樣或集體抽樣,是將總體按照某種標準劃分為一些群體,每一個群體為一個抽樣單位,再用隨機的方法從這些群體中抽取若干群體,并將所抽出群體中的所有個體集合為總體的樣本。 (5)多階段抽樣多階段抽樣又稱多級抽樣或分段抽樣,就是把從總體中抽取樣本的過程分成兩個或多個階段進行的抽樣方法。樣本量的大小與顯著性有怎樣的關系 通常在做某種統計推斷時,顯著性水平要求越高,要達到該顯著性水平的樣本量越大。 樣本量越大,檢驗統計量的值夜就越大,P值就越小,就越有可能拒絕

16、原假設。反之則相反第1章 統計和統計數據 1.1  指出下面的變量類型。   (1) 年齡。   (2) 性別。    (3) 汽車產量。    (4) 員工對企業某項改革措施的態度(贊成、中立、反對)。    (5) 購買商品時的支付方式(現金、信用卡、支票)。    詳細答案:

17、0;   (1)數值變量。   (2)分類變量。    (3)數值變量。(4)順序變量。    (5)分類變量。  1.2  一家研究機構從IT從業者中隨機抽取1000人作為樣本進行調查,其中60%回答他們的月收入在5000元以上,50%的人回答他 們的消費支付方式是用信用卡。    (1) 這一研究的總體是什么?樣本是什么?樣本量是多少? 

18、60;  (2) “月收入”是分類變量、順序變量還是數值變量?    (3) “消費支付方式”是分類變量、順序變量還是數值變量?    詳細答案:    (1)總體是“所有IT從業者”,樣本是“所抽取的1000名IT從業者”,樣本量是1000。    (2)數值變量。    (3)分類變量。  1.3  一項調查表明,

19、消費者每月在網上購物的平均花費是200元,他們選擇在網上購物的主要原因是“價格便宜”。   (1) 這一研究的總體是什么?   (2) “消費者在網上購物的原因”是分類變量、順序變量還是數值變量?    詳細答案:    (1)總體是“所有的網上購物者”。    (2)分類變量。  1.4  某大學的商學院為了解畢業生的就業傾向,分別在會計專業抽取50人、市

20、場營銷專業抽取30、企業管理20人進行調查。   (1) 這種抽樣方式是分層抽樣、系統抽樣還是整群抽樣?   (2) 樣本量是多少?    詳細答案:    (1)分層抽樣。    (2)100。第3章用統計量描述數據教材習題答案3.1 隨機抽取25個網絡用戶,得到他們的年 19152925242321382218302019191623272234244120311723齡數據如下(單位:周歲)

21、:計算網民年齡的描述統計量,并對網民年齡的分布特征進行綜合分析。 詳細答案: 網民年齡的描述統計量如下: 平均 24中位數 2325%四分位數 1975%四分位數 26.5眾數 19標準差 6.65方差 44.25峰度 0.77偏度 1.08極差 26最小值 15最大值 41 從集中度來看,網民平均年齡為24歲,中位數為23歲。從離散度來看,標準差在為6.65歲,極差達到26歲,說明離散程度較大。從分布的形狀上看,年齡呈現右偏,而且偏斜程度較大。3.2 某銀行為縮短顧客到銀行辦理業務等待的時間,準備采用兩種排隊方式進行試驗。一種是所有顧客都進入一個等待隊列;另一種是顧客在3個業務窗口處列隊3排

22、等待。為比較哪種排隊方式使顧客等待的時間更短,兩種排隊方式各隨機抽取9名顧客,得到第一種排隊方式的平均等待時間為7.2分鐘,標準差為1.97分鐘,第二種排隊方式的等待時間(單位:分鐘)如下: 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 (1)計算第二種排隊時間的平均數和標準差。 (2)比兩種排隊方式等待時間的離散程度。 (3)如果讓你選擇一種排隊方式,你會選擇哪一種?試說明理由。 詳細答案: (1) (歲); (歲)。 (2) ; 。第一中排隊方式的離散程度大。 (3)選方法二,因為平均等待時間短,且離散程度小。 3.3 在某地區隨機抽取120家企業,按利潤額進行分

23、組后結果如下: 按利潤額分組(萬元) 企業數(個) 300以下 19300400304005004250060018600以上 11合計 120計算120家企業利潤額的平均數和標準差(注:第一組和最后一組的組距按相鄰組計算)。 詳細答案: =426.67(萬元); (萬元)。 3.4 一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數是100分,標準差是15分;在B項測試中,其平均分數是400分,標準差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分。與平均分數相比,該位應試者哪一項測試更為理想? 詳細答案: 通過計算標準化值來判斷, , ,說明在項測

24、試中該應試者比平均分 數高出1個標準差,而在B項測試中只高出平均分數0.5個標準差,由于A項測試的標準化值高于B項測試,所以A項測試比較理想。3.5 一種產品需要人工組裝,現有3種可供選擇的組裝方法。為檢驗哪種方法更好,隨機抽取15個工人,讓他們分別用3種方法組裝。下面是15個工人分別用3種方法在相同的時間內組裝的產品數量(單位:個): 方法A方法B方法C1641291251671301261681291261651301271701311261651301281641291271681271261641281271621281271631271251661281261671281161661

25、251261651321251.你準備用哪些統計量來評價組裝方法的優劣? 2.如果讓你選擇一種方法,你會做出怎樣的選擇?試說明理由。 詳細答案: 3種方法的主要描述統計量如下:方法A 方法B方法C平均 165.6平均 128.73平均 125.53中位數 165中位數 129中位數 126眾數 164眾數 128眾數 126標準差 2.13標準差 1.75標準差 2.77峰度 -0.13峰度 0.45峰度 11.66偏度 0.35偏度 -0.17偏度 -3.24極差 8極差 7極差 12離散系數 0.013離散系數 0.014離散系數 0.022最小值 162最小值 125最小值 116最大值

26、 170最大值 132最大值 128 (1)從集中度、離散度和分布的形狀三個角度的統計量來評價。從集中度看,方法A的平均水平最高,方法C最低;從離散度看,方法A的離散系數最小,方法C最大;從分布的形狀看,方法A和方法B的偏斜程度都不大,方法C則較大。 (2)綜合來看,應該選擇方法A,因為平均水平較高且離散程度較小第五章1.23.4.5.6.7.5.8 (1)(3.02%,16.98%)。  (2)(1.68%,18.32%)。  5.9  詳細答案:  (4.06,24.35)。  5.10詳細

27、答案:  139。  5.11 詳細答案:  57。 5.12  769。第6章假設檢驗6.1 一項包括了200個家庭的調查顯示,每個家庭每天看電視的平均時間為7.25小時,標準差為2.5小時。據報道,10年前每天每個家庭看電視的平均時間是6.70小時。取顯著性水平 ,這個調查能否證明“如今每個家庭每天收看電視的平均時間增加了”?詳細答案: , 3.11,拒絕 ,如今每個家庭每天收看電視的平均時間顯著地增加了。 6.2 為監測空氣質量,某城市環保部門每隔幾周對空氣煙塵質量進行一次隨機測試。已知該城市過去每

28、立方米空氣中懸浮顆粒的平均值是82微克。在最近一段時間的檢測中,每立方米空氣中懸浮顆粒的數值如下(單位:微克): 81.686.680.085.878.658.368.773.296.674.983.066.668.670.971.771.677.376.192.272.461.775.685.572.574.082.587.073.288.586.994.983.0根據最近的測量數據,當顯著性水平 時,能否認為該城市空氣中懸浮顆粒的平均值顯著低于過去的平均值? 詳細答案: , -2.39, ,拒絕 ,該城市空氣中懸浮顆粒的平均值顯著低于過去的平均值。 6.3 安裝在一種聯合收割機的金屬板的平

29、均重量為25公斤。對某企業生產的20塊金屬板進行測量,得到的重量數據如下: 22.626.623.123.527.025.328.624.526.230.427.424.925.823.226.926.122.228.124.223.6 假設金屬板的重量服從正態分布,在顯著性水平下,檢驗該企業生產的金屬板是否符合要求?詳細答案: , , ,不拒絕 ,沒有證據表明該企業生產的金屬板不符合要求。 6.4 在對消費者的一項調查表明,17%的人早餐飲料是牛奶。某城市的牛奶生產商認為,該城市的人早餐飲用牛奶的比例更高。為驗證這一說法,生產商隨機抽取550人的一個隨機樣本,其中115人早餐飲用牛奶。在 顯

30、著性水平下,檢驗該生產商的說法是否屬實?詳細答案: , , ,拒絕,該生產商的說法屬實。 6.5 某生產線是按照兩種操作平均裝配時間之差為5分鐘而設計的,兩種裝配操作的獨立樣本產生如下結果: 操作A操作B=100=50=14.8=10.4 =0.8=0.6對 0.02,檢驗平均裝配時間之差是否等于5分鐘。詳細答案: , -5.145, ,拒絕 ,兩種裝配操作的平均裝配時間之差不等于5分鐘。 6.6 某市場研究機構用一組被調查者樣本來給某特定商品的潛在購買力打分。樣本中每個人都分別在看過該產品的新的電視廣告之前與之后打分。潛在購買力的分值為010分,分值越高表示潛在購買力越高。原假設認為“看后”平均得分小于或等于“看前”平均得分,拒絕該假設就表明廣告提高了平均潛在購買力得分。對 0.05的顯著性水平,用下列數據檢驗該假設,并對該廣告給予評價。 購買力得分 購買力得分 個體 看后 看前 個體 看后 看前 165535264698377775443866詳細答案: 設 , 。 , 1.36, ,不拒絕 ,廣告提高了平均潛在購買力得分。 6.7 某企業為比較兩種方法對員工進行培訓的效果,采用方法1對15名員工進行培訓,采用方法2 對12名員工進行培訓。培訓后的測試分數如下: 方法1方法256514559575347524352566

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論