




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《應用統計學》第三章統計數據整理應用統計學CONTENTS目錄第一節統計數據整理概述第二節數據預處理第三節統計分組第四節統計圖表應用統計學第一節統計數據整理概述應用統計學
一、統計整理的意義:
統計整理是根據研究的目的和任務,對調查階段所收集到的大量原始資料進行科學的分類、匯總,為統計分析提供能描述現象總體數量的綜合特征的工作過程。應用統計學二、統計整理的程序:
審核和訂正原始資料
根據研究目的設計整理匯總方案編制各種統計圖表應用統計學三、統計數據匯總的形式:
手工匯總計算機匯總應用統計學第二節
數據預處理
應用統計學數據預處理
數據審核數據篩選數據排序檢查數據中的錯誤計算檢查和邏輯檢查找出符合條件的數據升序和降序尋找數據的基本特征應用統計學第三節
統計分組
應用統計學
一、統計分組的意義和作用:1、統計分組的意義
統計分組是根據統計研究的需要,將統計總體按照一定的標志區分為有聯系的組成部分的一種統計分析方法。
統計分組使組與組之間具有差別性,而同組內的單位保持相對的同質性。應用統計學2、統計分組的作用:從不同角度區分現象的類型,可以表明統計總體的基本性質和特征刻畫現象總體的內部結構及其特征分析各類現象之間的依存關系應用統計學
簡單分組復合分組品質分組變量分組0102按分組標志的性質不同按分組標志的多少
02質量指標類型分組結構分組分析分組03
二、統計分組的種類:按分組標志的作用不同應用統計學
實例:學生按性別、學歷層次的簡單分組
男生
學生
女生
研究生學生本科生專科生應用統計學實例:學生按性別、學歷層次的復合分組
研究生
男生本科生專科生
學生研究生女生本科生專科生應用統計學三、統計分組的方法
1、按品質標志分組
按品質標志分組,有些分組比較簡單,分組標志一經確定,組的名稱和組數也隨之確定,如人口按性別只能分為男、女兩組。
有的品質分組比較復雜,組與組之間的界限難以確定,如人口按職業分組,這類標志分組的詳細程度一般要根據分析任務的要求,經過事先研究并規定統一劃分標準,編制統一分類目錄作為分組的統一依據。應用統計學三、統計分組的方法
2、按數量標志分組
按數量標志分組,應注意以下兩個問題:一是分組時各組數量界限的確定必須能反映事物質的差別。二是應根據現象總體的數量特征,采用適當的分組形式,確定相宜的分組及組限。應用統計學變量數列的種類和編制
單項式變量數列是每一個組只有一個變量值的變量數列(如表3-1)組距式變量數列是將變量的取值范圍劃分為若干個區間,以一個變動區間為一個組的變量數列。(如表3-2)應用統計學
表3-1某企業3月份工人日產量表
日產量(件)工人人數(人)比重(%)3108.741513.053026.164034.872017.4合計115100.0應用統計學表3-2某班學生《統計學》考試成績表
成績(分)頻數(人)頻率(%)60以下26.760-70413.370-80930.080-901136.790以上413.3合計30100應用統計學數據分組的步驟:排序求全距(極差=最大值-最小值)組數斯特格斯(Sturges)經驗公式:組數K=1+log10N/log102=1+3.322lgN頻數分布表確定各組組限計算頻數分組形式確定變量的形式(單項式分組、組距式分組)組距組距=極差/組數=(最大值-最小值)/組數應用統計學實例:
某生產車間50名工人日加工零件數如下(單位:個)。對數據進行分組。117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121應用統計學單項式分組表3-3某車間50名工人日加工零件數分組表零件數(個)頻數(人)零件數(個)頻數(人)零件數(個)頻數(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112應用統計學組距式分組
極差=最大值-最小值=139-107=32K=1+3.322lgN=1+3.322×lg50≈7組距=極差/組數=32/7=4.6≈5應用統計學組距式分組表3-4某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100應用統計學數據分組與頻數分布的注意點03040102連續型變量:習慣上規定上組限不在內離散型變量:兩組組限間斷的辦法“不重不漏”原則空白組與開口組等距與不等距分組組中值開口組通常以相鄰組的組距為組距頻數密度=頻數/組距(單位組距內分布的頻數)組中值=(上限+下限)/2缺上限的組中值=下限+鄰組組距/2,缺下限的組中值=上限-鄰組組距/2應用統計學表3-5離散變量組距數列
商店按職工人數分組(人)商店數(個)1——56——1011——1516——2021——259133195合計67實例:應用統計學
表3-6某車間50名工人日加工零件數分組表
(將最小值改為96,最大值改為160按零件數分組頻數(人)頻率(%)95~100100~105105~110110~115115~120120~125125~130130~135135~140140~145145~150150~155155~160160~16510258141063000012041016282012600002合計50100實例:應用統計學表3-7某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)110以下110~115115~120120~125125~130130~135135以上358141064610162820128合計50100實例:應用統計學累計頻率
向上累計是將各組頻數和頻率,由變量值小的組向變量值大的組逐組累計。每組累計的頻數、頻率表明各組上限以下總共包含的總體次數和比率有多少。向下累計是將各組頻數和頻率,由變量值大的組向變量值小的組逐組累計。每組累計的頻數、頻率表明各組下限以上總共包含的總體次數和比率有多少。應用統計學表3-8某班學生《統計學》考試成績表成績(分)頻數(人)頻率(%)向上累計頻數(人)向上累計頻率(%)向下累計頻數(人)向下累計頻率(%)60以下26.726.730100.060-70413.3620.02893.370-80930.01550.02480.080-901136.72686.71550.090以上413.330100.0413.3合計30100------------實例:應用統計學第四節
統計圖表應用統計學一、統計表的概念
狹義的統計表是將調查得來的說明總體數量特征的經過匯總整理后的數字資料,按照一定的指標順序填列在一定的表格內,這個表格就是統計表。
廣義的統計表是以縱橫線條交叉結合成的表格,用來表現統計資料的一種形式。應用統計學統計表由主詞和賓詞兩部分構成。主詞是統計表所研究總體及其各個組成部分。賓詞是說明總體的統計指標。統計表包括總標題橫行標題縱欄標題數字資料0102從統計表的形式看從統計表的內容看二、統計表的結構:應用統計學實例:應用統計學表3-112022年中國國內生產總值及構成按產業分組國內生產總值總數(億元)比重(%)第一產業883457.30第二產業48316439.92第三產業63869852.78合計1210207100
三、統計表設計應用統計學1、統計表表式設計注意事項:
(1)設計為長方形表格
(2)線條的繪制
(3)合計欄的設置
(4)欄數的編號三、統計表設計應用統計學2、統計表內容設計注意事項
(1)標題設計
(2)指標數值
(3)計量單位
(4)注明資料來源01
折線圖0203
曲線圖0405
餅圖
條形圖
直方圖用寬度相同的條形的高度和長度表示次數分布用圓形及圓內扇形的面積來表示次數分布橫坐標,按照順序表示不同的區間(組),用矩形條,表示相應區間數據的頻次或頻率。把直方圖頂部的中點用直線連接起來,再把原來的直方圖抹掉,折線圖的兩個終點要與橫軸相交當變量數列的組數無限增加時,折線近似表現為一條平滑曲線四、統計圖的類型應用統計學
實例:從某城市抽出30個商店,某商品的價格數據9.9810.0210.0010.0410.019.9910.0510.0410.0610.0110.039.999.979.9310.0110.0310.0310.0210.059.999.959.969.9810.009.9710.0110.009.999.9810.00可以選用那種統計圖來描述數據的特征?應用統計學應用統計學實例:
某生產車間50名工人日加工零件數如下(單位:個)。用統計圖描述數據特征。117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121應用統計學135頻數(人)1512963105110115120125130140日加工零件數(個)302418126%135140日加工零件數(個)1512963頻數(人)105110115120125130應用統計學曲線圖的類型(鐘型、U型、J型)
對稱曲線右偏曲線左偏曲線U型曲線正J型曲線反J型曲線應用統計學謝謝應用統計學
應用統計學《應用統計學》第四章統計數據特征測度CONTENTS目錄第一節總量特征測度第二節相對變化測度第三節集中趨勢測度第四節離中趨勢測度第五節分布形態測度第一節
總量特征測度
應用統計學
一、總量指標的概念:
總量指標是指在一定時間、地點條件下,說明現象總體的規模和水平的指標。應用統計學
二、總量指標的種類:應用統計學總體單位總量是總體單位數的加總。總體標志總量是總體各單位標志值的加總。隨著統計研究目的的改變,單位總量和標志總量可以相互轉化。
時期指標是反映社會經濟現象在一定時期內發展結果的統計指標。時點指標是反映社會經濟現象在一定時點上達到水平和所處狀態的統計指標。時期指標時點指標
實物指標是用實物單位計量的總量指標。價值指標是用貨幣單位計量的總量指標。勞動量指標是用勞動量單位計量的總量指標。
03
實物指標價值指標勞動量指標0101
總體單位總量
總體標志總量02
實例:1、研究某地區工業企業的生產情況
該地區的工業企業總數是總體單位總量;
該地區的工業企業總產值、固定資產投資總額、工人總數是總體標志總量。2、研究某地區工業企業工人的收入狀況
該地區的工業企業的工人總數是總體單位總量。應用統計學
應用統計學實例:判斷下列指標是時期指標還是時點指標?據某地2023年的經濟公報:
該省當年國民生產總值為600億元(A),當年末銀行存款余額為7000億元(B),當年新探明石油儲量54萬噸(C),當年在校大學生160萬(D),畢業生45萬(E),當年新建住宅8000M2(F)。時期指標:ACEF時點指標:BD
實例:判斷下列指標的類型:某企業年末有工人2058人、某汽車廠商年產汽車大約170萬輛;某商場某月彩電銷售87臺,價值35萬元;某工人有一個月有210個工時。應用統計學
三、總量指標的度量
直接計算法間接推算法應用統計學
四、總量指標的運用:
正確確定指標的含義和計算范圍計算實物總量指標時只有同類的才能相加使用統一計量單位總量指標和相對指標、平均指標要結合運用應用統計學第二節
相對變化測度
應用統計學
一、相對指標的概念:
相對指標又稱“相對數”,是用兩個有聯系的指標進行對比的比值來反映社會經濟現象數量特征和數量關系的綜合指標。應用統計學
是一種抽象化的數值,多以系數、倍數、成數、百分數、千分數表示將分子指標與分母指標的計量單位同時使用,主要用于強度相對指標的計算,如人口密度0102復名數無名數二、相對指標的表現形式:應用統計學三、相對指標的種類及計算:1、結構相對指標是在對總體進行分組的基礎上,總體的部分數值與總體的全部數值對比,反映總體內部構成及特征。結構相對指標=
應用統計學例如:產品的合格率2、比較相對指標是指同一時期處于不同空間的同類現象的數量對比,用來說明同類事物在不同條件下的差異程度。比較相對指標=例如:北京的人均GDP/重慶的人均GDP應用統計學3、比例相對指標是指總體內部各部分的數量對比,反映總體范圍內各個部分之間的比例關系。比例相對指標=例如:男女性別比例應用統計學4、動態相對指標是指同一總體同類指標在不同時期的數值對比,用以說明現象發展變化的方向與速度。動態相對指標=例如:2022年我國GDP的發展速度是103%應用統計學5、強度相對指標是指同一時期兩個有聯系的、性質不同的總量指標對比形成的相對指標。用來說明現象發展的強度、密度和普遍程度。強度相對指標=例如:人均糧食產量、每千人擁有的商業機構數應用統計學6、計劃完成程度相對指標是某現象在某一段時間內的實際完成數與計劃任務數相比,以表明所研究現象計劃完成程度的相對指標。用來檢查、監督計劃執行情況。
計劃完成程度相對指標=應用統計學實例:
某企業計劃本期比上期勞動生產率提高3%,實際提高5%,則計劃完成程度相對指標為:計劃完成程度相對指標某企業計劃本期比上期生產成本降低5%,實際降低了7%,則計劃完成程度相對指標為:計劃完成程度相對指標應用統計學實例:判斷下列指標為何種相對指標?
學生出勤率
人均國民收入GDP增長率9.5%
投資和消費的比例應用統計學四、相對指標的運用:兩個對比指標要有可比性相對指標要與總量指標結合運用各種相對指標結合運用應用統計學第三節
集中趨勢測度
應用統計學一、平均指標的概念
平均指標又稱“統計平均數”,用以反映社會經濟現象總體各單位某一數量標志在一定時間、地點條件下所達到的一般水平的綜合指標。應用統計學二、平均指標的分類:算術平均數數值平均數位置平均數調和平均數幾何平均數中位數眾數分位數應用統計學
代表總體各單位的標志值在單項式數列中,為各組變量值在組距式數列中,為組中值fi為第i組的次數加權算術平均數三、平均指標的計算:1、算術平均數=簡單算術平均數應用統計學實例:求某保險公司業務員的平均收入年收入(萬元)人數(人)組中值(x)xf0-120.511-352103-52541005-73061807-968489以上21020合計70359應用統計學解:平均收入:
(萬元/人)
應用統計學2、調和平均數:實例:青石橋市場某日提供3種大閘蟹,大、中、小單價每公斤分別為120元、100元和80元,問各買1公斤,平均每公斤多少錢?如果每種蟹各買100元錢,平均每公斤多少錢?應用統計學解:各買1公斤:
(元/公斤)各買100元錢:
(元/公斤)應用統計學
代表總體各單位的標志值在單項式數列中,為各組變量值在組距式數列中,為組中值Mi為第i組的標志總量加權調和平均數調和平均數調和平均數是各個變量值的倒數的算術平均數的倒數。簡單調和平均數應用統計學算術平均數和調和平均數的聯系和區別:聯系:調和平均數是算術平均數的變形,都是總體標志總量除以總體單位總量。區別:已知各組單位數,用算術平均數;已知各組標志總量,用調和平均數。應用統計學實例:
一個人開車行駛100公里,其中以40公里/小時的速度行駛了20公里,以50公里/小時的速度行駛了38公里,以60公里/小時的速度行駛了42公里,求平均速度。解:用調和平均數應用統計學
為第i個觀測值
為第i個觀測值fi為出現的次數加權幾何平均數3、幾何平均數:幾何平均數是n個數值的乘積的n次方根,在分析經濟現象時,要求變量值間在經濟內容上具有連乘積關系。簡單幾何平均數應用統計學實例:
一位投資者購持有一種股票,最近四年的年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內的平均收益率。
幾何平均:應用統計學
中位數是將總體單位的某一數量標志的各個數值按其大小順序排列,處于中間位置的標志值。
眾數是指總體中最常見的標志值,亦即在研究和考察某種社會經濟現象時,重復次數最多的標志值。4、中位數、眾數及分位數:中位數眾數分位數
分位數按順序排列的一組數據被劃分為若干相等部分的分割點的數值。分類:四分位數、十分位數、百分位數
應用統計學實例:甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)累計頻數
非常不滿意不滿意一般滿意非常滿意2410893453024132225270300合計300—
QL
=不滿意
QU
=一般解:中位數=一般
眾數=不滿意應用統計學眾數、中位數與算術平均數的關系:眾數不受極端值影響具有不唯一性數據分布偏斜程度較大時應用中位數不受極端值影響數據分布偏斜程度較大時應用平均數易受極端值影響數學性質優良數據對稱分布或接近對稱分布時應用舉例:競賽中的評分規則應用統計學數據類型和所適用的集中趨勢測度值數據類型分類數據順序數據定距數據定比數據適用的測度值眾數中位數算術平均數算術平均數—四分位數眾數幾何平均數—眾數中位數
中位數——四分位數四分位數———眾數應用統計學四、平均指標的運用:
必須在同質總體中應用平均指標根據數據特征及說明對象選擇合適的平均指標總平均數要和組平均數結合運用應用統計學第四節
離中趨勢測度應用統計學
一、變異指標的概念
變異指標是反映總體各單位標志值分布特征的重要綜合指標,它反映總體各單位標志值的差異大小或程度,也就是反
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論