




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
社會調查與統計閩江學院1標題添加點擊此處輸入相關文本內容點擊此處輸入相關文本內容總體概述點擊此處輸入相關文本內容標題添加點擊此處輸入相關文本內容第一章緒論第一節社會調查概念及其特點
一、社會調查的定義1、含義:
社會調查就是人們有目的有意識地通過社會現象的考察,了解和分析、研究,來認識社會生活本質及其發展規律的一種自覺認識活動。它包含如下四層意思:(1)社會調查是一種自覺認識活動。(2)社會調查對象是社會自身。(3)社會調查的方法,包括考察、了解社會實際情況的各種感性認識方法,又包括對搜集的感性材料進行統計分析和思維加工的各種理性認識方法。(4)社會調查的目的是了解社會生活的真實情況,研究各種社會現象的因果關系,探索社會生活本質及其發展規律,并進而尋求改造社會、建設社會的道路和方法。二、社會調查的特點
1、實踐性。社會調查過程中離不開人的實踐活動。(1)要深入實際的社會生活掌握第一手材料。(2)社會調查研究的課程來源于現實社會,研究結果要服務于現實社會。(3)社會調查的方法與技術具有極強的操作性。2、客觀性。在進行社會調查時,必須持實事求是、一切從實際出發的科學態度。
3、綜合性。(1)研究視角的綜合性。放開視野,綜觀全局。(2)運用知識的綜合性。(3)研究方法的多樣性。第二節社會調查的任務和功能一、社會調查目的和任務
1、認識社會現象的真實情況(客觀描述社會事實)。
2、研究社會現象的客觀原因(科學地解釋社會事實)。
3、探索社會現象的本質及其發展規律(預測發展趨勢)。
4、尋求改造舊社會、建設新社會的道路和方法(對策研究)。
二、社會調查的功能
1、社會調查是正確認識社會的基本途徑。
2、社會調查是科學管理社會的重要前提3、社會調查是進行思想教育,提高人的思想水平和認識能力的有效手段。4、社會調查是端正覺和學風的法寶。
第三節社會調查的理論指導
一、社會調查的理論基礎
科學的社會調查是一種認識方法,也是一種工作方法。它的理論基礎是辯證唯物主義和歷史唯物主義的認識論和群眾路線。
辯證唯物主義和歷史唯物主義的認識論認為,人類的認識活動有3個要素即認識主體、認識客體和認識過程。作為科學認識方法的社會調查,也有三個不可缺少的要素,即調查主體、調查客體和調查過程。
從群眾中來,到群眾中去,是辯證唯物主義和歷史唯物主義群眾路線的基本要點。也是一種科學工作方法。
二、社會調查的指導思想科學的社會調查必須以科學理論為指導。這里的科學理論主要包括兩個層次:一得科學的世界觀和方法論;二是與調查課題內容相聯系的各專門學科的科學理論。科學的世界觀和方法論——辯證唯物主義和歷史唯物主義具有普遍的指導意義。因此它應該成為科學社會調查的根本指導思想。
辯證唯物主義和歷史唯物主義的內容極為豐富,其中實事求是觀點和群眾觀點對社會調查具有特別重要的指導意義。實事求是是辯證唯物主義和歷史唯物主義的基本原則,也是科學社會調查的根本指導思想。在社會調查中,要堅持實事求是觀點,必須克服形形色色的主觀主義。群眾觀點是辯證唯物主義和歷史唯物主義的基本觀點,也是科學社會調查重要指導思想。在社會調查中堅持群眾觀點,就要相信群眾,依靠群眾,虛心向群眾學習,堅持群眾觀點,就要對人民群眾負責,全心全意為人民服務。
第四節社會調查學是一門方法性學科一、社會調查學的研究對象和知識體系社會調查學的研究對象,就是社會調查活動本身。社會調查作為人們有目的、有意識的一種認識活動,它涉及多方面的問題。我們可以把社會調查學定義為:關于人們自覺認識社會的理論、方法和過程的科學。作為一門獨立的學科,社會調查學有自己的知識體系和豐富內容。具體說,它包括社會調查的對象和任務、目的和意義、理論基礎和指導思想、起源和歷史發展、一般程序和主要環節、基本類型和主要方法、主要手段和技術等等。其中社會調查的方法是這門學科的主要內容。社會調查的方法,大體上可分為兩類:一類是搜集材料的方法,主要是感性認識方法,它包括文獻調查、實地觀察、訪問調查、集體訪談、問卷調查、實驗調查和蹲點調查等方法;一類是研究材料的方法,主要是理性認識方法,它既包括描述統計、推斷統計等宣研究方法,又包括邏輯思維、辯證思維等定性研究方法。
二、社會調查學的主要特點(1)社會調查是一門方法性學科。社會調查是一種認識方法,同時也是一種工作方法。社會調查學研究的方法一般可分為三個層次:一是科學方法論,它是最高層次的方法,包括哲學方法和各社會科學的研究方法;二是社會調查基本方法,它是中間層次的方法,包括社會調查的一般程序、調查社會信息的方法和研究社會信息的方法;三是設計、使用調研工具的方法和技術,它是最低層次的方法,包括設計、使用調查工具的方法和技術,以及設計、使用研究工具的方法和技術。(2)社會調查學是一門綜合性學科。這里說的綜合性包括:一是知識的綜合性。二是服務的綜合性。(3)社會調查學是一門實踐性的學科。具體指:內容的實踐性和服務的實踐性。三、學習社會調查學的目的和方法
1、目的(1)提高社會調查的自覺性(2)提高社會調查的科學性2、方法(1)需要廣博的知識(2)必須密切聯系實際。第二章社會調查的歷史發展第一節古代的社會調查所謂古代社會調查,是指前資本主義時代的社會調查,包括奴隸制時代的社會調查和封建制時代的社會調查。一、古代社會調查的產生古代社會調查萌芽于社會末期。據《易·系辭下》記載:“上古結繩而治,后世圣人易之以書契”。這里的“結繩”和“書契”,都是對當時重大社會事件的記載。從一定意義上說,它就是古代社會調查的雛形。然而作為一種自覺的認識活動,社會調查起源于奴隸社會初期。因為,人類進入奴隸社會后,奴隸主階級出于統治的需要要對社會資源進行調查,而這一時期文字的發明及腦力勞動者的產生也為社會調查的產生提供了現實的可能。因此古代社會調查的產生于奴隸社會初期不是偶然的,而是社會歷史發展的必然。二、古代社會調查的特點1、主要是為奴隸主階級或封建主階級服務。2、沒有自覺的、系統的理論作指導。3、調查方法原始、簡單、直觀。4、沒有專門調查機構和調查人員。5、在調查者與被調查者的勞動人民之間往往存在著對抗性矛盾。第二節近代以來歐美發達國家的社會調查一、近代社會調查產生的社會歷史條件近代社會調查產生于18、19世紀的西歐。當時資本主義生產關系已在西歐各主要國家占據統治地位。隨著資本主義經濟迅速發展,資本主義生產方式固有矛盾日益暴露,社會問題層出不窮。為此各個階級的學者、社會活動家進行了許多社會調查,探求解決問題的對策,并在此基礎上逐漸形成了具有系統化、學科化特點的社會調查方法。18、19世紀西歐的社會歷史條件,也為近代社會調查的產生提供了現實可能。當時,在西歐各主要國家,資產階級已取得統治地位,無產階級也登上了歷史舞臺,爭取到了一定的民主權利,而且各國逐漸建立了統一的國內市場,開辟了日益廣闊的國際市場,開闊了人們的視野,使人們有可能在世界范圍內對某些社會現象進行廣泛調查和對比研究。同時,這個時期的自然科學,在觀察和實驗基礎上已從“收集材料的科學”發展成為“整理材料的科學”。哲學和社會科學的許多領域也有了巨大進步。這些發展都為社會調查提供了系統化、學科化的理論基礎和指導思想。。二、近代歐美等發達國家的社會調查
(一)近代歐美等國社會調查的類型1、行政性社會調查。它主要是政府或議會為了管理國家和社會而進行的調查。2、學術性社會調查。它主要是統計學、經濟學、社會學等方面的學者為了學術研究而做的社會調查。3、應用性社會調查。它主要是由不同類型調查主體,根據各自需要而開展的社會調查,主要有以下幾種類型:(1)社會改良調查。主要是一些社會改良家、慈善家或學者為改良某些社會問題而展開的調查。(2)民意調查。主要是一些報刊和調研機構為了解民意而進行的調查。(3)市場調查。主要是一些企業、商業性調研機構和政府商貿部門為了解市場行情、預測市場變化而進行的調查。(二)近代歐美等國社會調查的特點與古代社會調查相比而言,近代歐美發達國家社會調查的特點有:1、調查目的不同。它主要為資產階級、為鞏固或改良資本主義制度服務。2、調查的自覺程度不同。它一般都有一定的理論作為指導思想。3、調查研究方法不同。它有一套比較系統的調查研究方法。4、調查人員和機構不同。它已形成了一些專門的調查機構和人員。三、現代社會調查的發展趨勢現代社會調查,是指20世紀以來,特別是二戰后的社會調查。隨著經濟、政治、經濟、文化的發展,現代歐美等發達國家社會調查出現了一些新的發展趨勢:(一)廣泛化趨勢它主要表現為:1、調查主體日益廣泛。2、調查內容日益多樣3、調查范圍日益擴大(二)科學化趨勢它的主要表現是社會調查方法日益程序化、規范化、數量化和精確化。(三)現代化趨勢現代化科技在調查中的應用,社會調查的應用范圍和科學性、精確度達到新高度。(四)專業化趨勢調查主體日益專業化,獨立的營業性調研機構不斷涌現和日益壯大。第三節馬克思主義的社會調查一、馬克思、恩格斯與社會調查二、列寧與社會調查三、馬克思主義社會調查的基本特征1、社會調查目的不同。
2、社會調查指導思想不同3、社會調查的重點內容不同。4、調查者的身份和態度不同。第四節20世紀以來中國的社會調查一、半殖民地半封建中國的社會調查在半殖民地半封建的中國,由于政府腐敗無能,軍閥混戰,再加上缺乏科學的調查方法,因而由政府主持的為數有限的社會調查大多缺乏科學價值而且往往半途而廢。二、中國共產黨和毛澤東的社會調查三、改革開放以來的社會調查這個時期,中國社會調查具有以下幾個特點:1、思想上更加重視2、理論上更另徹底3、方法上更加科學4、組織上更加健全5、工作上更加開展。第三章社會調查的程序和準備第一節社會調查的一般程序一、準備階段準備階段是社會調查的起始階段,該階段的主要任務是:確定調查任務,設計調查方案,組織調查隊伍。確定調查任務包括選擇調查課題,進行初步勃勃和提出研究假設等項工作。設計調查方案包括:調查指標的設計、調查總體方案的設計、對調查方案進行可行性研究組織調查隊伍,主要包括調查人員的選擇與培訓,建立調查人員的管理機構,制定調查紀律和注意事項,籌備供調查人員使用的各種物資。二、調查階段調查階段是社會調查方案的執行,其主要任務是根據調查方案中確定的調查方法,以及調查設計的具體要求,進入現場搜集各方面的資料。三、研究階段調查階段結束后,就進入研究階段,該階段的主要任務是:鑒別整理資料進行統計分析和開展理論研究。四、總結階段總結階段的主要任務:撰寫調查報告、總結調查工作和評估調查結果。第二節調查課題的選擇一、調查課題及其類型1、概念:調查課題就是社會調查所要研究、說明、或回答的社會問題。2、類型:按照不同標準,調查課題可分為不同類別按照調查目的;分為理論性課題和應用性課題按照調查深度;分為描述性課題(對社會真實情況進行具體描寫或敘述的課題,回答是什么)、因果性課題(揭示兩種或兩種以上社會現象之間因果關系的課題,回答為什么)、預測性課題(在說明社會現象及其因果關系基礎上,進一步預測今后發展趨勢的課題,回答將怎樣)。此外按照調查課題的內容可分類綜合性課題和專業性課題。二、選題的重要意義選擇調查課題,決定著社會調查的總方向、總水平。選擇調查課題,決定著社會調查的方案設計,制約著社會調查的全部過程。選擇調查課題,決定著社會調查的成功和調查成果的社會價值。三、正確選題的基本原則1、需要性原則,即根據社會發展的客觀需要選擇調查課題。2、科學性原則,即在科學理論指導下選擇調查課題。3、創造性原則,即按照新穎、獨特和先進的要求選擇調查課題。4、可行性原則,即根據調查主體和客體的現實條件選擇調查課題。四、課題形成的途徑1、查閱文獻資料2、向有關專家咨詢3、實地考察第三節建立研究假設一、假設及其在社會調查中的作用1、概念假設亦稱假說,它是根據已有的事實材料和科學原理,對未知事實及其規律提出的一種不完備的、尚待驗證的設想與推測。一項假設必須要符合以下幾個條件:它必須以一定的客觀事實為依據,而不能與已知的客觀事實相違背它必須以一定的科學理論為指導,而不能與被實踐反復證明了的科學原理相違背。它必須可以被實踐證實或證偽,而不能是一個無法被實踐檢驗的虛幻設想或推測假設必須具有一定的想象力。2、作用(1)假設是設計調查方案的指南。(2)假設是搜集社會信息的向導(3)假設是探索客觀真理的橋梁二、假設的類型與表達方式1、類型假設作為對某種社會現象的推測性說明,總是通過兩個或兩個以上的概念之間的關系來表達的,其類型有:(1)一元假設(X)(2)二元假設(XY)(3)多元假設(XYZ)2、表達方式(1)函數式(2)條件式(3)差異式3、形成假設的方法(1)歸納推理法(2)邏輯推理法(3)類比推理法第四節解釋概念一、解釋概念的意義1、解釋概念的含義:所謂解釋概念,是指對調查中使用的主要概念給予明確的定義,并確定其邊界和測量指標的一種設計工作。2、解釋概念的意義:(1)它能使不同的研究對象對同一個概念有統一而明確的理解,可以避免人們對概念的不同理解或在檢驗研究結果時發生誤解。(2)能夠進一步明確調查對象和調查范圍。(3)能使我們對研究對象的具體觀察和測量成為可能。二、概念的操作化解釋概念,必須掌握下定義的方法。對概念的定義有兩種,一種是抽象定義,一種是操作定義。1、抽象定義抽象定義是對某類事物或現象共同本質的概括。在社會調查中,抽象定義的作用在于揭示事物的內涵,概括事物的共同本質,并把它與其他對象區別開來。但是,抽象定義沒有解決在調查過程中如何實際操作的問題。因此,對比較抽象的概念還必須做出明確的操作定義。2、操作定義所謂操作定義,是指用可感知、可量度的事物對抽象定義作出界定或說明的方法,也即用變量和調查指標來反映抽象概念的方法。設計操作定義,一般可采用以下兩種方法:(1)用確定具體事物邊界的方法來設計操作定義。(2)用可直接感知和度量的社會事實來設計操作定義。操作化:也稱具體化或分解化,是指在社會調查研究中,將抽象的概念和命題逐步分解為可測量的指標與可被實際調查資料,驗證命題的過程。它是以復雜的社會現象進行定量研究的一種方法。三、變量1、概念:在社會研究中的所謂變量,是指可具體觀察和測量的、其取值是可變的經驗概念。而那些只有一個固定不變的值的概念,則叫做常量。變量是概念,但概念不一定是變量。識別變量的主要依據是:(1)它是一個代表具體事物和現象的概念,這類事物和現象是可以憑經驗具體觀察和測量的,而那些無法直接觀察和測量的抽象概念如價值觀、道德、法律等則不是變量。(2)它有按一定標準的不同取值。2、類型根據一組互有關聯的變量之間的因果關系來區分,可以把變量分為自變量和因變量兩類。引起其他變量產生變化的變量稱為自變量,它通常用大寫英文字母X來表示。隨著其他變量的變化而變化的變量稱為因變量,它通常用大寫英文字母Y來表示。根據變量取值的是否具有連續性,可以將變量分為離散(型)變量和連續(型)變量兩類。離散(型)變量是指其取值只有有限的類別的變量(只能取整數值)。連續變量是指其取值可以是某一區間內的任何一個值的變量根據所使用的社會測量尺度的不同,又可以將變量分為定類變量、定序變量、定距變量、定比變量四種類型。
第五節調查總體方案的設計一、調查總體方案的內容第一,確定調查目標。第二,選擇調查單位。第三,選擇調查方法。如何選擇最有效的調查方法,就成為調查總體方案設計中的一個重要內容。第四,調查工具的使用。調查工具包括兩大類:一類是器具性的,如錄像機、攝像機、照相機、錄音機、計算機、交通工具等。另一類是文書性的,如訪問提綱、問卷表、統計表、卡片等。第五,調查人員的組織。第六,調查經費的籌措。第七,調查時間的安排。第八,其它有關工作的安排。包括利用報紙雜志、廣播電視等各種宣傳工具,對調查工作的重要性和必要性進行宣傳以引起人們對調查工作的注意等等。二、制定調查總體方案的原則1.可行性原則2.完整性原則3.時效性原則4.經濟性原則5.留有余地的原則三、調查方案的可行性研究第一,邏輯分析方法。即用邏輯學的方法來檢驗調查設計的可行性。第二,經驗判斷法。即用以往的實踐經驗來判斷調查設計的可行性。第三,試驗調查法。即通過小規模的實地調查來檢驗調查設計的可行性,并根據試驗調查的結果來修改和完善原設計的方案。第四章社會測量
第一節社會測量的概念與特征一、社會測量的概念社會測量是指依據一定的規則,將研究對象所具有的屬性和特征用一組符號或數字表示出來的一種方法。社會測量有四個基本要素:第一,測量客體。第二,測量內容。第三,測量規則。第四,測量工具。二、社會測量的特點首先表現為其標準化和精確化程度較低其次,社會測量受人為因素的影響較大。馬克思說過:“一門科學只有在成功地運用了數學時,才算達到了真正完善的地步”。只有對社會現象的量的數據進行有效的測量和科學的分析,才有可能對復雜多樣的社會現象進行深入的研究,發現其本質及其規律性。第二節社會測量的尺度一、定類尺度定類測量尺度,又被稱為定名測量尺度它是對測量對象的屬性或特征的類別加以鑒別的一種測量方法。事實上就是將調查的事物加以分類。進行定類測量時必須遵循如下原則:第一,由于定類測量實際上是分類系統,所以它必須有兩個以上的變量值。第二,這些變量必須相互排斥,也就是說,同一個變量值只能代表性質或特性相同的事物,只能符合一種類型。如對性別進行分類時,被測定者非男即女,不可能同屬兩類。第三,測定的對象有一個合適的類型,不能沒有歸屬。定類測量是社會測量中最簡單、最基本的測量類型,測量水平和層次最低。二、定序尺度定序測量尺度,又稱等級和順序測量尺度。它是指對測量對象的屬性和特征的類別進行鑒別并能比較類別大小的一種測量方法。這種方法能把測定對象的特征和屬性按高低、強弱、大小、多少的程度排列成序。這種排列順序并不是人們的主觀愿望和隨心所欲,而是由測定對象本身固有的特征所決定的。在測量的精確度上,定序尺度比定類尺度要高一個層次。三、定距尺度定距測量尺度,是一種能夠測定事物的屬性和特征的差別程度的測量方法。它除了能夠確定變值的類別以及變值之間的順序外,還能進一步計算各變值之間相差的實際數值。四、定比尺度定比測量尺度又稱為比率或比例測量尺度,是一種能夠測定事物間比例、倍數關系的測量尺度。這種測量尺度除了具有前面三種變量的所有特征外,還能對變量值進行乘除法的運算,因而是四種測量尺度中測量層次最高的一種尺度。為了使這種測量具有實際意義,定比測量要求有一個絕對的、固定的而非任意規定的零點。有沒有這個絕對零點存在,是定比測量與定距測量的唯一區別。定類尺度、定序尺度、定距尺度、定比尺度,是社會測量中最常見的四種類型。它們之間存在著不可分割的聯系。第一,從定類——定序——定距——定比尺度,層次依次上升,趨向復雜,水平也不斷提高。第二,每一較高層次的測量尺度,都是以較低層次測量尺度為基礎的。所以,每一高層次的測量,都包含著低層次測量尺度的全部特征。一、調查指標及其設計原則1、調查指標的概念調查指標是指在調查過程中用來反映社會現象的類別、狀態、規模、水平等特性的項目及其測量標準。它由兩部分構成,其一是指標名稱,它反映指標的內容和所屬范圍;其二是指標值,具體說明指標的測量方法及標準。一個完整的指標就是這兩部分內容的統一。根據測量尺度的不同,調查指標可分為定類、定序、定距和定比四類指標。第三節社會測量指標2、調查指標的設計原則第一,設計的調查指標必須符合客觀實際,堅持科學性、客觀性原則。第二,調查指標的設計要全面、正確地反映調查對象的整體,達到完備性和互斥性。第三,調查指標的設計應該有明確的定義,定量指標應該有統一的計算方法,以做到準確無誤。第四,調查指標的設計要力求簡明。第五,調查指標的設計一定要充分考慮實際調查的可能性。二、社會指標與社會指標體系1、社會指標概念社會指標是指反映社會發展狀況及其特征的統計指標。社會指標既是對社會過程和調查研究成果的某種概括和總結,也為系統地、科學地進行社會調查提供一定的指南和依據。2、社會指標與調查指標的聯系與區別其聯系表現在:社會指標是通過調查指標而發展、完善的,反過來,社會指標又可作為制訂調查指標的依據和指南。其區別則表現在:社會指標是通過系統的調查研究和理論研究而制定出來的,其測量規則的標準化程度較高,它主要用于衡量、監測宏觀社會現象。而調查指標是研究人員在某項調查中選擇和制定出來的,其標準化和精確化程度較低,它主要用于對微觀社會現象的測量。3.社會指標的特點第一,具體性。由于社會指標的本質在于給社會現象以明確的規定性,因而它在再現社會現象時,不是一般的、籠統的,而是具體的、明確的。第二,定量性。對社會現象的反映或評價既可以定性也可以定量,社會指標更傾向于在定性的基礎上進行定量分析。第三,替代性。由于社會狀況、社會現象、社會活動和社會變遷等現象難以直接進行測量,它們必須借用社會指標才具有可測性,因此,替代性是社會指標的一個重要特點。第四,時間性。社會指標是對社會某一個時期的某一社會現象的反映,因而其數據都是暫時的,隨著時間的推移,社會指標所反映的各種數據也會失去效用。4、社會指標體系由若干有內在聯系的社會指標綜合組成的社會指標又稱社會指標體系。社會指標體系一般包括社會生活指標和社會發展指標兩大類,它基本上不包括經濟統計指標,它反映的是除經濟以外的主要社會現象。第四節社會測量的信度和效度一、社會測量的信度1、概念社會測量的信度是指社會測量活動中測量主體運用某一確定的測量手段重復測量同一對象時測量值的前后一致程度,即測量結果反映測量對象實際情況的可靠性程度。2、類型(1)復查信度。所謂復查信度,是指在第一次調查之后,經過一段時間,再對同一對象進行復查,然后對兩次不同時間的調查結果進行分析比較,求出相同項目兩次回答值的相關系數。(2)復本信度。即研究者設計兩套測量工具以測定同一主題現象,復本信度主要應用于問卷調查或訪問調查。(3)折半信度。復本信度、復查信度的共同特點都是必須經過兩次調查才能檢驗其信度,在一種調查沒有復本且只能實施一次的情況下,通常采用折半法來估計測量的信度。3、影響社會調查信度的因素主要有:(1)抽樣調查所依據的樣本容量太小。(2)抽樣方法不當(或典型的選擇不當),造成較大的抽樣誤差。(3)所使用的測量工具不當或不全面。二、社會測量的效度1、概念社會測量的效度,是指在社會測量活動中,社會測量主體運用某一確定的測量手段對測量客體進行考察后,他所取得的測量結果對說明該測量客體某方面屬性的恰當、準確、有效的程度。它有兩層含義:(1)測量對象是否是所要測量的變量;(2)被測量的變量的結果是否接近真實值。如果二者均一致與接近,則該計量的效度較高。例如,測驗學生某科學習成績,如果所出考試題目不能真實地反映出學生的整個學習情況,或者測驗結果遠遠低于或高于學生現實水平,那么,這種測驗就是無效的,是不能準確地反映學生學習情況的。2、類型1、內容效度。即測量內容的適合性和相符性。2、標準效度。即用幾種不同的測量方式或不同指標對同一變量進行測量時,將其中的一種方式或指標作為標準,而其它的方式或指標則與這個標準作比較,如果感到其它的方式或指標與標準的方式或指標具有相同的效果,則其它的方式及指標也具有標準效度。3、結構效度,所謂結構效度是指通過對某種理論概念或特質的測量結構的考察,來驗證測量對理論概念的衡量程度。3、影響社會調查效度的因素(1)調查內容不能準確地反映調查目的。即跟調查目的關系不大甚至無關的內容較多,而跟調查目的密切相關的內容又考慮不周全。(2)調查問題提得太籠統,調查中使用的概念不清楚或者超出被調查人的經驗范圍,在這些情況下往往會收集到無效的資料。三、信度與效度的關系信度與效度是既相互聯系又相互區別的。效度要以信度為基礎,有效的測量必須是可信的測量,不可信的測量必定是無效的。但是,信度高只是測量所要達到的必要條件,還不是其充分條件。一個信度高的調查并不等于效度也高。信度只解釋資料的真實可靠性,并不能解釋這項資料與研究對象是否相關以及相關的程度多大。一個優良的測量指標必須同時具有效度和信度,是效度和信度的有機統一第五章社會調查的基本類型
第一節普查
一、普查的涵義、特點與應用范圍1、涵義普查是指為了掌握被研究對象的總體狀況,對全體被研究對象逐個進行調查的一種調查方式。普查又稱全面調查,但并不是所有全面調查都可以稱為普查。普查一般是范圍較廣、規模較大的全面調查。2、特點:(1)調查范圍廣、調查對象多。(2)工作量大,代價高。(3)時間性強。(4)調查的資料全面,但調查的內容和項目比較簡單。3、應用范圍普查的特點決定了它的應用范圍比較狹窄。它主要應用于較大范圍的對社會基本情況的調查了解。由于普查是一項龐大的調查工程,故一般只能由政府牽頭抓,才可順利進行。二、普查的方法與程序1、普查的具體方法(1)逐級普查。(2)快速普查。2、普查的程序(1)準備工作。(2)調查登記。(3)匯總整理并總結公布。一、典型調查的涵義、特點1、涵義典型調查法是指在對調查對象進行初步分析的基礎上,選取若干具有代表性的對象作典型,對其進行周密系統的調查,以認識調查對象的總體情況。這種方法,也就是毛澤東所說的“解剖麻雀”的方法。第二節典型調查2、特點(1)典型調查法是一種定性調查。(2)典型調查是根據調查者的主觀判斷,選擇少數具有代表性的單位進行的調查。(3)典型調查是一種面對面的直接調查。(4)典型調查方便、靈活,節省人力、物力。二、典型調查的步驟(1)對調查總體進行面上的初步研究。(2)選擇有代表性的典型。(3)深入調查,詳細占有第一手資料,典型調查實施前,必須根據調查目的設計詳盡的調查提綱或調查表。(4)細致加工資料,適當做出推論。第三節個案調查一、個案調查的涵義與特點1、涵義:所謂個案調查,是指對某個特定的社會單位作深入細致的調查研究的一種調查方法。任何一種社會現象,如一個人、一個家庭、一個團體、一個事件,都可以當作個案來進行詳盡的研究,作出社會診斷,并加以治理。2、特點第一,對特定對象的調查研究比典型調查更為具體、深入、細致。第二,個案調查的目的主要不是用來說明它所能代表的同類事物,而是為了了解和認識個案本身的問題。第三,個案調查法的特點還表現在調查時間、活動安排上有一定彈性,研究者可采取的方法也比較多樣,便于靈活掌握。3、應用范圍(1)廣泛應用于社會、經濟活動的調查中。(2)應用于同社會福利工作有關的專門機關和部門。(3)應用于對社會生活中的各種社會問題進行專門性的調查研究,以把握有關問題的性質、作用、現狀和發展趨向等,消除社會變革進程中的障礙,促進社會協調發展。二、個案調查的步驟1、確定個案。2、盡可能全面地收集有關個案的各種資料。3、在取得調查資料的基礎上,進行分析和研究,找出問題的癥結所在,作出客觀的社會診斷。4、針對存在的問題,提出治理的建議或方案,進行社會治療。第六章訪談法一、訪談法的涵義、特點1、涵義訪談法,也稱訪問法。是指調查員通過有計劃地與被調查對象進行口頭交談,以了解有關社會實際情況的一種方法。2、特點:第一,可以進行雙向溝通。第二,控制性強。第三,適用性廣。第四,成功率高。訪談法在其應用過程中既有其優點,也有其局限性。它的局限性表現在:第一,受調查員影響較大。第二,匿名性差。第三,調查成本大。二、訪談法的程序與技巧(一)、訪談前的準備第一,要選擇適當的訪談方法,掌握與調查內容有關的知識。第二,要盡可能了解被訪者的有關情況,并將調查主題事先通知調查對象。第三,要選好訪談的具體時間、地點和場合。(二)、進入訪談現場訪談是人與人之間社會互動的一種形式,對于彼此陌生的人來講,一開始的接觸是相當困難的,有道是“萬事開頭難”。入戶調查,首先碰到的就是如何進門的問題。訪問員與被訪者接觸后,必須采取各種有效的方法與被訪者接近。一般說來,接近被訪者有幾種可供選擇的方式。一是正面接近。二是求同接近。三是友好接近。即從關懷幫助被訪者入手,以聯絡感情、建立信任。四是自然接近。(三)、談話與記錄技術1、談話技術2、記錄技術(四)、引導與追問技術(五)、結束訪談第七章觀察法與文獻法一、觀察法的涵義、特點觀察法又稱實地觀察法,是指調查者帶有明確目的,憑借自己的感覺器官及其輔助工具,直接從社會生活的現場收集資料的調查研究方法。觀察法具有如下幾個特點:1、它是一種自覺的、有目的的觀察活動。2、它是一種在自然狀態下的現場調查。3、調查的手段主要靠人的眼睛、耳朵等感覺器官以及它們的延伸物,如照相機、攝影機、錄音機等儀器。4、觀察法觀察到的主要是被調查對象的外顯行為。二、文獻法的涵義、特點文獻法是指根據一定的調查目的而進行的搜集和分析書面或聲像資料的方法。文獻是人們專門建立起來儲存與傳遞信息的載體,是人們從事各種社會活動的記錄。相對于其他的收集資料的方法,文獻法有一些比較突出的特點:第一,間接性。第二,穩定性。第三,效率高,花費少。第八章問卷法
第一節問卷法的特點和分類一、問卷法的特點問卷法是指調查者通過統一設計的問卷來向被調查者了解情況,征詢意見的一種資料收集方法。1、問卷調查法的優點首先,問卷調查可以突破空間的限制,在大范圍內對眾多的調查對象同時進行調查。第二,問卷調查有利于對調查資料進行定量分析和研究。第三,問卷調查可以避免主觀偏見的干擾。第四,問卷調查具有很好的匿名性。第五,問卷調查可以節約人力、財力和時間。2、問卷調查法的弱點第一,問卷調查法只能獲得有限的書面信息。第二,問卷調查法不適合于文化程度普遍較低的群體。第三,問卷的回收率和有效率比較低。由于問卷調查法有上述的優點和不足,因此,它有自身所適用的范圍。從被調查對象所在的地域看,在城市中比在農村中適用,在大城市比在小城市適用;從被調查對象的職業看,在專業技術人員、公務員中比在商業人員和工人中適用。二、問卷調查法的基本類型按照問卷調查是否要由被調查者自己填答來區分,可以將問卷調查分為代填問卷和自填問卷兩類。代填問卷是調查者按照統一設計的問卷向被調查者當面提出問題,然后再由調查者根據被調查者的口頭回答來填寫問卷。代填問卷實際上是一種結構式訪問,又稱訪問問卷。自填問卷一般是通過報刊發行、郵局傳遞或派人送發等方式將問卷交到被調查者手中,并由被調查者自行填寫,然后再返回調查者手里。自填問卷分為報刊問卷、郵寄問卷和送發問卷、網絡問卷四種。第二節問卷設計的原則與步驟一、問卷的結構1、封面信封面信是一封給被調查者的短信,主要是向被調查者介紹和說明調查者的身份、調查的內容、調查的目的和意義等等。2、指導語指導語是指用來指導被調查者填寫問卷的一組說明,也稱“填表說明”,其作用是對填表的方法、要求、注意事項等作一個總的說明。指導語的語言要簡明易懂,使回答者懂得如何填寫。3、問題和答案問題和答案是問卷的主體4、編碼及其他資料在一些大型的統計調查中,為了將調查者的回答轉換成數字,以便錄入計算機進行處理和定量分析,往往需要對回答結果進行編碼。所謂編碼,是指給每一個問題及其答案編上數碼,目的在于方便地把問題和答案交由計算機處理。二、問卷設計的基本原則1、簡明性原則2、適應性原則3、目的性原則4、針對性原則三、問卷設計的主要步驟1、摸底探索階段所謂摸底探索,是指調查問卷設計之前,要先熟悉、了解被調查對象的基本情況,以便對問卷設計中遇到的各種問題的提法和可能的回答有一個初步的考慮。2、設計問卷的初稿經過摸底探索工作,對所要調查的各種問題及其可能的答案有了初步印象,就可以動手設計問卷初稿了。設計問卷一般采用如下兩種具體方法。第一種方法:卡片法。第二種方法:框圖法。3、問卷的試用與修改任何調查問卷的設計都不可能一次成功,往往要經過多次反復修改。問卷初稿設計出來之后、必須經過試用和修改這兩個環節,才能用于正式調查。問卷初稿的試用有兩種方法:第一種方法:客觀檢驗法。第二種方法:主觀評價法。一般來說,小型調查大多采用主觀評價法,大型調查大多采用客觀檢驗法,有的調查則兩種方法一起采用。四、問題及答案的設計1、問題形式的設計在調查問卷中,問題的形式可分為開放式問題與封閉式問題兩種。所謂開放式問題,是指對問題的回答不提供任何具體的答案,而由被調查者自由填寫。所謂封閉式問題,是指將問題的一切可能答案或幾種主要可能答案全部列出,然后由被調查者從中選取一種或幾種答案作為自己的回答,被調查者一般不能作這些答案之外的回答。封閉式問題有如下幾種方式:兩項式(又稱是否式)。即只有兩種答案的回答方式:多項式。即可供選擇的答案在兩個以上,被調查者或只選填其中一個,或可以選填其中幾個答案。順序填寫式或等級式。即列出多種答案,被調查者填寫答案時要求列出先后順序或不同等級。矩陣式或表格式。即將同一類型的若干個問題集中在一起,共用一組答案,從而構成一個系列的表達方式。后續性回答,也稱相倚問題。2、問題設計的要求(1)問卷的問題必須圍繞假設進行設計。(2)問題應具體、明確,不能提抽象的、籠統的問題。(3)要避免提復合性問題。(4)問題必須適合被調查者的特點,盡量做到通俗易懂。(5)提問要避免傾向性和誘導性。(6)不要直接提具敏感性或威脅性的問題。3、問題的數目和順序問卷中各種問題的先后順序,一般應按照如下原則安排:(1)先較易回答的問題,后較難回答的問題;先事實方面的問題,后觀念、態度方面的問題;先閉合式問題,后開放式問題。(2)同類性質的問題應排列在一起,以利于被調查者的思考。(3)可以互相檢驗的問題必須分隔開,不能連在一起,否則就起不到互相檢驗和互相印證的作用。4、答案的設計(1)答案的設計應符合實際情況。(2)答案的設計要具有窮盡性和互斥性。所謂窮盡性,是指答案包括了所有可能的情況,不能有遺漏。所謂互斥性是指答案相互之間不能相互重疊或相互包含。(3)答案只能按一個標準分類。(4)程度式答案應按一定順序排列,前后須對稱。第三節問卷的發放與回收一、問卷發放時應注意的問題問卷發放時必須關注兩個問題:一是要有利于提高問卷的填答質量,二是要有利于提高問卷的回收率。二、如何提高問卷的回收率問卷回收時要抓好兩個環節,即問卷填寫情況的當場檢查(這里主要指送發問卷的情況)和注意提高問卷回收率。第九章描述統計
第一節統計表與統計圖
一、統計表的結構、種類與制作方法1、統計表的結構統計表的結構,一般由標題、橫標目、縱標目、數字四部分組成。標題是統計表的名稱,位于表的頂端中央。它的作用是簡要說明表中統計資料的內容,包括這些資料收集的時間和空間范圍等。橫標目,又稱統計表的主項,是指統計表所要說明的對象,也即分組的名稱或標志值,通常寫在表的左邊。縱標目,又稱統計表的賓項,是指調查指標或統計指標的名稱,通常寫在表的最上面一格。數字,是對資料進行統計整理的結果,是統計表的主體,一般有絕對數、相對數等。每一個數字都必須與橫標目、縱標目一一對應。此外,有些統計表根據需要還在表的下面增列注解,用以表明資料的出處及對表中的有關內容作必要的說明等。2、統計表的類型相對于資料分組的不同類型,統計表按照主項的分組方法可以分為簡單分組表、復合分組表和組距分組表三種類型。簡單分組表,即主項只按一個標志進行分組的統計表。如按年份分組,按性別分組,按家庭人口分組等復合分組表,即主項按兩個或兩個以上標志進行層疊分組的統計表。這種表可以從不同的角度深入反映社會現象的特征。主項和賓項都進行分組的表也可以叫列聯表,或叫互分類表在列聯表中兩個變量的位置(1)如果可以區分哪個是自變量,哪個是因變量,則自變量放在表的上方,因變量放在表的左邊。如考察不同社區的犯罪類型,應將社區變量放在表的上方,而將犯罪類型放在表的左邊。考察領導類型與生產率的關系,應將領導類型放在表的上方,而將生產率變量放在表的左邊。(2)如果較難區分哪一個是自變量,哪一個是因變量,則兩個變量的位置可任意放,通常變量名稱較長的放在表的左邊,名稱較短的放在表的上方。3、頻數表的制作(1)離散變量的情形在1991年4月的《浙江省城鄉廣播電視聽眾觀眾調查訪問問卷》中有一項是了解家庭的人口數量。對于農村—個n=511人樣本,對應的X值為:1,2,0,3,5,4,...如果采用手工整理的形式,我們可以用簡單的記號來對某個X值記數,第一列表示x的可能取值;第三列表示某個x值出現的頻數,第四列表示相對頻率(也叫百分比),最后一行的總計可以用來檢查計算是否準確。家庭人口數(X)記號頻數(f)相對頻率(f/n)12345678910113177313114265381915530.0060.0330.1430.2560.2780.1270.0740.0370.0290.0100.006總計5111.000表2-1家庭人口數的頻數分布表2、連續變量的情形假定我們取到一個樣本得到n=200名華南地區成年男子的身高。對于連續變量x,說它的某一特定值所對應的頻數是多少就不再有意義了,因為我們不可能觀測到誰的身高正好準確地就等于這個特定值,比如說是165.3厘米。為此我們采用分組的形式來進行整理,組(下、上)限組中值記號頻數(f)相對頻率(f/n)148~154154~160160~166166~172172~178178~184184~190151157163169175181187412446456164.02.06.22.32.28.08.02總計2001.00表2—2200名成年男子身高的頻數分布表(單位:厘米)二、統計圖的種類及制作方法1、統計圖的作用(1)表明事物總體的內部結構;(2)表明統計指標在不同時間、地點以及不同條件下的對比關系;(3)反映事物發展變化的過程和趨勢;(4)說明總體單位按某一標志的分布情況;(5)顯示現象之間的相互依存關系。2、統計圖的類型1)條形圖。或稱柱形圖。它可以用來表示事物的大小、內部結構或動態變動等情況,應用范圍十分廣泛。下面我們將連續變量的頻數分布表以直方圖的形式表示出來。和離散情況所不同的是我們這里將橫軸按對應組限來劃分,并且是用長方形的高度而不是線條的長度來表示頻數或相對頻率的。這樣可以提示我們想到觀測數據不只是落在組中值上,而是分布在整個組內。圖2—2給出了表2-2男子身高的直方圖。從中可以發現,身高在169厘米左右的占絕大多數,特別矮或持別高的所占比例都很小。頻數分布表和直方圖在表示相對頻率上是很有用的。例如對于一個身高等160厘米的男子,我們說他是比較矮的,因為比他更矮的不多。具體地說,比他矮的只占8%(從表2-2的最后一列可以看出前2組的對應百分比,即可求得2%+6%=8%)。因此可以說他的身高是在第8個百分位數上。類似地可以說178厘米是比較高的,在第90個百分位數上。(2)圓形圖。圓形圖是以圓形面積的大小或圓內扇形面積的大小來表示事物的大小和事物內部各部分所占比重的圖形。(3)曲線圖。曲線圖是用連續的起伏升降的線條來反映事物的動態或分布特征的一種統計圖。如果是表示組距式分組的次數分配,則先要用條形圖來表示各組的次數,然后將各條形圖的頂端中點(即組中值)用線連接起來,即為分配曲線圖。(4)像形圖。像形圖是以事物本身的形象來表示統計資料的一種統計圖。這種統計圖一般為統計部門統計和公布國民經濟主要指標時采用。其特點是形象、生動、易于理解。第二節集中趨勢所謂集中趨勢,就是指一組數據向某一個典型值或代表值集中的情況。通常用集中趨勢統計值來反映總體在一定時間、地點條件下的一般水平。實際上,集中趨勢的概念就是“代表值”概念。代表集中趨勢的統計值主要有眾數、中位數、和平均數。一、眾數眾數是總體中各單位最普遍出現的標志值,即在一組數據中出現次數最多的數據。眾數可以用直接觀察法和公式計算兩種方法求得。在非連續性資料中,用直接觀察法極為簡便。在對原始數據進行簡化后,編制出來的次數分布表上直接觀察,其次數出現最多的數值即為眾數。在組距式分組資料的情況下求眾數,則以出現次數最多的一組作為眾數組,然后以這組的組中值為眾數。某鄉農戶年收入額的組距數列如下表:次數最多的農戶數是1050,占農戶的35%,因此,這一組的年收入額(3000-4000元)就是眾數組,這組的組中值為,故眾數為,它說明,該鄉年收入額的一般水平為3500元,因為,年收入額為3500元的農戶最多。應當注意的是,計算眾數是有一定條件的。只有在總體單位數較多,且有明顯集中趨勢的資料中才能計算眾數。如果總體單位少,或總體單位雖多,但無明顯集中趨勢,這種資料不適宜計算眾數。如果總體單位足夠多,而且也有集中趨勢,但最多次數的標志值不是一個而是兩個或多個,這時要檢查總體單位是否屬于同一類型,考慮總體單位的同質性問題。此時往往要重新分組后才能找出眾數。二、中位數中位數是指一組數據按大小順序排列情況下處于中間位置上的數值,即第50百分位數點上的值。中位數既然是居中位置的一個數值,其意義就在于中位數的兩邊,各有一半相同個數的變量值。中位數的求法有兩種:(1)在原始資料情況下求中位數。首先將所有數據值按大小順序排列起來,再求全部數據在排列上的中央位置,中間位置的對應變量數值便是中位數。求中央位置,涉及到數據個數n的奇偶性。如果數據的個數是奇數,則中位數便在的位置上。如果數據的個數是偶數,那么中位數的位置就處于中間兩個數值之間,而沒有直接對應的數值。此時一般以中間這兩個數值的平均數作為中位數。有一個n=9的身高樣本:163,170,176,l50,168,171,170,181,179按大小顧序重新排列后為:150,163,168,170,170,17l,176,179,181,那么中間的那個值即第5個順序量=170就是這組數據的中位數。它將分布劃分成了頻數相同的兩半。如果觀測值的個數是偶數比如是8個,那么中位數就定義為是中間兩個數即第和的平均:。比如上面那組數去掉一個170,那么剩下8個數的中位數就是170和171的平均,即中位數(2)在數據資料已經分組的情況下求中位數。這里我們同樣把分組的數據資料分為單項和組距分組兩種情況,兩者計算方法繁簡程度不同。A、由單項分組資料求中位數。用單項分組資料計算中位數的方法與由原始資料計算中位數方法大致相同,也是先求出中間位置,然后找出對應的數值。我們可以先找出中位數的位次,,即中間位置在第38個數值與第39個數值之間。然后順著累計次數找到第38和第39個數據在21歲年齡組內。所以這組數據的中位數就是21歲。它說明21歲是該鄉女青年結婚年齡的代表值。由組距分組資料計算中位數。由組距分組資料計算中位數,應首先用公式確定中位數所在組的位置,然后再用下限公式(也可以用上限公式)計算中位數的值。下限公式為:其中:為中位數,L為中位數所在組的下限值,為累計次數,為比中位數所在組的各組的累計次數,為中位數所在組的次數,為中位數所在組的組距。首先確定中位數所在組的位置,根據公式得,由觀察可知,中位數在第三組內。該組下限為300,次數為250,組距為400-300=100,該組以上各組的累計次數為200。將這些數值代入公式得:中位數的意義在于它位置居中,與平均數相比,它可以消除少數極端數值對代表值的影響。由于中位數的定義依賴于數據的大小順序,因此它不適合于定類變量。對于定序和定距變量,特別是對于分布不很規則的情況,中位數是比較理想的統計量之一。三、平均數算術平均數是一種應用最廣泛的,最能代表某種社會現象在數量方面的集中趨勢的代表值,由于集中趨勢值是反映同一總體中各單位某一數量標志的一般水平,所以,代表一般水平的最好統計值就是把各單位標志數值相加,得到標志值總量,除以總體單位數,即總次數,使各個單位標志值之間的差異相抵消,從而反映出數量標志的一般水平,這樣計算出來的統計平均值就是算術平均數。假定一個樣本的n個觀測值用,表示,那么它們的平均數(均值)等于用樣本含n去除它們的和,即1、簡單算術平均數簡單算術平均數就是直接利用上述公式,求未經分組的原始數據資料的算術平均數。
2、加權算術平均數當使用第二手資料的統計表計算算術平均數時,要用加權算術平均數法進行計算,其計算公式為:按照數據資料形式的差異,可以把加權算術平均數的計算分為由單項分組資料求算術平均數和由組距分組資料求算術平均數兩大類。(1)由單項分組資料求算術平均數它的計算公式與一般加權算術平均數計算公式一致。(1)由單項分組資料求算術平均數它的計算公式與一般加權算術平均數計算公式一致。則家庭平均人數為:(2)由組距分組資料求算術平均數在數據資料按組距式分組的情況下,求算術平均值的公式為:
其中表示各組組中值,表示每組次數。例:某校教師月平均工資分組數據如下表解:算術平均數也有它的不足之處。其一,它不像眾數那樣一目了然,必須經過計算才能求得;其二,它易受極端值的影響。四、均值、中位數和眾數的比較在中央電視臺舉辦的一次全國業余通俗歌手大賽中,假定11名裁判對某位歌手的評分按順序排列分別是:9.9,9.3,9.3,9.3,9.2,8.9,8.8,8.8,8.7,8.5,8.4這組數據的三種中心度量分別是眾數=9.3,中位數=8.9,均值=9.01假定在復賽中這11名裁判對該歌手的評分除2名稍有變動外(劃線的那兩個)其余都給了與預賽時相同的分數如下(說明這組裁判員的水平是比較高的)9.9,9.3,9.3,9.2,9.2,9.2,8.8,8.8,8.7,8.5,8.4。眾數=8.8,中位數=8.8,均值=8.99與前面的結果相比,均值是最穩定的,只相差0.02;中位數稍差些,變動了0.1;而眾數則最不穩定,相差了有0.5分之多。再假定如果在統計時粗心的工作人員把第11個裁判的評分8.4錯寫成了0.4,那么會造成什么影響呢,這時中位數沒有變化,但均值卻由8.99變成了8.26,相差了0.73分。這說明均值對異常值是較敏感的,相比之下,中位數就不那么敏感。因此可以看到,當分布比較有規則即不存在極端的值時,用均值代表分布的中心比較好;而在有極端值時則用中位值更合適。對于這點在后面的章節中還要論述。眾數雖然穩定性最差,但在有些情況下卻十分方便。習題:在臺灣的一項《夫妻對電視傳播媒介觀念差距的研究》中,訪問了三十對夫妻,其中丈夫所受教育X(以年為單位)的數據如下,182016616171214161814l416920181215131616212191620141416161)按照原始數據求出其眾數、中位數和平均數的精確值。2)將數據分組,使組中值分別為6,9,12,15,18,21,做出X的頻數分布表,求眾數、中位數和平均數的近似值3)問10.5年的教育在第幾百分位數上?13年呢?4)如果將原始數據更新分成三組,組中值分別為8,l4,20(將下限歸入該組),那么這時眾數、中位數和平均數又近似是多少?如果組中值為7,13,19呢?離散程度也叫離中趨勢。它是與集中趨勢相對應的次數分布的另一個重要特征。對兩組數據分布來說,它們有時集中趨勢相同而離散程度不同,有時離散程度相同而集中趨勢卻不同(如下圖所示)。第三節離散程度(分布的形狀)1991年的《浙江調查》中的第22題問道:“你昨天大約花了多少時間看電視?”假定在三個不同單位分別抽取的11名觀眾的回答為:(單位:分鐘)第一組;40,60,50,50,40,50,50,50,60,50,50第二組:70,40,50,60,30,60,50,40,30,50,70第三組:20,40,20,20,60,20,90,80,20,90,90結果都等于50分鐘。我們用圓點來表示每一個觀測值。對一組數據來說,離散程度與集中趨勢關系也很大。離散程度值越大,則集中趨勢值的代表性越小;反之,離散程度值越小,集中趨勢值代表性越大,所以認識離散程度也有助于對集中趨勢的理解。只有既研究和了解數據分布的集中趨勢,又了解其離散程度,才能認識數據分布狀況的全貌。代表數據分布的離散程度的統計值主要有異眾比率、全距、四分位差、標準差等等。一、異眾比率(VR)在用眾數作為一組資料的代表值的情況下,這一眾數的代表性如何,我們可以用異眾比率來反映。所謂異眾比率,就是指非眾數的次數與總體內全部單位數的比率。其公式為N為總次數,為眾數的次數第四節二項分布如在下表中:眾數為良好,,N=80,則二、全距(極差)R全距是測量總體各單位變量數值差距的最簡單方法。它指一組數據的最大取值與最小取值之間的距離,也就是兩個極端值之差,全距可以用最大值減去最小值求得。其公式為:其中為最大值,為最小值例如:1991年的《浙江調查》中的第22題問道:“你昨天大約花了多少時間看電視?”假定在三個不同單位分別抽取的11名觀眾的回答為:(單位:分鐘)第一組;40,60,50,50,40,50,50,50,60,50,50第二組:70,40,50,60,30,60,50,40,30,50,70第三組:20,40,20,20,60,20,90,80,20,90,90R1=60-40=20;R2=70-30=40;R3=90-20=70;極差雖然很容易計算,但它只告訴了我們數據分布的范圍,至于分布的中間部分是如何變化的則不得而知。而且它受極端值的影響可能是很大的,例如在前面第1組n1=11人中,再問一下他們第二天收看電視的時間的話,也許有一個人多看了一部3集電視劇,用了150分鐘。其它10人基本不變。那么極差將由20分一躍變成110分。另外極差對樣本含量的大小也有一定的依賴關系。由于極差只用了兩個極端值,有時是不可靠的,因此一般不常用。三、四分位差(Q)為了避免全距的弱點,可以采取四分位差的方法。四分位差舍去一組數據的極端數據,而采用對數據的中央部分求全距的方法來測定離散程度。具體做法是:把一組數據按大小順序排成序列,然后分成四個數據數目相等的段落,各段落分界點上的數叫四分位數。1、由原始資料求四分位差例:某工廠一工段有工人7人,工齡分別為3、5、6、8、10、14、15年。先要找出和的位置。的位置=的位置=然后從7位工人工齡序列中找到處在位置上的數據是5,位置上的數據是14。則四分位差Q=-=14-5=9這說明,這7位工人中,有一半人的工齡在5年至14年之間,或者說這一半人工齡的最大差異為9年。2、由單項分組資料求四分位差例:下表是某年某鄉女青年結婚年齡統計資料。先要找出和的位置。的位置===19的位置==然后從累計頻數中找出第19和第57分別落在累計頻數為37和67這兩組內,由此可以得出=20,=22。則四分位差Q=-=2(歲)如果要說明這組數據離中位數的離散程度,則(歲)。這一計算結果說明,如果用中位數(本例中位數為21歲)來來估計該鄉結婚女青年的年齡,則有一半人的年齡在歲這個范圍內,即有一半人的年齡在20歲至22歲之間。可見,這兩種計算方法實質上是一樣的。3、由組距分組資料計算四分位差此時求、的公式是其中:、分別為第一個四分位和第三個四分位點所在組的下限。、分別為比第一個四分位和第三個四分位點所在組下的各組的累積次數,、分別為第一個四分位和第三個四分位點所在組的次數;為組距。第六節正態分布四、均方差(MSD)均方差又叫做平均平方偏差,它是對分布的變化性的較全面的一個度量。為了衡量所有數據偏離其均值的程度,先考慮每個觀測值離開其均值的偏差。由于偏差有正有負,最后偏差的平均總是零。因此,平均偏差對描述分布的形狀(或變化性)是毫無用處的。為了得到描述形狀的有價值的度量,我們先將所有偏差作平方計算,那么就都是正值,然后再求平均才有意義。這樣得到的結果就叫做平均平方偏差或簡稱均方差:對于分組數據,我們按照求分組數據均值的類似方法修上面的公式,即只要對每一個的偏差的平方乘以它發生的頻率即可:注意,第一個公式中X表示每一個觀測值,第二個公式中的X表示每一組觀測值的中點即組中值。五、方差和標準差由于某些技術上的原因,習慣上是將均方差中的n換成n一1。這樣就又得到了一個稍微有些不同的關于分布形狀的度量,叫方差:對于分組數據的方差最后,我們定義方差的正的平方根為標準差:標準差通過取平方根,標準差的單位和原始數據的單位就一致了。下面我們以表2—2中男子身高的分組數據為例,計算該分布的均方差、方差和標準差,結果如表2—5所示。在表2—5中的計算中我們可以注意到以下幾點:1、絕對偏差的大小是由0至18。標準差S的值7.17比某些絕對偏差小而比另一些大。因此在某種意義上,S是一種典型的偏差:標準差S位于最小絕對偏差和最大絕對偏差之間的某個位置上。這也提供了對我們的算術計算的一個粗略檢驗。例如若S的結果超過18,那么肯定是算錯了。第六節正態分布2、在計算方差時,為了避免小數,我們將=169.6的小數部分舍棄掉了,也就是說,引進了一個舍入誤差e=0.6。這樣做的理由主要有兩個。首先,在實踐中各類調查一般都是大樣本,計算一般都是通過計算機進行的。表2—5中手工計算的目的并不是要讓讀者去掌握計算技術,只不過是使讀者了解一下方差的意義是什么,為此粗略的計算也就足夠了.其次,對的舍入誤差使產生的誤差是很小的。一般來說,如果均值舍去的誤差為e,那么,方差被多估計的部分也不過是左右。通常是很小的,可以忽略不計,或者從結果中去掉,那么也可以得到較精確的值。例如在表2—5中,e=0.6,=0.36,那么51.377-0.36=51.017可以當作方差的較精確的估汁值。如果讀者不怕麻煩用=169.6按表2—5的格式再計算一次的話,可以求得51.015,與前面修正后的51.017幾乎沒有什么差別。六、極差、四分位數差和標準差的比較我們也可以對極差、四分位數差和標準差的持點和優缺點加以比較。歸納后如下表所示最后再提一下“自由度”這個后面將要用到的概念。如果我們只想對樣本進行描述,那么均方差MSD就是對分布形狀的一個很好的度量。不過如果我們想更進一步地通過樣本對總體進行統計推斷的話,那么樣本方差S2則更合適。我們只從直觀上來表達這個意思。假定只有n=1個觀測值,我們仍然可以計算均值,但卻無法考慮分布的形狀。例如我們從足球運動員中隨機地抽取了一名隊員,他的身高為179厘米.那么我們可以用它來估計隊員的身高。但對隊員身高分布的形狀就不可能有什么印象,是174-184厘米?還是176-182厘米?只n超過1,我們才能得到關于方差的信息。也就是說,對于方差,我們實際上只有(n一1)個信息,這就是計算方差時所用的那個除數。七、利用相對頻率進行計算有時候得不到原始數據,只有以相對頻率分布的形式給出整理后的數據。那么,怎樣計算和S呢?類似地可以得到利用相對頻率計算均方差的公式最后比較式和式,可以得到MSD求方差的公式
習題1、計算下列各組數據的極差、四分位數差和標準差1)8,7,6,5,2,3,1,92)4,10,3,2,1,8,5,113)13,10,11,l22、在某研究所隨機地抽取了100名高級科技人員,其基本工資的頻數分布如下表,求該樣本工資的平均值和標準差。并計算四分位數差。第一節隨機抽樣3、美國70年代的年通貨膨脹率如上表計算以下期間的平均年通貨膨脹率:(1)1970-1973的前4年間(2)1974-1979的后6年間;(3)1970—1979的全部10年間;(4)假定原始數據丟失,只知道(1)、(2)中前4年和后6年間的年平均值,那么還有可能計算出全部10年間的平均值嗎?如何計算?第十章推斷統計
第一節抽樣調查一、抽樣調查的概念、特點與運用范圍1、抽樣調查的概念抽樣調查是指從全體被研究對象中,按照一定的方法抽取一部分對象作為代表進行調查分析,以此推論全體被研究對象狀況的一種調查方式。廣義的抽樣調查包括隨機抽樣與非隨機抽樣。抽樣調查中被研究對象的全部單位總和,稱總體或母體。總體可分為兩種:有限總體和無限總體,例如,我們要研究某一城市居民生活狀況,雖然居民比較多,但總是有限的。這種總體我們稱之為有限總體。而火車、汽車、輪船站的客流量,很難有一個確切數量,即使觀察若干個單位時間,其數量也很可能各不相同,因而這樣的總體是無限總體。從總體所包含的全部單位中,抽取出來進行調查的部分單位叫樣本。例如,我們從某高校4000名大學生中抽取200名進行專業思想狀況的調查,這200名學生就是樣本。抽樣調查要從全部單位中抽取部分單位加以調查分析,以取得統計數據。但這不是抽樣調查工作的最終目的,根據調查所得的樣本資料估計和推斷被調查現象的總體特征,才是調查工作的最終目的。因此,從一定意義上說,抽樣調查雖然不是一種全面調查,但卻可以起到全面調查的作用2、特點:(1)它以足夠數量的調查單位組成的“樣本”來代表和說明總體。(2)按隨機原則抽取調查單位。(3)以樣本推斷總體的誤差可以事先計算并加以控制。(4)節省人力、物力和時間。3、運用范圍概括起來,抽樣調查主要適用于以下幾種情況:(1)總體范圍較大,調查對象較多。(2)實際工作中,不可能進行全面調查,而又需要了解其全面情況的調查。(3)雖可以但不必要進行全面調查的事物。(4)對普查統計資料的質量進行檢驗、修正。二、非隨機抽樣與隨機抽樣1、隨機抽樣(1)簡單隨機抽樣,又稱純隨機抽樣,它是隨機抽樣的最基本也是最常見的類型。它按隨機的原則,直接從含有個單位的總體中,抽出個單位作為樣本進行調查。即抽樣時不需對調查總體進行任何分組或排列,任其自然,或者拌和均勻,從中任意抽取預定的單位個數作為樣本。這種抽樣方法最嚴格地遵從了使每個單位有同等被抽中機會的隨機原則。通常所見的抽簽、搖獎等等形式,都屬于這種抽樣法。簡單隨機抽樣的具體做法可以分為抽簽法和隨機號碼法兩種。(2)類型抽樣,又稱分層抽樣或分類抽樣。它是把調查總體按一定的標準分為若干類型,然后從每一類中按照相同或不同的比例隨機抽取樣本。(3)等距抽樣,又稱機械抽樣或系統抽樣。它是把總體中的全部調查單位按某一標志排列起來,按固定順序和間隔抽取樣本。(4)整群抽樣。在實踐中,總體單位數目往往很大,而各單位在時間和空間上的分布又很分散,給抽樣帶來很大困難。為了便于組織調查,有時可以利用現成的集體,隨機地一群一群地抽取集體單位,加以研究,由此推斷總體的情況。這種抽樣叫整群隨機抽樣,簡稱整群抽樣。(5)多階段抽樣,又稱多級抽樣。上述簡單隨機抽樣、類型抽樣、等距抽樣等均屬不分階段的直接抽樣法。即從被調查事物的總體中直接抽出所需要的全部調查單位。多階段抽樣的方法,即把抽取樣本單位的過程分為兩個或兩個以上的階段進行。2、非隨機抽樣非隨機抽樣,又稱非概率抽樣,它是指根據研究者個人的方便或以個人的主觀經驗、設想有選擇地抽取樣本的方法。非隨機抽樣的方法主要有四種。(1)判斷抽樣,又稱目的抽樣,即由調查者根據主觀判斷選取樣本的方法。(2)偶遇抽樣,又稱任意抽樣,即指調查者根據其方便,任意抽選樣本的方法(3)滾雪球抽樣。這種方法是找出少數個體,通過這些個體了解更多的個體。就像滾雪球一樣,了解的個體越來越多,越來越接近于總體,便可以在不清楚總體的情況下了解總體。(4)定額抽樣(又稱配額抽樣)。指事先規定一定的樣本容量,并規定一些與研究內容有關的標準,然后把樣本容量數按不同標準加以分配,最后由調查者從符合標準的調查單位中隨意地抽取樣本單位進行調查。三、雙盲隨機試驗1、對照組的使用2、隨機化3、雙盲實驗四、有放回和無放回的抽樣如果我們進行的是有放回的抽樣,那么樣本中的幾個觀察將是相互獨立的。對于很大的總體,即使進行的是無入回的抽樣,在實踐中也和有放回的沒有什么差別,仍然具有獨立性。當所有觀察相互獨立時分析起來是比較方便的,可以導出簡單的公式。我們稱這種樣本為“非常簡單的隨機樣本”:對于一個非常簡單的隨機樣本(VSRS),總體中的所有個體都是同等可能地被觀察的,而且n個觀察也是相互獨立地被抽取的。只有當簽抽取自一個小總體而且是不放回的情況,獨立性才不再成立。這種抽樣實際上是有好處的。因為它保證了每—個簽都不被重復地抽取,每一次觀察都帶來新的信息,因此這樣的樣本是更有價值的。但是,這種抽樣比較難分析。以后如果不加說明,我們指的都是非常簡單隨機樣本,并簡稱為隨機樣本。第二節概率一、離散型隨機變量的概率我們先通過一個簡單的例子說明什么是隨機變量,什么是隨機變量的概率。概率論起源于對賭博中得分問題的研究,這里我們也從扔骰子的例子說起。例3-1利用隨機數字表模擬將一均勻骰子投擲20次、100次的過程。用X表示骰子被投擲時(面朝上)所出現的點數。做出以下各種情況中X的相對頻率分布表及分布圖1)投擲20次;2)投擲100次;3)投掘無窮多次。一個骰子被投擲時出現的點數是隨機變量的一個例子,習慣上是用一個大寫字母來表示:X=一個均勻骰子被投擲時所出現的點數一般地,隨機變量可以定義為是一個隨機試驗或觀察的數量結果。從表3—2和圖3—1中我們可以注意到,當樣本中只有很少的觀察量時,相對頻率激烈地波動;隨著樣本含量的增加,相對頻率趨于穩定,最后穩定在—個極限分布上,我們稱之為隨機變量X的“概率分布”,用P(X)表示,即概率=相對頻率(在統計意義下)的極限(3—1)解:顯然,隨機地取3人,被抽中的女性人數可能是1人,2人,3人,也可能一個女性都沒有披抽中,即X的可能取值是0,1,2和3,但取這些值的可能性大小是不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司組織雙節活動方案
- 公司組織部活動方案
- 公司日常體育活動方案
- 公司節約成本活動方案
- 公司網上銷售活動方案
- 公司文旅活動方案
- 公司收入策劃方案
- 公司組織外省旅游活動方案
- 2025年系統工程基本原理及其應用考試試題及答案
- 2025年網絡直播運營管理師職業資格考試試題及答案
- 信息戰、密碼技術與計算機病毒
- 2021-2022學年北京市朝陽區五年級下學期期末語文試卷
- 投資組合管理課件
- 第五講靜電場中的電介質電位移介質中的高斯定理
- 人教版小學英語3~6年級單詞匯總(音標版)
- 上海小學語文四年級上冊詞語表(共3頁)
- 超聲回彈綜合法計算表(帶公式)
- 安全技術交底記錄桿塔組立施工
- 橡膠產品公差標準(各國標準)
- A類機房標準(共6頁)
- 華為性格測試攻略
評論
0/150
提交評論