計算機數據庫(經濟會計類)概率與概率分布隨堂講解課件_第1頁
計算機數據庫(經濟會計類)概率與概率分布隨堂講解課件_第2頁
計算機數據庫(經濟會計類)概率與概率分布隨堂講解課件_第3頁
計算機數據庫(經濟會計類)概率與概率分布隨堂講解課件_第4頁
計算機數據庫(經濟會計類)概率與概率分布隨堂講解課件_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2023/7/191第四章概率與概率分布第一節基本概念第二節概率的定義及基本運算法則第三節條件概率與事件的獨立性第四節全概率公式與貝葉斯定理第五節隨機變量及其概率分布第六節常用的隨機變量的概率分布第一節基本概念2023/7/192第四章概率與概率分布一、隨機試驗與隨機事件在自然界和社會經濟生活中,隨機現象普遍存在。如在1小時內到達商場的顧客人數;向空中拋一枚硬幣,硬幣落地后朝上的可能是硬幣的“正面”也可能是硬幣的“反面”。諸如此類現象都是隨機現象,其特點是在基本條件不變的情形下,重復做試驗或觀察可能會得到不同的結果,具體哪個結果會出現事先是不清楚的,并且呈現出一種偶然性。然而我們可以通過做隨機試驗等方法來認識此類隨機現象的規律性。2023/7/193一、隨機試驗與隨機事件隨機試驗滿足以下三個條件:每次試驗所有可能的結果事先是明確可知的,并且所有可能的結果不止一個;試驗可以在相同的條件下重復進行;每次試驗的結果總是出現所有可能結果中的一個,但試驗之前不能確定是哪個結果會出現。2023/7/194二、樣本空間

隨機事件一般可分解為更簡單的事件,在一定條件下,不可以再分解的事件稱為基本事件,一般用、、等來表示。隨機試驗的所有基本事件組成的集合,稱為樣本空間,記為

,在樣本空間中,

等成為樣本點。由若干基本事件組合而成的事件稱為復合事件。2023/7/195、

二、樣本空間

【例4-1】擲硬幣,結果可能是“出現正面”或“出現反面”,“出現正面”簡記為“正”,“出現反面”簡記為“反”。現假設連續擲硬幣兩次,那么所有可能的結果共有種,即(正,正),(正,反),(反,正),(反,反)。

上述結果表示的涵義是:括號中的第一個字表示第一次擲硬幣的結果,第二個字表示第二次擲硬幣的結果。這些事件是投擲2次硬幣所有可能的結果,不能再分解成更簡單的結果了,故={(正,正),(正,反),(反,正),(反,反)}為該試驗的樣本空間。隨機事件“擲兩次硬幣至少有一次是正面”的結果就不是基本事件,它是由基本事件(正,正),(正,反),(反,正)組合而成。2023/7/196三、事件的關系2023/7/197

事件間的關系主要包括以下幾類:設事件A發生必然導致事件B發生,則稱事件A包含于事件B,或稱為事件B包含A,記為

,如果

并且

,則稱A與B相等,記為

;“事件A與事件B至少有一個發生”這一事件,稱為事件A與B的并,記為

;將“事件A與事件B同時發生”這一事件稱為A與B的交,記作

,或

。將“事件A發生而事件B不發生”這一事件稱為A與B的差,記作

,或

;將“

”即“樣本空間

與事件A之差”這一事件稱為事件A的逆事件或互補事件,記作

;如果兩個事件A與B不可能同時發生,即

,則稱事件A與B為互不相容事件,或互斥事件。第二節概率的定義及基本運算法則2023/7/198第四章概率與概率分布一、概率的定義由于現實中所具備的條件不同,概率對于不同的場合不同的人意味著不同的含義。通常有三種定義事件概率的方法:古典概率法;相對發生頻率法;主觀概率法。2023/7/199一、概率的定義(一)古典概率法:假設隨機試驗的樣本空間是包含個樣本點的有限集合,所有樣本點出現的可能性相等,則包含個樣本點的事件A的概率計算公式如下:2023/7/1910一、概率的定義

【例4-2】商場搞周末促銷活動,凡購物金額夠200元的顧客都有從一個大盒子中抽取一張禮品券的機會。假設盒子中共有禮品券500張,其中一等獎5張,二等獎50張,三等獎200張,現顧客張強消費450元,按規則可以抽取兩張禮品卷,求抽取結果一張是一等獎,另一張是二等獎的概率。解:設事件A是“抽取兩張禮品卷,其中一張是一等獎,另一張是二等獎”,因為每張禮品券被抽中的可能性是相等的,并且樣本空間是有限的,所以可以利用上述古典概率的公式計算事件A發生的概率。這里從500張禮品券中抽取2張的樣本點總數組成的樣本,不考慮順序,是組合問題,應有種可能的結果。即:2023/7/1911一、概率的定義

抽取兩張禮品卷,其中抽取結果一張是一等獎,另一張是二等獎的的樣本點個數應有種取法。即因此:

2023/7/1912一、概率的定義(二)相對發生頻數法:相對發生頻數法是建立在大量試驗基礎上得到的,也稱為概率統計定義法。其計算方法是用一個事件A發生次數除以試驗總共進行的次數所得的商作為事件A發生的概率。2023/7/1913一、概率的定義

【例4-3】某商場調查得到部分顧客的基本情況,數據如表4-1所示:求:(1)顧客是男性的概率是多少?(2)一個顧客年齡在20到40歲之間的概率是多少?2023/7/1914表4-1顧客基本情況一、概率的定義解:(1)為了計算顧客是男性的概率,我們可根據上表數據計算出男性顧客總數并除以顧客總數:

(顧客是男性)=678/1336=0.51。因此顧客是男性的概率是51%。(2)抽到一個顧客年齡在20到40歲之間的概率等于20到40歲之間的顧客數除以顧客總數:(一個顧客年齡在20到40歲之間)=630/1336=0.47。因此一個顧客年齡在20到40歲之間的概率是47%。2023/7/1915一、概率的定義(三)主觀概率法:在現實經濟管理活動中,運用上述的古典概率法和相對發生頻率法計算概率往往有一定的局限性,因為不能做大量的試驗,只能憑決策者的經驗來給出事件發生的可能性的大小。例如某企業投資獲得成功的概率。因此主觀概率度量的是決策者對事件的某種結果是否會發生所持的看法。2023/7/1916一、概率的定義

【例4-4】某建筑公司準備投標一項橋梁建設項目,公司的工程師對于定義該橋梁項目的所有成本費用等都很專業,現在的問題是:管理層采用成本加成法來確定最終投標金額,利潤加成多少更為合適。因為加價高,可能競標失敗,如果加價低,雖然得到了項目,但利潤也會有損失。現在管理層在下述三種加價幅度上猶豫不決,這三種加價方案中利潤占成本的比例為:

為了最終決策,管理層必須找出每種加價幅度上贏得項目訂單的概率。由于以往沒有做過與此一模一樣的項目,故只能根據現有信息,采用主觀概率法確定贏得項目訂單的概率,評估結果如下:

(10%的加價幅度下中標)=30%(15%的加價幅度下中標)=25%(20%的加價幅度下中標)=10%2023/7/191710%15%20%二、概率的基本運算法則

由上述定義可以得到概率的如下性質:性質1:

,即事件的概率介于

之間。性質2:

,即必然事件發生的概率為1。性質3:如果事件A與事件B互不相容,則兩個事件A和B之和的概率為:

。2023/7/1918、

二、概率的基本運算法則

根據上述概率的性質有如下概率基本運算規則:規則1:

,即不可能事件發生的概率為0;規則2:

,表示事件A的對立事件,即

和A必有一事件發生,但又不能同時發生。規則3:如果事件A和事件B相容,則兩個事件A和B之和的概率為:

。2023/7/1919、

二、概率的基本運算法則

【例4-5】一項問卷調查顯示,有70%的受訪者喜歡喝牛奶,30%的受訪者喜歡喝咖啡,24%的人同時喜歡喝這兩種飲品。問有多大比例的人喜歡喝牛奶或咖啡?解:設事件A:喜歡喝牛奶;事件B:喜歡喝咖啡。則根據題意有:=70%,=30%,=24%從而=70%+30%-24%=76%即有76%的人喜歡喝牛奶或咖啡。2023/7/1920三、事件的關系2023/7/1921

事件間的關系主要包括以下幾類:設事件A發生必然導致事件B發生,則稱事件A包含于事件B,或稱為事件B包含A,記為

,如果

并且

,則稱A與B相等,記為

;“事件A與事件B至少有一個發生”這一事件,稱為事件A與B的并,記為

;將“事件A與事件B同時發生”這一事件稱為A與B的交,記作

,或

。將“事件A發生而事件B不發生”這一事件稱為A與B的差,記作

,或

;將“

”即“樣本空間

與事件A之差”這一事件稱為事件A的逆事件或互補事件,記作

;如果兩個事件A與B不可能同時發生,即

,則稱事件A與B為互不相容事件,或互斥事件。第三節條件概率與事件的獨立性2023/7/1922第四章概率與概率分布一、條件概率條件概率的定義:設任意兩事件A、B,且,則稱事件B發生的條件下,事件A發生的概率為條件概率,記為。其計算公式是:

2023/7/1923一、條件概率

【例4-6】為了解不同性別的客戶其網絡使用習慣是否有差別,并由此制定公司的市場策略,調查收集的信息如下:事件A:每月使用網絡時間在20~40個小時之間;事件B:用戶為女性。問已知事件B發生的前提下,事件A發生的概率,即計算:。2023/7/1924每月上網時間性別合計女性男性<2020~40>404503001005008003509501100450總計85016502500表4-2按性別分類匯總的上網時間表一、條件概率解:待研究事件的相對頻率:我們可以通過下面兩種方法計算

,并通過比較認識條件概率的涵義。方法一:(1)我們已知事件B發生(用戶為女性)。該調查中共有850名女性用戶。(2)在這850名女性用戶中,300人每月上網時間在20~40個小時之間。(3)由此,

方法二:直接利用條件概率公式來計算,即:(1);(2)

(3)由此,2023/7/1925每月上網時間(小時)性別合計女性男性<2020~40>40450/2500=0.18300/2500=0.12100/2500=0.04500/2500=0.2800/2500=0.32350/2500=0.14950/2500=0.381100/2500=0.44450/2500=0.18總計850/2500=0.341650/2500=0.662500/2500=1.00二、事件的獨立性通常情況下,條件概率不等于,即事件B的出現對于事件A出現的概率是有影響的。特別地,如果事件B的出現并不影響事件A的出現,這時我們就稱事件A對事件B獨立。獨立事件的條件概率為,。獨立事件的乘法定理:。

2023/7/1926第四節全概率公式與貝葉斯定理2023/7/1927第四章概率與概率分布設事件是樣本空間的一個分割,即所有兩兩互不相容,,并且:則有,并且,,…,兩兩互不相容,由概率的可加性有:又由乘法定理可知:所以式4-1可有下列等價形式:這個公式稱為全概率公式。一、全概率公式2023/7/1928一、全概率公式

【例4-7】設某企業的甲、乙、丙三個車間生產同一規格產品,現有產成品500件,已知其中的300件、150件、50件分別來自甲、乙、丙三個生產車間,假設三個車間的次品率分別為5%、4%、1%。現從中任取一件,求該件產品為次品的概率。2023/7/1929一、全概率公式解:以、、分別表示取得的產品來自于甲、乙、丙三個生產車間,則、、兩兩互斥。以表示取得的產品為次品。則有:,,

,,由全概率公式得到:

即該件產品為次品的概率為4.3%。2023/7/1930二、貝葉斯定理貝葉斯定理:假設事件是樣本空間的一個分割,即所有兩兩互不相容,假設事件已經發生并可能影響到,則事件

發生概率的貝葉斯公式為:

上式本質上是一個條件概率,同時分子應用了乘法定理,分母應用了全概率公式。稱為事件

發生的先驗概率,稱為事件

發生的后驗概率。用貝葉斯公式計算的后驗概率體現了在獲得新的相關決策信息后對先驗概率的修正。2023/7/1931二、貝葉斯定理

【例4-8】設某飲料公司有兩個制造工廠,分別位于甲地和乙地,這兩個工廠生產的飲料是一樣的,其中甲廠生產了60%的產品,乙廠生產了40%的產品。兩個工廠生產的產品被放在同一倉庫,混合堆放在一起。經大量抽查檢驗,甲廠產品不合格率為5%,乙廠產品不合格率為10%。如果公司出售了不合格品,除了要發生退換貨成本外,還有信譽損失,所以公司考慮要在這兩個工廠之間公平地分攤相關的損失,為此要首先確定一件不合格品來自于兩個工廠的概率,并根據概率分攤相應的損失。試回答如果一件產品是次品,那么它由甲廠生產出來的概率是多少?由乙廠出產出來的概率是多少?2023/7/1932二、貝葉斯定理

解:記

表示事件“產品由甲廠生產”;

表示事件“產品由乙廠生產”;

表示事件“產品是不合格品”。

根據已知條件,有:

因為公司銷售的產品不是來自于甲廠就是來自于乙廠,即事件

是樣本空間的一個分割,由全概率公式有:

故如果一件產品是次品,那么它由甲廠出產出來的概率由貝葉斯公式計算:

同理如果一件產品是次品,那么它由乙廠出產出來的概率由貝葉斯公式計算:

故可以將42.86%的損失分攤給甲工廠,57.14%的損失分攤給乙工廠。2023/7/1933、

二、貝葉斯定理【例4-9】設某大夫在病人的化驗結果出來之前認為該病人患肺炎的概率是70%,據以往的根據化驗結果診斷數據表明,如果患者真的患了肺炎,則化驗結果也表明是患肺炎的概率是95%,如果患者確實沒有患肺炎,而化驗結果卻表明患肺炎的概率是20%。現化驗結果表明該患者感染了肺炎,那么大夫對“該病人患肺炎”這一事件的修正概率是多少?2023/7/1934、

二、貝葉斯定理解:記表示事件“患者感染了肺炎”;表示事件“患者沒有感染肺炎”.記表示事件“化驗結果表明患者感染了肺炎”,則根據題意有:;;;由全概率公式有:

于是根據貝葉斯公式:

即根據化驗結果,大夫對病人感染肺炎的概率從70%修正為91.7%。2023/7/1935第五節隨機變量及其概率分布2023/7/1936第四章概率與概率分布一、隨機變量的涵義2023/7/1937隨機變量可定義為:為一次隨機試驗的每種可能結果賦一個數字值的變量。

當隨機變量的所有可能取值的集合只包含有限個元素或當隨機變量可能取值集合是無窮可數集合時,就稱其為離散型隨機變量。

當一個隨機變量的可能取值的集合為無窮不可數集合時,該隨機變量就是連續型隨機變量。二、離散型隨機變量的概率分布2023/7/1938由隨機變量的所有可能取值,及相應的概率構成的全部成為離散型隨機變量的概率分布,其表現形式可以是表格、公式或圖形等。離散型隨機變量的概率分布有以下性質:

離散型隨機變量的累積分布函數是反映其概率分布情況的另一種方式,公式如下:……………………表4-4離散型隨機變量三、連續型隨機變量的概率分布2023/7/1939假設連續型隨機變量落在任意區間內(這里a,b為任意實數)的概率等于以下定積分值:

則稱函數f(x)是隨機變量X的概率密度函數。由于概率,故有。同時概率,故必然事件,即

。上述概率密度函數的幾何意義是,對于任意連續實數區間,事件發生的概率值等于由x軸、直線x=a、直線x=b以及曲線f(x)圍成的曲邊梯形的面積。圖4-1連續型隨機變量的概率密度函數示意圖第六節常用的隨機變量的概率分布2023/7/1940第四章概率與概率分布一、離散型隨機變量的概率分布2023/7/1941(一)二項分布我們經常會遇到只有兩種結果的隨機試驗,例如擲硬幣,不是正面向上,就是正面向下。在產品抽樣檢驗中,不是抽到正品,就是抽到次品,這種只有兩個結果的試驗稱為貝努里試驗。假設在一次貝努里試驗中,有隨機事件A,其結果只有兩種可能,即“成功”或“失敗”,“成功”的概率是p,“失敗”的概率為q,并且p+q=1。用X表示在重復n次貝努里試驗中事件A“成功”的次數,其取值范圍是從0到n的任意整數,顯然,X是一隨機變量。則

由于該式是二項展開式的通項,故該分布稱為二項分布。記為

,其期望值等于np

,方差等于npq。一、離散型隨機變量的概率分布2023/7/1942

【例4-10】設某企業產品廢品率為5%,重復抽取10件產品進行檢驗。試求:(1)正好有三件產品是廢品的概率;

(2)至少有三件產品是廢品的概率;

(3)廢品件數大于3的概率。解:由題意知p=5%,n=10,故(1)(2)(3)一、離散型隨機變量的概率分布2023/7/1943(二)泊松分布設離散型隨機變量X的取值范圍是任意非負整數0,1,2……,假設在某次隨機試驗中隨機變量X取得某一具體數值記為k,則隨機事件X=k發生的概率為:式中,是X的期望值和方差;則稱隨機變量X服從泊松分布。記為。一、離散型隨機變量的概率分布2023/7/1944

【例4-11】假設上午10點到11點間到達一個高速公路收費站的汽車數量是一個服從泊松分布的隨機變量。到達汽車的平均流量是2輛/分鐘。求下列隨機事件發生的概率。(1)1分鐘內沒有車輛到達;(2)1分鐘內到達5輛汽車;(3)1分鐘內到達3輛汽車及3輛以下。解:由題意知,(1)

(2)

(3)一、離散型隨機變量的概率分布2023/7/1945(三)超幾何分布設總體容量為N,總體中包含成功的次數是K,抽取的樣本容量是n,樣本中包含成功次數記為k,其中k滿足,如果隨機事件發生的概率為:

則稱隨機變量服從超幾何分布,記為:。超幾何分布的均值和方差分別為:

一、離散型隨機變量的概率分布2023/7/1946

【例4-12】某公司有庫存打印機20臺,其中包括兩臺壞打印機,由于庫存管理人員的疏忽,合格打印機與壞打印機混合存放在一起,現售出10臺并已經發貨,問:(1)已經交付的貨物中包含零臺有問題的打印機的概率;(2)已經交付的貨物中包含1臺或2臺有問題的打印機的概率。解:由題意知,N=20,K=2,n=10,(1)零臺打印機,即k=0,則

(2)1臺打印機,即k=1時,2臺打印機,即k=2時,二、連續型隨機變量的概率分布2023/7/1947(一)正態分布1.正態分布概率密度函數及其性質如果連續型隨機變量X的概率密度函數為:式中,是總體均值,是總體標準差,e是自然對數的底數,則稱隨機變量X服從參數是,的正態分布,記作:。當參數,都確定后,正態分布的概率密度函數就唯一確定了。概率密度函數的曲線如圖所示。

圖4-2正態分布密度函數曲線二、連續型隨機變量的概率分布2023/7/1948

正態分布概率密度曲線的特征:(1)隨機變量的取值范圍是整個x軸,概率密度曲線向左右延伸,并以x軸為漸近線;(2)

,即概率密度曲線在x軸上方,且概率密度曲線與

x軸所圍成的區域的面積為1;(3)概率密度函數是以

為對稱軸的鐘形曲線,并且在

處,曲線達到最高點

;(4)均值

是正態分布概率密度曲線的位置參數,其數值大小決定了密度曲線對稱軸的不同,如圖4-3所示。標準差是正態分布概率密度曲線的形狀參數,它的大小等于曲線拐點與對稱軸之間的距離,反映了曲線的胖瘦程度,如圖4-4所示。圖4-3正態分布概率密度曲線(a)圖4-4正態分布概率密度曲線(b)二、連續型隨機變量的概率分布2023/7/1949

2.標準正態分布、標準正態分布表的應用

標準正態分布是指均值

,標準差

的正態分布,記為:。此時概率密度函數為:

概率分布函數為:

標準正態分布概率密度函數和分布函數的曲線如圖所示。

還可以將正態分布轉換為標準正態分布,進而求得任何正態分布的分布函數值。轉化公式如下:

此時,

。二、連續型隨機變量的概率分布2023/7/1950

【例4-13】到某銀行辦理業務的顧客從進入銀行到辦理完業務離開所用時間服從正態分布,其均值為22分鐘,標準差為6分鐘,試求所用時間在下列范圍內的概率:(1)所用時間在10至34分鐘之間;(2)所用時間小于20分鐘。解:以X表示辦理業務所用時間,已知。(1)若X=10,則,X=34時同理,因此可得

(2)二、連續型隨機變量的概率分布2023/7/1951(二)均勻分布如果連續型隨機變量X的概率密度函數為:a,b為兩參數,并且。則稱隨機變量X服從均勻分布,記為:。均勻分布的均值和標準

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論