第3章 效用函數_第1頁
第3章 效用函數_第2頁
第3章 效用函數_第3頁
第3章 效用函數_第4頁
第3章 效用函數_第5頁
已閱讀5頁,還剩102頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第3章

效用函數3.1引言3.2效用的定義和公理系統3.3效用函數的構造3.4風險與效用3.5貨幣的效用3.6阿萊斯悖論(Allais’sparadox)3.1引言在定量評價可能的行動的各種后果時,會遇到兩個主要問題:(1)后果本身是用語言表述,可能沒有任何合適的直接測量標度。(2)即使有一個明確的標度可以測量后果,按這個標度測得的量也可能并不反映后果對決策人的真正價值。3.1引言這個例子說明:即使是數值量表示的后果,它對決策人的實際價值仍有待確定。0實際價值100錢100100100000例3.1考慮錢對同一個人的價值。假設一個學生手頭緊張,正好有機會掙100元錢,但是所要做的是他相當討厭的工作。(1)如他經濟情況差,他會認為100元錢的實際價值足夠大,所要做的工作即使是相當討厭的,他仍會去干;(2)如他先有了10000元,要為100元錢去干這份讓他討厭的工作,他就很可能不干了。

3.1引言例3.2決策人面臨圖3.1中決策樹所示的選擇:①確定收入禮品1000元;②參與一次抽獎:有50%的機會得0元,50%的機會得2500元。

有人選確定性的1000元的收入。抽獎的期望值雖大,風險也大,實際價值還不如保險的1000元。而有人認為禮品不如抽獎,因為抽獎提供了獲得2500元的機會。

這個例子說明:決策人的風險態度影響其對后果的實際價值判斷。圣彼得堡悖論

(St.PetersburgParadox/game)

圣彼得堡悖論是數學家丹尼爾·伯努利(DanielBernoulli)的表兄尼古拉·伯努利(NicolausBernoulli)在1738提出的一個概率期望值悖論,它來自于一種擲幣游戲,即圣彼得堡游戲(表1)。問題:你愿意花100元來參加一次圣彼得堡游戲嗎?圣彼得堡悖論的解釋1:(一)邊際效用遞減論

DanielBernoulli在提出這個問題的時候就給出一種解決辦法。他認為游戲的期望值計算不應該是金錢,而應該是金錢的期望效用,即利用眾所周知的“期望效用遞減律”,將金錢的效用測度函數用貨幣值的對數來表示:效用=log(貨幣值),如表2所示。所有結果的效用期望值之和將為一個有限值log(4)≈0.60206,如果這里的效用函數符合實際,則理性決策應以4元為界。圣彼得堡悖論的解釋2:(二)風險厭惡論圣彼得堡悖論對于獎金額大小沒有限制。比如連續投擲40次才成功的話,獎金為1.1萬億元。但是這一獎金出現的概率極小,1.1萬億次才可能出現一次。實際上,游戲有一半的機會,其獎金為2元,四分之三的機會得獎4元和2元。獎金越少,機會越大,獎金越大,機會越小。Hacking(1980)所說:花25元的費用冒險參與游戲將是非常愚蠢的,雖有得大獎的機會,但是風險太大。因此,考慮采用風險厭惡因素的方法可以消解矛盾。PualWeirich就提出在期望值計算中加人一種風險厭惡因子,并得出了游戲費用的有限期望值,認為這種方法實際上解決了該悖論。圣彼得堡悖論的解釋3:(三)效用上限論

也有一種觀點認為獎金的效用可能有一個上限,這樣,期望效用之和就有了一個極限值。Menger認為效用上限是惟一能消解該悖論的方法。設效用值等于貨幣值,上限為100單位,則游戲的期望效用為7.56l25,如表3所示。圣彼得堡悖論的解釋4:(四)結果有限論Gustason認為,要避免矛盾,必須對期望值概念進行限制,其一是限制其結果的數目;其二是把其結果值的大小限制在一定的范圍內。這是典型的結果有限論,這一觀點是從實際出發的。因為實際上,游戲的投擲次數總是有限的數。比如對游戲設定某一個投擲的上限數L,在投擲到這個數的時候,如果仍然沒有成功,也結束游戲,不管你還能再投多少,就按照L付錢。因為你即便不設定L,實際上也總有投到頭的時候,人的壽命總是有限的,任何原因都可以使得游戲中止?,F在設定了上限,期望值自然也就可以計算了。

3.1引言由上面例子可知:在進行決策分析時,存在如何描述或表達后果對決策人的實際價值,以便反映決策的人心目中各種后果的偏好次序(preferenceorder)的問題。偏好次序是決策人的個性與價值觀的反映,它與決策人所處的社會地位、經濟地位、文化素養、心理和生理(身體)狀態有關。3.2效用的定義和公理系統3.2.1效用的定義3.2.2效用存在性公理3.2.3效用的公理化定義和效用的存在性3.2.4基數效用與序數效用3.2.1效用的定義效用(utility):消費者從消費商品中得到的滿足程度。效用完全是消費者的一種主觀心理感受。滿足程度越高,效用越大;滿足程度越低,效用越小。對效用的理解:《最好吃的東西》兔子和貓爭論,世界上什么東西最好吃。兔子說,“世界上蘿卜最好吃。蘿卜又甜又脆又解渴,我一想起蘿卜就要流口水?!必埐煌?,說,“世界上最好吃的東西是老鼠。老鼠的肉非常嫩,嚼起來又酥又松,味道美極了!”兔子和貓爭論不休、相持不下,跑去請猴子評理。猴子聽了,不由得大笑起來:“瞧你們這兩個傻瓜蛋,連這點兒常識都不懂!世界上最好吃的東西是什么?是桃子!桃子不但美味可口,而且長得漂亮。我每天做夢都夢見吃桃子。”兔子和貓聽了,全都直搖頭。那么,世界上到底什么東西最好吃?以上的故事說明效用完全是個人的心理感覺。不同的偏好決定了對同一種商品效用大小的不同評價。3.2.1效用的定義在決策理論中,后果對決策人的實際價值,即決策人對后果的偏好次序是用效用(utility)來描述的。效用就是偏好的量化,是數(實值函數)。1738年,DanielBernoulli就指出:若一個人面臨從給定行動集(風險性展望集)中作選擇的決策問題,如果他知道與給定行動有關的將來的自然狀態,且這些狀態出現的概率已知或可以估計,則他應選擇對各種可能后果的偏好的期望值最高的行動。一、效用的基本概念與符號(1)嚴格序“

a

b(或者記作aPb)的含義是“a優于b”(aispreferredtob);也就是說,若非外界因素的強迫,決策人只會選擇a而不會選擇b。一、效用的基本概念與符號

(2)無差異“~”

a~b(或記作aIb)的含義是“a無差異于b”(aisindifferencetob);也就是說,決策人對選擇或同樣滿意。一、效用的基本概念與符號(3)弱序“≥”記作aRb,含義是“a不劣于b”,亦即a優于或者無差異于b。一、效用的基本概念與符號

(4)展望(prospect)

展望指決策的可能的前景,即各種后果及后果出現的概率的組合,記作P=<p1,c1;p2,c2;…;pr,cr;>.

在例3.2的決策問題中,后果集C={1000,2500,0},采取行動a1和a2時的展望分別是:P1=<1.0,1000;0,2500;0,0>P2=<0,1000;0.5,2500;0.5,0>

(4)展望(prospect)

展望既考慮各種后果Ci,又考慮了各種后果出現的概率(客觀概率pi或主觀概率πi),全面地描述了在決策問題中采取某種行動的可能前景。復合展望一、效用的基本概念與符號(5)抽獎與確定當量由機會點和該機會點發出的n個機會枝的概率及相應后果構成的圖形稱為抽獎(lottery),抽獎又稱彩票。若C1~(p,C2;(1-P),C3),

則稱確定性后果C1為抽獎(p,C2;(1-P),C3)的確定當量(certaintyequivalent)。二、效用的定義

根據上述討論和記號,可以初步給出效用函數的定義如下。

定義3.1

在集合P上的實值函數u,若它和P上的優先關系≥一致,即:若P1,P2屬于P,P1≥P2當且僅當u(P1)≥u(P2),則稱u為效用函數。把效用函數定義在展望集P上而不是定義在后果集C上,是為了使效用函數能夠反映決策人對風險的態度。3.2.2效用存在性公理定義3.1給出了效用函數的最基本性質,這就是可以根據它的大小來判斷展望P的優劣。但是這樣的效用函數是否一定存在呢?回答是不一定。至于決策人的價值判斷在滿足什么條件時存在與之一致的效用函數,vonNeumann-Morgenstern(1944)給出了效用的存在性公理,又稱理性行為公理。該公司試制新產品方案在決策分析中,可以表示為一個簡單事態體,即T=(0.6,20;0.4,-5)傳遞性推導:P1P2αP1+(1-α)P1αP2+(1-α)P2αP1+(1-α)P3αP2+(1-α)P3

公理3.3表明兩個有序的展望各有相同的比例被相等的量替代后,優先關系不變.例3.3橫過馬路問題:效用有界性證明3.2.3效用的公理化定義和效用的存在性3.2.3效用函數的存在性3.2.4基數效用與序數效用基數:為實數,如1,2,3,π序數:如第一,二,…,4,3,2,1基數性效用函數與序數效用函數區別:基數效用定義在展望集P上(考慮后果及其概率分布),是實數;序數效用定義在后果集C上,不涉及概率,可以是整正數.基數效用反映偏好強度(正線性變換下唯一,即原數列可變換為:b+c,2b+c,3b+c,100b+c;其中b,c∈R1,b>0.)序數效用不反映偏好強度,(保序變換下唯一),原序數列可變換為16,9,4,1;或8,6,4,2,或10,7,6,1等.3.2.4基數效用與序數效用

基數(cardinalnumber)效用:邊際效用分析方法

總效用(TOTALUTILITY,TU):消費者在一定時間內從一定數量商品的消費中所得到的效用量的總和;邊際效用(MARGINALUTILITY,MU):消費者在一定時間內增加一單位商品的消費所得到的效用量的增量.序數(ordinalnumber)效用:無差異曲線分析方法??怂拐J為,效用的數值表現只是為了表達偏好的順序,并非效用的絕對數值?,F在比較通用的是序數效用。經過反復提問,讓公司決策者反復對比和權衡。當p=0.8時,決策者偏好風險方案;當p=0.5時,決策者轉向偏好無風險方案。當p=0.6時,決策者對兩種方案無所偏好,即確定無差異關系式O~(0.6,o*;0.4,oo)因此,效用值u(o)=0.63.3效用函數的構造1.估計效用函數值的方法2.離散型后果的效用設定3.連續型后果的效用函數構造4.用解析函數近似效用曲線1.估計效用函數值的方法⑴概率當量法⑵確定當量法⑶增益當量法⑷損失當量法

從純理論角度看,這四種方法并沒有實質性的區別;但是實驗結果表明,使用確定當量法時決策人對最優后果(增益)的保守性和對損失的冒險性都比概率當量法嚴重(Hershey,1982);采用增益當量法與損失當量法時產生的誤差也比用概率當量法大,因此只要有可能,應該盡可能使用概率當量法。

⑴概率當量法2.離散型后果的效用設定后果為離散型隨機變量時,后果集C中元素為有限個,構造后果集上的效用函數有兩方面的內容:(1)確定各后果之間的優先序;(2)確定后果之間的優先程度。離散型后果效用值的設定可以采用概率當量法,簡稱NM法。NM法步驟如下:例3.6

例3.6

天氣預報說球賽時可能有雨,一個足球愛好者要決定是否去球場看球。首先作該問題的決策樹如圖所示。由題意可知決策人對四種后果優劣的排序是:c2c3c4c1。步驟:第一步:令u(c1)=0,u(c2)=1。第二步:詢問決策人,下雨在家看電視這種后果與去球場看球有多大概率下雨被淋相當,若決策人的回答是0.3,則c30.7c2+0.3c1,u(c3)=0.7u(c2)=0.7。第三步:詢問決策人,無雨看電視這種后果與去球場看球有多大概率下雨被淋相當,若決策人的回答是0.6,則c4

0.4c2+0.6c1,得u(c4)=0.4c2=0.4。第四步:進行一致性校驗。c3

0.4c2+0.6c4,則u’(c3)=0.64≠0.7。重復二、三,若u(c3)不變,則調整u(c4)=0.5,決策人仍認為c3

0.4c2+0.6c4,則通過校驗。3.連續型后果的效用函數構造當后果c為連續變量時,上述方法就不再適用。但是如果能通過分析找到u(c)的若干特征值,求特征點的效用后,再連成光滑曲線;或者u(c)是連續、光滑的,則可以分段構造u(c)。每天學習時間與效用隨著學習時間的增加,效用值也會有所增加但是由于進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論