




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
勞工組織工作文件勞工組織工作文件140五月/2025全球職業(yè)暴露指數(shù)Rumadna,BalintNafradi,KonradRoszyenaniec,MarekTroszyenski?國(guó)際勞工組織2025署名4.0國(guó)際(CCBY4.0)本作品在知識(shí)共享署名4.0國(guó)際版下授權(quán)參見:/licenses/by/4.0/。用戶可以按照許可證中的詳細(xì)說(shuō)明重復(fù)使用、共享(復(fù)制和重新分發(fā))、改編(重新混合、轉(zhuǎn)換和構(gòu)建原始作品)使用者必須明確注明材料來(lái)源是勞工組織,并說(shuō)明是否對(duì)原始內(nèi)容進(jìn)行了修改不允許在翻譯、改編或其他衍生作品中使用國(guó)際勞工組織的徽章、名稱和標(biāo)識(shí)署名-用戶必須表明是否進(jìn)行了更改,并必須引用以下工作:M.《生成性人工智能與工作:一個(gè)完善的全球職業(yè)暴露指數(shù)》第140號(hào)勞工組織工作文件日內(nèi)瓦:國(guó)際勞工局,2025年。?ILO。翻譯-在翻譯本作品的情況下,必須添加以下免責(zé)聲明以及歸屬:這是國(guó)際勞工組織的正式譯文。國(guó)際勞工組織不對(duì)其內(nèi)容和準(zhǔn)確性承擔(dān)任何責(zé)任責(zé)任完全由翻譯的作者承擔(dān)改編-如果是改編本作品,必須在署名的同時(shí)添加以下免責(zé)聲明:本作品改編自國(guó)際勞工組織改編本。國(guó)際勞工組織不對(duì)其內(nèi)容和準(zhǔn)確性承擔(dān)任何責(zé)任責(zé)任完全由改編本的作者承擔(dān)第三方材料-本知識(shí)共享許可不適用于本出版物中包含的非ILO版權(quán)材料。如果材料屬于第三方,則此類材料的用戶應(yīng)全權(quán)負(fù)責(zé)向權(quán)利持有人澄清權(quán)利,并對(duì)任何侵權(quán)索賠本協(xié)議項(xiàng)下發(fā)生的任何爭(zhēng)議,如不能友好解決,應(yīng)根據(jù)聯(lián)合國(guó)國(guó)際貿(mào)易法委員會(huì)(貿(mào)易法委員會(huì))的仲裁規(guī)則提交仲裁雙方應(yīng)受該等仲裁所作出的任何仲裁裁決的約束,該等仲裁裁決應(yīng)作為該等爭(zhēng)議的最終裁決。有關(guān)權(quán)利和許可的詳細(xì)信息,請(qǐng)聯(lián)系:rights@。有關(guān)勞工組織出版物和數(shù)碼產(chǎn)品,請(qǐng)?jiān)L問(wèn):/publns。ISBN9789220421840(印刷版)、ISBN9789220421857(網(wǎng)絡(luò)PDF)、ISBN9789220421864(電子版)、ISBN9789220421871(html)。ISSN2708-3438(印刷版ISSN2708-3446(數(shù)字版)/10.54394/HETP0387國(guó)際勞工組織出版物中使用的名稱與聯(lián)合國(guó)一致實(shí)踐,以及其中材料的陳述并不意味著表達(dá)任何意見國(guó)際勞工組織對(duì)任何國(guó)家、地區(qū)或領(lǐng)土或其當(dāng)局的法律地位,或?qū)ζ溥吔缁蚪缇€的劃分見:/disclaimer.本出版物中表達(dá)的意見和觀點(diǎn)是作者的意見和觀點(diǎn),不需要-必須反映國(guó)際勞工組織的意見、觀點(diǎn)或政策提及公司名稱、商業(yè)產(chǎn)品和工藝并不意味著ILO認(rèn)可它們,未提及某一特定公司、商業(yè)產(chǎn)品或工藝并不表示不認(rèn)可。有關(guān)勞工組織出版物和數(shù)字產(chǎn)品的信息,請(qǐng)?jiān)L問(wèn):/research-和-publications勞工組織的工作文件總結(jié)了勞工組織正在進(jìn)行的研究的結(jié)果,并力求促進(jìn)對(duì)與工作世界有關(guān)的一系列問(wèn)題的討論。歡迎對(duì)勞工組織的這份工作文件提出意見,可將意見發(fā)送到gmyrek@。出版授權(quán):CarolineFredrickson,研究部主任勞工組織工作文件可在以下網(wǎng)址查閱:/global/publications/working-papers建議引用:Gmyrek,P.,J.伯格,Kamienski,K.,Konopczyovski,F(xiàn).,Adadna,A.,Nafradi,B.,Rossananiec,K.,特羅希耶斯基,M.2025年《生成性人工智能與工作:一個(gè)完善的全球職業(yè)暴露指數(shù)》,國(guó)際勞工組織工作文件140(日內(nèi)瓦,國(guó)際勞工組織)。 01勞工組織工作文件140摘要這項(xiàng)研究更新了國(guó)際勞工組織2023年生成性人工智能(GenAI)職業(yè)暴露全球指數(shù),納入了該技術(shù)的最新進(jìn)展并提高了用戶對(duì)GenAI工具的熟悉程度。使用波蘭職業(yè)分類系統(tǒng)中29,753項(xiàng)任務(wù)的代表性樣本,以及對(duì)ISCO-08中每個(gè)1位數(shù)組的1,640名員工的調(diào)查,我們收集了52,558個(gè)數(shù)據(jù)點(diǎn),這些數(shù)據(jù)點(diǎn)與2,861項(xiàng)任務(wù)的自動(dòng)化潛力有關(guān)。然后,我們將此輸入與一個(gè)調(diào)查和一個(gè)較小的國(guó)際專家組之間的幾輪德爾菲式討論進(jìn)行基于這一過(guò)程,我們創(chuàng)建了一個(gè)超越國(guó)家具體情況的任務(wù)自動(dòng)化知識(shí)庫(kù),并使用它來(lái)開發(fā)一個(gè)能夠預(yù)測(cè)ISCO-08技術(shù)文檔中任務(wù)得分的AI助手我們2025年的得分是在四個(gè)逐漸增加的暴露梯度的修訂框架中提出的,其中包括一組新的全球就業(yè)份額估計(jì)值。文職人員的職業(yè)仍然具有最高的接觸水平。此外,一些高度數(shù)字化的職業(yè)也增加了曝光率,凸顯了GenAI在專業(yè)和技術(shù)角色的專業(yè)任務(wù)方面不斷擴(kuò)大的能力。在全球范圍內(nèi),每四名工人中就有一名從事與GenAI接觸的職業(yè)全球3.3%的就業(yè)屬于最高風(fēng)險(xiǎn)類別,盡管女性(4.7%)和男性就業(yè)(2.4%)之間存在顯著差異。這些差異隨著國(guó)家收入的增加而增加(在高收入國(guó)家梯度4中,女性為9.6%,男性為3.5%),總體風(fēng)險(xiǎn)也增加(低收入國(guó)家占就業(yè)總?cè)藬?shù)的11%,高收入國(guó)家為34%)。由于大多數(shù)職業(yè)都是由需要人類投入的任務(wù)組成的,因此GenAI最有可能產(chǎn)生的影響是工作轉(zhuǎn)型將我們改進(jìn)后的指數(shù)與國(guó)家微觀數(shù)據(jù)聯(lián)系起來(lái),可以精確預(yù)測(cè)這種轉(zhuǎn)變,為社會(huì)對(duì)話和有針對(duì)性的政策應(yīng)對(duì)提供基礎(chǔ),以管理轉(zhuǎn)型。PaweethegGmyrek是國(guó)際勞工組織研究部的高級(jí)研究員JanineBerg是國(guó)際勞工組織研究部的高級(jí)經(jīng)濟(jì)學(xué)家KarolKamienski是NASK-PIB分析和研究部門的高級(jí)研究員FilipKonopczynski是NASK-PIB分析和研究部主任AgnieszkaRumadna是NASK-PIB分析和研究部門的經(jīng)理。KonradRossaniec是NASK-PIB分析和研究部門的研究員MarekTroszyovski是NASK-PIB分析和研究部門的專家,華沙Civitas大學(xué)助理教授02勞工組織工作文件140摘要關(guān)于作者、介紹、1文獻(xiàn)中的基于任務(wù)的自動(dòng)化方法、2波蘭6位數(shù)系統(tǒng)中的任務(wù)和職業(yè)、3任務(wù)自動(dòng)化潛力143.1.初步氣象預(yù)測(cè)143.2.人類評(píng)估職業(yè)任務(wù)的選擇153.3.調(diào)查設(shè)計(jì)和征聘173.4.調(diào)查設(shè)計(jì)限制183.5.任務(wù)自動(dòng)化潛力研究綜述193.5.1.樣本性質(zhì)193.5.2.參與者對(duì)GenAI的暴露:篩選問(wèn)題223.5.3.任務(wù)自動(dòng)化潛力評(píng)分2303勞工組織工作文件140、4專家驗(yàn)證調(diào)查27、5調(diào)整調(diào)查次樣本、6調(diào)整所有調(diào)查分?jǐn)?shù)、7預(yù)測(cè)所有ISCO-08和6位數(shù)任務(wù)水平的綜合得分tions、8調(diào)整后的全球GenAI暴露指數(shù)、9職業(yè)分類的變化40、10訂正全球就業(yè)估計(jì)數(shù)43附件481.按職業(yè)分類的4位數(shù)暴露量482.第4.2節(jié)的采樣公式。613.調(diào)查問(wèn)卷62參考文獻(xiàn)68鳴謝7104勞工組織工作文件140圖1.各國(guó)基于收入和人口的相似性(A)和互聯(lián)網(wǎng)接入情況(B)12圖2.3個(gè)LLM的合成自動(dòng)化分?jǐn)?shù)分布,按ISCO-081位數(shù)14圖3.與勞動(dòng)力調(diào)查數(shù)據(jù)相比,調(diào)查中的年齡和性別分布(就業(yè)人員)20圖4.與波蘭勞動(dòng)力調(diào)查相比,就業(yè)的個(gè)人)和所需的樣本(表2)21圖5.與勞動(dòng)力調(diào)查相比,波蘭(就業(yè)人員)21圖6.GenAI的使用頻率,按1位數(shù)ISCO-0822圖7.對(duì)工作領(lǐng)域的預(yù)期影響23圖8.對(duì)個(gè)人當(dāng)前工作影響的預(yù)期-個(gè)人得分分布23圖9.按性別和職業(yè)類別分列的任務(wù)一級(jí)分?jǐn)?shù)分布情況(1位數(shù)ISCO-08)24圖10.評(píng)分作為GenAI熟悉度和評(píng)分任務(wù)分布的函數(shù)個(gè)人得分25圖11.評(píng)分階段示意圖27圖12.用于查看任務(wù)語(yǔ)義聚類的樹狀圖示例28圖13.來(lái)自調(diào)查和專家的任務(wù)級(jí)別分?jǐn)?shù),與人工智能仲裁的分?jǐn)?shù)相比30圖14.調(diào)整后的分?jǐn)?shù)比較:按職業(yè)組劃分的GPT-4o與Gemini圖15.主要對(duì)2,861項(xiàng)任務(wù)進(jìn)行調(diào)查評(píng)分、專家評(píng)估和最終調(diào)整調(diào)查34圖16.人工智能接觸指數(shù):ISCO-084位數(shù)職業(yè)圖17.AI暴露:2025年與2023年的比較,ISCO-084位數(shù)級(jí)別職業(yè)40圖18.2023年至2025年梯度4內(nèi)職業(yè)接觸的變化41圖19.4位數(shù)職等職業(yè)(職業(yè)分類-08),2023年和2024年圖20.可能暴露于GenAI的職業(yè)的全球估計(jì)(就業(yè)(按性別)05勞工組織工作文件140表1.波蘭分類系統(tǒng)和職業(yè)分類-08中職業(yè)任務(wù)的構(gòu)成13表2.調(diào)查樣本的選擇16表3.核心調(diào)查問(wèn)題17表4.調(diào)查和專家評(píng)分之間的調(diào)整和理由示例(例如,最大向上和向下修正的例子)31表5.GenAI暴露因素:定義和解釋38表A1.職業(yè)分類-08按照射梯度分列的職業(yè)4806勞工組織工作文件140文本框1.任務(wù)自動(dòng)化評(píng)估的示例問(wèn)題18文本框2.對(duì)調(diào)查答卷人的介紹性提示文本框3.LLM提示符的概念結(jié)構(gòu)(GPT-4o的Python代碼)3507勞工組織工作文件140縮略詞AI人工智能API應(yīng)用編程接口atm機(jī)自動(dòng)柜員機(jī)CAWI計(jì)算機(jī)輔助網(wǎng)絡(luò)面試CEDLAS分配、勞動(dòng)和社會(huì)研究中心CEE中歐和東歐CEPS歐洲政策研究中心GBBGmyrek,Berg和Bescond,2023年。勞工組織工作文件96谷丙轉(zhuǎn)氨酶-4生成式預(yù)訓(xùn)練Transformer4谷丙轉(zhuǎn)氨酶-4o生成式預(yù)訓(xùn)練Transformer4OmniGusGównyUrzdStatystyczny(波蘭中央統(tǒng)計(jì)局)HIC高收入國(guó)家信通技術(shù)信息和通信技術(shù)勞工組織國(guó)際勞工組織IMF國(guó)際貨幣基金組織ISCO-08國(guó)際標(biāo)準(zhǔn)職業(yè)分類(2008年版)它信息技術(shù)訓(xùn)練中心勞工組織國(guó)際培訓(xùn)中心(都靈)LFS勞動(dòng)力調(diào)查(BAEL,波蘭)LICs低收入國(guó)家LLM大型語(yǔ)言模型ML機(jī)器學(xué)習(xí)MOL波蘭家庭、勞動(dòng)和社會(huì)政策部NASK-PIB國(guó)家研究所07勞工組織工作文件140本報(bào)告來(lái)源于三個(gè)皮革制造商報(bào)告站(由用戶Id:349461下載,文檔Id:6595808勞工組織工作文件140O*NET職業(yè)信息網(wǎng)(美國(guó))勞工部餡餅PolskiInstytutEkonomiczny(波蘭經(jīng)濟(jì)研究所)SD標(biāo)準(zhǔn)偏差SGHSzkoaGównaHandlowa(華沙經(jīng)濟(jì)學(xué)院美國(guó)/美國(guó)/美國(guó)美利堅(jiān)合眾國(guó)英國(guó)聯(lián)合王國(guó)通行證拉普拉塔國(guó)立大學(xué)09勞工組織工作文件1402023年8月,國(guó)際勞工組織發(fā)布了第一份關(guān)于生成人工智能(GenAI)潛在影響的全球就業(yè)估計(jì)(Gmyrek等人,2023年)。這項(xiàng)研究是由媒體突出報(bào)道的對(duì)技術(shù)取代大部分知識(shí)工作的潛力的擔(dān)憂引發(fā)的。自2023年估計(jì)發(fā)布以來(lái),GenAI取得了進(jìn)一步的技術(shù)進(jìn)步,包括引入大型語(yǔ)言模型(LLM),擴(kuò)大了圖像識(shí)別和音頻和視頻制作的能力。此外,由于GenAI模型與應(yīng)用程序編程接口(API)工具的可能性,許多新的GenAI應(yīng)用程序已經(jīng)事實(shí)上,GenAI被比作一種通用技術(shù),這意味著它可能會(huì)繼續(xù)在各個(gè)領(lǐng)域產(chǎn)生新的應(yīng)用和創(chuàng)新,推動(dòng)長(zhǎng)期的經(jīng)濟(jì)和社會(huì)變革。盡管形勢(shì)發(fā)展迅速,但政策制定者必須更深入地了解技術(shù)進(jìn)步如何影響現(xiàn)有就業(yè)機(jī)會(huì)。為了潛在影響進(jìn)行了更準(zhǔn)確的評(píng)估。這項(xiàng)研究建立在國(guó)際勞工組織開發(fā)的方法(Gmyrek,Berg和Bescond,2023-GBB)的基礎(chǔ)上,該方法使用來(lái)自4位數(shù)國(guó)際標(biāo)準(zhǔn)職業(yè)分類(ISCO-08)的任務(wù)描述和GPT-4模型來(lái)估計(jì)暴露于GenAI技術(shù)的任務(wù)水平和職業(yè)得分,然后根據(jù)國(guó)際勞工組織的官方勞動(dòng)力數(shù)據(jù)得出全球就業(yè)估計(jì)數(shù)。但這項(xiàng)研究包括幾個(gè)關(guān)鍵的改進(jìn)。我們分析的第一步是基于波蘭國(guó)家6位數(shù)職業(yè)分類,其中包括近30,000項(xiàng)任務(wù)。這使職業(yè)分類-08結(jié)構(gòu)中的任務(wù)數(shù)量增加了10倍,并能夠根據(jù)比職業(yè)分類-08系統(tǒng)中記錄的職業(yè)和任務(wù)更新的一套職業(yè)和任務(wù),對(duì)任務(wù)的自動(dòng)化潛力進(jìn)行細(xì)粒度評(píng)估由于波蘭的6位數(shù)分類與4位數(shù)ISCO-08保持一致,因此可以在4位數(shù)水平上編制職業(yè)評(píng)分,從而可以直接比較和更新國(guó)際勞工組織(GBB)的2023年估計(jì)數(shù)此外,該研究通過(guò)利用人類和人工智能能力的綜合優(yōu)勢(shì),以及額外的專家驗(yàn)證層,改進(jìn)了GBB的方法框架具體來(lái)說(shuō),我們調(diào)查了目前在波蘭工作的1,640人,每個(gè)ISCO-081位數(shù)組都對(duì)與其職業(yè)組相關(guān)的代表性任務(wù)樣本的自動(dòng)化潛力進(jìn)行了作為第二步,我們邀請(qǐng)了國(guó)內(nèi)和國(guó)際專家對(duì)之前在調(diào)查中評(píng)估的大樣本任務(wù)進(jìn)行詳細(xì)審查,以通過(guò)迭代過(guò)程驗(yàn)證或調(diào)整自動(dòng)化評(píng)分水平由于我們保持與ISCO-08的層級(jí)鏈接,并專注于技術(shù)可行性而不是具體的國(guó)家背景,通過(guò)結(jié)合當(dāng)?shù)睾蛧?guó)際專家的意見,我們創(chuàng)建了一個(gè)系統(tǒng),可以更精確地預(yù)測(cè)GenAI技術(shù)的個(gè)人職業(yè)任務(wù)自動(dòng)化的潛力,包括在國(guó)際層面。為了實(shí)現(xiàn)這一目標(biāo),我們將人類得分輸入到人工智能模型中,以生成反映波蘭2,500個(gè)6位數(shù)級(jí)別職業(yè)的近30,000項(xiàng)個(gè)人任務(wù)的人類判斷的得分。然后,我們使用相同的人工智能預(yù)測(cè)器重新生成ISCO-08中的任務(wù)得分,之前由GBB(2023)提供從而調(diào)整ILO的2023指數(shù),該指數(shù)現(xiàn)在受益于人們的輸入10勞工組織工作文件140在ISCO-08的每一個(gè)1位數(shù)組中使用,并根據(jù)專家意見。作為最后一步,我們提供了最新的全球、區(qū)域和基于收入的就業(yè)估計(jì),這些估計(jì)有可能被GenAI技術(shù)改變我們的研究專門針對(duì)GenAI工具,將這一最新AI家族的影響與更廣泛的AI應(yīng)用(例如在工業(yè)生產(chǎn)中使用機(jī)器學(xué)習(xí)(ML)算法或圖像識(shí)別)隔離開來(lái)。有幾個(gè)考慮因素證明這種選擇性的重點(diǎn)是合理的。首先,我們應(yīng)對(duì)日益增長(zhǎng)的研究工具需求,該工具可以更好地了解GenAI對(duì)國(guó)家勞動(dòng)力市場(chǎng)的潛在影響,因?yàn)樵絹?lái)越多的社會(huì)焦慮關(guān)注這項(xiàng)技術(shù),以及最近關(guān)于工作中越來(lái)越多地采用GenAI的報(bào)告(Bick等人,2024;Faverio和Tyson,2022;Grampp等人,2023;Maison&PartnersandThinkTank,2024;PewResearchCenter,2023;Rutgers,2024)。其更精確的曝光指數(shù)使數(shù)字經(jīng)濟(jì)和勞動(dòng)力的學(xué)術(shù)工作與媒體和公共辯論中對(duì)GenAI技術(shù)的重大興趣更加緊密地聯(lián)系在一起。第三,我們的研究提供的方法論藍(lán)圖可以在未來(lái)靈活地?cái)U(kuò)展到其他類型的人工智能,或者更狹隘地集中在數(shù)字技術(shù)及其應(yīng)用領(lǐng)域的特定子集上。本文是即將出版的一系列基于ILO和NASK合作的出版物中的第一篇,這些出版物致力于改進(jìn)評(píng)估人工智能就業(yè)影響的方法,但也詳細(xì)記錄了所使用的方法,包括調(diào)查,專家驗(yàn)證過(guò)程和用于預(yù)測(cè)的人工智能模型的構(gòu)建。隨后的論文將根據(jù)更詳細(xì)的職業(yè)和任務(wù)層面的數(shù)據(jù),并使用定量和定性相結(jié)合的方法,評(píng)估GenAI對(duì)波蘭勞動(dòng)力市場(chǎng)的潛在影響。所有出版物都將包括定量和定性組成部分的方法藍(lán)圖和技術(shù)細(xì)節(jié),包括調(diào)查問(wèn)卷和訪談指南。通過(guò)公開這些工具,我們希望有助于開發(fā)一種更好的方法來(lái)評(píng)估GenAI對(duì)就業(yè)的潛在影響,并刺激更詳細(xì)的國(guó)家層面研究,包括中低收入國(guó)家。 例如,F(xiàn)eltenetal.(2023)提供了2021年原始暴露指數(shù)的更新版本,并根據(jù)GenAI工具的能力進(jìn)行了調(diào)整正如他們的論文所示,這種調(diào)整并沒(méi)有導(dǎo)致職業(yè)暴露的重大轉(zhuǎn)變,仍然不可能以選擇性的方式評(píng)估這種新技術(shù)的能力。參見Gmyreketal.(2024)對(duì)這些分?jǐn)?shù)進(jìn)行更詳細(xì)的比較。11勞工組織工作文件140、研究技術(shù)對(duì)工作的影響的核心是,工作是一組“任務(wù)”(Autor,2015)。因此,任務(wù)自動(dòng)化可能會(huì)或可能不會(huì)導(dǎo)致工作自動(dòng)化,這取決于特定任務(wù)對(duì)職業(yè)的重要性。使用基于任務(wù)的方法對(duì)自動(dòng)化的就業(yè)影響進(jìn)行分析,包括本研究,試圖抓住兩個(gè)核心考慮因素i)特定技術(shù)自動(dòng)化特定任務(wù)的能力;(ii)勞動(dòng)力市場(chǎng)中的前職業(yè)的特征,基于這些職業(yè)所執(zhí)行的詳細(xì)任務(wù)。通過(guò)對(duì)這兩個(gè)維度的交叉點(diǎn)進(jìn)行建模,人們可以得出一系列關(guān)于這種技術(shù)如何與職業(yè)任務(wù)相互作用的可能預(yù)測(cè),通過(guò)技術(shù)驅(qū)動(dòng)的替代實(shí)現(xiàn)完全自動(dòng)化,或者通過(guò)部分自動(dòng)化和人機(jī)互補(bǔ)實(shí)現(xiàn)轉(zhuǎn)型。雖然基于任務(wù)的框架肯定有局限性,但最近的學(xué)術(shù)文獻(xiàn)顯示了這種方法在建模就業(yè)和勞動(dòng)力市場(chǎng)影響方面的分析優(yōu)勢(shì)(Acemoglu等人,2024;NurskiandRuer,2024).近年來(lái),人工智能和任務(wù)的研究在方法和范圍上都有了重要的改進(jìn),包括將人工智能工具用于研究目的。在關(guān)于機(jī)器學(xué)習(xí)(ML)和工作的早期論文之一中,F(xiàn)rey和Osborne(2013)將一組IT技術(shù)專家的意見納入ML算法,以開發(fā)美國(guó)就業(yè)市場(chǎng)自動(dòng)化潛力的職業(yè)級(jí)預(yù)測(cè)。GenAIAPI的出現(xiàn)簡(jiǎn)化了將人類專業(yè)知識(shí)和算法能力結(jié)合起來(lái)用于研究目的的可能性依靠這個(gè)想法,Eloundou等人。(2023)展示了GPT-4預(yù)測(cè)與70名人工智能專家對(duì)LLM自動(dòng)化職業(yè)任務(wù)潛力的調(diào)查的密切一致性,隨后在此基礎(chǔ)上為美國(guó)市場(chǎng)開發(fā)了合成自動(dòng)化評(píng)分。大多數(shù)基于任務(wù)的研究都集中在美國(guó),由于O*NET數(shù)據(jù)庫(kù)的非常詳細(xì)的性質(zhì),以及其公共訪問(wèn)。這通常迫使對(duì)全球情況或其他國(guó)家和地區(qū)感興趣的研究人員將其分析建立在當(dāng)?shù)亟?jīng)濟(jì)和勞動(dòng)力影響與美國(guó)情況下預(yù)測(cè)的相似性的強(qiáng)烈假設(shè)實(shí)際上,不同國(guó)家的職業(yè)任務(wù)可能差別很大,這對(duì)發(fā)展中國(guó)家構(gòu)成了特別的挑戰(zhàn)因此,處理職業(yè)分類-08系統(tǒng)中的任務(wù)為不同國(guó)家、區(qū)域和收入群體的預(yù)測(cè)提供了一個(gè)有用和簡(jiǎn)單的共同標(biāo)準(zhǔn)。我們的方法將這一全球框架的優(yōu)勢(shì)與波蘭更詳細(xì)的國(guó)家分類系統(tǒng)相結(jié)合,該系統(tǒng)根據(jù)最新的勞動(dòng)力市場(chǎng)數(shù)據(jù)提供了詳細(xì)的職業(yè)和任務(wù)列表。這有助于我們建立一個(gè)起點(diǎn),在收入最高的國(guó)家和新興經(jīng)濟(jì)體之間的環(huán)境中,對(duì)GenAI的能力與最新任務(wù)和職業(yè)的相互作用進(jìn)行建模(圖1)。使用GenAI工具的組合,我們隨后將這些知識(shí)轉(zhuǎn)移回ISCO-08系統(tǒng)中的12勞工組織工作文件140在歐洲范圍內(nèi),波蘭在較大的中歐和東歐國(guó)家集團(tuán)中具有相當(dāng)?shù)拇硇裕M管其人口(3800萬(wàn))比大多數(shù)其他國(guó)家要多得多。在全球范圍內(nèi),中東歐介于高收入發(fā)達(dá)經(jīng)濟(jì)體和全球南方新興經(jīng)濟(jì)體之間。在互聯(lián)網(wǎng)接入方面,波蘭的排名低于英國(guó)和德國(guó),但高于日本和法國(guó)。因此,為了評(píng)估任務(wù)自動(dòng)化的潛力,由于數(shù)字設(shè)備的高可用性和廣泛的互聯(lián)網(wǎng)接入,假設(shè)波蘭是自動(dòng)化潛力上限的代表似乎是合理的。、圖1.各國(guó)基于收入和人口的相似性(A)和互聯(lián)網(wǎng)接入(B)波蘭家庭、勞動(dòng)和社會(huì)政策部(MOL)維持一個(gè)職業(yè)分類系統(tǒng),定期更新任務(wù)和職務(wù)說(shuō)明2該系統(tǒng)被波蘭統(tǒng)計(jì)局(GUS)和其他國(guó)家機(jī)構(gòu)用于勞動(dòng)力市場(chǎng)分析。在最詳細(xì)的6位數(shù)水平上,該框架包含2541個(gè)職業(yè)和29,753個(gè)相應(yīng)的任務(wù)(表1)。由于該系統(tǒng)是在線公開的,我們最初設(shè)計(jì)了一個(gè)抓取機(jī)器人,它可以抓取各個(gè)職業(yè)頁(yè)面,并將職位描述和相應(yīng)的任務(wù)下載到結(jié)構(gòu)化數(shù)據(jù)框架中。3隨后將摘錄的內(nèi)容與該部提供的職業(yè)分類表進(jìn)行了交叉核實(shí)波蘭的分類系統(tǒng)與ISCO-08的等級(jí)結(jié)構(gòu)兼容,這意味著我們可以很容易地附加一個(gè)從1到4位數(shù)級(jí)別的額外職業(yè)映射(表1)。 2職業(yè)分類數(shù)據(jù)庫(kù)(KZiS)于2014年首次發(fā)布,并定期更新,最新驗(yàn)證日期為2025年1月1日該分類由勞工和社會(huì)政策部長(zhǎng)于2014年8月7日頒布的關(guān)于勞動(dòng)力市場(chǎng)職業(yè)和專業(yè)分類及其適用范圍的條例(Dz.U.)引入。茲2018河poz.227,z2021r.poz.2285,z2022r.poz.853,Dz.U.茲2024河poz.1372)。此外,該部還出版了一份《職業(yè)分類-08》地圖請(qǐng)參閱:.pl/rynek-pracy/bazy-danych/klasyfikacja-zawodow-i-specjalnosci。進(jìn)行網(wǎng)絡(luò)抓取主要是為了展示從公共可訪問(wèn)的來(lái)源獲取非傳統(tǒng)數(shù)據(jù)的潛力,在這種活動(dòng)不受服務(wù)器設(shè)置或法律法規(guī)限制的情況下這一進(jìn)程遵循負(fù)責(zé)任的數(shù)據(jù)收集做法,包括適當(dāng)?shù)念l率設(shè)置,以避免服務(wù)器過(guò)載1313勞工組織工作文件140組名稱2位數(shù)計(jì)數(shù)6位數(shù)字?jǐn)?shù)到6-挖-it任務(wù)it任務(wù)1經(jīng)理410.0%118.7%307.1%1736.8%2565百分之八點(diǎn)六2專業(yè)人員6百分之十五點(diǎn)零2721.4%92百分之二十一點(diǎn)七721百分之二十八點(diǎn)8715百分之二十九點(diǎn)三3技術(shù)員和助理專業(yè)人員5百分之十二點(diǎn)五19百分之十五點(diǎn)一80百分之十八點(diǎn)九507四20.0%595620.0%4文職支持人員410.0%86.3%276.4%712.8%7682.6%5服務(wù)和銷售人員410.0%13百分之十點(diǎn)三40百分之九點(diǎn)五1495.9%17305.8%6農(nóng)業(yè)、林業(yè)和漁業(yè)熟練工人3百分之七點(diǎn)五97.1%174.0%53二點(diǎn)一厘684百分之二點(diǎn)三7手工藝和相關(guān)行業(yè)工人5百分之十二點(diǎn)五1411.1%65百分之十五點(diǎn)四40716.0%4554百分之十五點(diǎn)三8設(shè)備和機(jī)器操作員及裝配工3百分之七點(diǎn)五1411.1%40百分之九點(diǎn)五348百分之十三點(diǎn)七3769百分之十二點(diǎn)七9初級(jí)職業(yè)6百分之十五點(diǎn)零118.7%327.6%1124.4%10123.4%總40100%的126100%的423百分百2541100%的29753百分百注:表1說(shuō)明職業(yè)分類-08與波蘭6位數(shù)職業(yè)分類之間的等級(jí)關(guān)系“x位數(shù)計(jì)數(shù)”欄顯示每個(gè)職等的職業(yè)數(shù),職業(yè)分類-08的4位數(shù)職等有423個(gè)職業(yè)“6位數(shù)計(jì)數(shù)”列表示波蘭系統(tǒng)中映射到ISCO-08的4位數(shù)水平的職業(yè)數(shù)量占領(lǐng)軍由于缺乏具體任務(wù)而被排除在外份額表示每一組在相應(yīng)級(jí)別的百分比。該表只包括波蘭分類中有詳細(xì)任務(wù)的職業(yè);沒(méi)有任務(wù)的職業(yè)被排除在外。14勞工組織工作文件140作為第一步,我們對(duì)波蘭6位數(shù)系統(tǒng)中每項(xiàng)任務(wù)的潛在自動(dòng)化風(fēng)險(xiǎn)進(jìn)行了純粹的算法評(píng)估,并依賴于2024年底市場(chǎng)上的三種先進(jìn)LLM:GPT-4,GPT-4o和GeminiFlash1.5。該方法依賴于GBB(2023)先前使用的方法,其中順序API調(diào)用被設(shè)計(jì)為每個(gè)單獨(dú)的任務(wù)分配范圍從0到1的分?jǐn)?shù),其中0表示任務(wù)不能自動(dòng)化,1表示任務(wù)可以用GenAI技術(shù)完全自動(dòng)化(任務(wù)可以在沒(méi)有人類操作員參與的情況下進(jìn)行)。4法學(xué)碩士被提供有關(guān)職業(yè)的信息,該職業(yè)與ISCO-08中的任務(wù)有關(guān),并被要求為每個(gè)預(yù)測(cè)分?jǐn)?shù)提供理由、圖2.3個(gè)LLM的綜合自動(dòng)化分?jǐn)?shù)分布,按ISCO-081位數(shù)這些合成自動(dòng)化評(píng)分的總體分布與基于ISCO-08文件(GBB,2023;Gmyrek,Winkler和Garganta,2024)和O*NET(Elondou,2023;Felten,2023)的評(píng)分基本一致:GenAI的最高暴露通常在認(rèn)知性質(zhì)任務(wù)占最大份額的群體中觀察到,并且隨著物理性質(zhì)任務(wù)的下降,這在職業(yè)組4-9中更為突出(圖2)。高自動(dòng)化分?jǐn)?shù)的最大密度是在文書工作者中觀察到的,并且在三個(gè)LLM中保持穩(wěn)定在其他組中,我們觀察到LLM預(yù)測(cè)的一些重要差異特別是,GeminiFlash1.5似乎提供了雙峰評(píng)分,大多數(shù)分?jǐn)?shù)低于0.25或高于0.6。另外兩個(gè)模型提供了更廣泛的分?jǐn)?shù),但仍然有重要的分歧,這使得很難判斷應(yīng)該遵循哪一個(gè)模型5因此,我們沒(méi)有更詳細(xì)地研究這些分布,而是直接進(jìn)行改進(jìn),以提高我們預(yù)測(cè)的一致性和穩(wěn)定性,而不管應(yīng)用的LLM如何。 在GBB(2023)中,對(duì)評(píng)分和理由進(jìn)行了評(píng)估,以確保預(yù)測(cè)隨時(shí)間推移的一致性和穩(wěn)定性,并由人類審查書面理由。得分高于0.8(自動(dòng)化可能性高)的任務(wù)被轉(zhuǎn)換為嵌入,應(yīng)用語(yǔ)義聚類算法來(lái)識(shí)別這些任務(wù)的主要組,隨后由人類進(jìn)行審查。與GBB(2023)評(píng)分的比較表明,與波蘭任務(wù)數(shù)據(jù)庫(kù)的GPT-4o綜合評(píng)分最接近15勞工組織工作文件140為了提高我們的合成預(yù)測(cè)的精度,我們?cè)O(shè)計(jì)了一個(gè)基于人類的評(píng)估任務(wù)自動(dòng)化的潛力由于對(duì)所有29,753項(xiàng)任務(wù)進(jìn)行評(píng)分對(duì)于調(diào)查來(lái)說(shuō)過(guò)于繁瑣,因此我們將重點(diǎn)放在代表每個(gè)專業(yè)組1位數(shù)ISCO-08水平任務(wù)的子樣本上(表1)。我們采用標(biāo)準(zhǔn)公式計(jì)算樣本量(見附錄2)。表2列出了每個(gè)1位數(shù)類別的任務(wù)樣本計(jì)算根據(jù)國(guó)際勞工組織統(tǒng)計(jì)局用于微觀數(shù)據(jù)分析的一般規(guī)則,每個(gè)問(wèn)題的最低評(píng)分?jǐn)?shù)被設(shè)定為20,其中少于16個(gè)答復(fù)者的觀察被標(biāo)記為不可靠。根據(jù)我們對(duì)調(diào)查表潛在疲勞效應(yīng)的預(yù)測(cè)試,每個(gè)受訪者的評(píng)分?jǐn)?shù)設(shè)置為351616勞工組織工作文件140類別描述(1位)的任務(wù)數(shù)任務(wù)群)量樣本比例每個(gè)任務(wù)的評(píng)1經(jīng)理2I565百分之八點(diǎn)六384334百分之十一點(diǎn)七206682351912專業(yè)人員8I715百分之二十八384368百分之十二點(diǎn)九207357352103技術(shù)員和助理專業(yè)人員5I956點(diǎn)六21.1%384361百分之十二點(diǎn)六207216352064文書支助工作人員7682.6%3842569.0%205124351465服務(wù)和銷售人員1I7305.4%384314百分之十一點(diǎn)零206288351806農(nóng)業(yè)、林業(yè)和漁業(yè)熟練工人6842.3%384246百分之八點(diǎn)六204923351417手工藝及相關(guān)行業(yè)工人4I554百分之十五點(diǎn)五384354百分之十二點(diǎn)四207084352028工廠和機(jī)器操作員,以及裝配工3I769百分之十二點(diǎn)六384349百分之十二點(diǎn)二206972351999初等職業(yè)1I012百分之三點(diǎn)三384279百分之九點(diǎn)七205571351590武裝部隊(duì)占領(lǐng)總29I753百分之一百2I861100%的57I2181I635在這些初始參數(shù)范圍內(nèi),從每一大類職業(yè)的較大任務(wù)抽樣中隨機(jī)分配給每個(gè)答復(fù)者一組任務(wù)。任務(wù)樣本選擇的隨機(jī)化保持了與LLM最初生成的評(píng)分相似的評(píng)分分布的一般模式(第4.1節(jié))。然而,受訪者沒(méi)有意識(shí)到這些先前的分配,相反,他們收到了關(guān)于其自動(dòng)化潛力的廣泛任務(wù)17勞工組織工作文件140我們使用計(jì)算機(jī)輔助網(wǎng)絡(luò)訪談(CAWI)方法進(jìn)行了人類調(diào)查,該方法利用了波蘭的一個(gè)大型在線研究平臺(tái),用于商業(yè)和科學(xué)研究。這也意味著,一些人口統(tǒng)計(jì)學(xué)特征在調(diào)查部署階段已經(jīng)預(yù)先過(guò)濾,而另一些則在調(diào)查開始時(shí)通過(guò)一組核心問(wèn)題捕獲(表3)。具體而言,我們收集了受訪者的性別、年齡組、規(guī)模和居住地、居住地區(qū)、最高教育水平以及他們目前的職業(yè)。向答卷人提供職業(yè)分類-08一位數(shù)分類的簡(jiǎn)短說(shuō)明,以及適合每個(gè)類別的職業(yè)實(shí)例,進(jìn)一步便利了職業(yè)分類。除了人口統(tǒng)計(jì)信息外,隨后的核心問(wèn)題旨在獲取受訪者對(duì)GenAI的知識(shí)和經(jīng)驗(yàn)。這些問(wèn)題有助于了解GenAI的熟悉程度和互動(dòng)如何影響任務(wù)自動(dòng)化潛力的評(píng)估具體而言,受訪者被問(wèn)及他們?cè)诋?dāng)前職業(yè)中工作了多久(第四季度因?yàn)楦薪?jīng)驗(yàn)的員工可能對(duì)他們的工作有更深入的了解,并提供更謹(jǐn)慎或現(xiàn)實(shí)的評(píng)估。此外,他們還被問(wèn)及對(duì)人工智能的熟悉程度(問(wèn)題5),知識(shí)更淵博的受訪者可能會(huì)提供更知情的評(píng)價(jià)。我們還記錄了受訪者在工作中使用人工智能工具的頻率(第六季度),這可以深入了解他們與人工智能的實(shí)際互動(dòng)以及人工智能與日常任務(wù)的整合。最后,在核心問(wèn)題7-8中,我們?cè)儐?wèn)受訪者如何看待人工智能對(duì)其領(lǐng)域工作的更廣泛影響,幫助我們了解他們對(duì)未來(lái)五年自動(dòng)化的看法。本節(jié)的最后一個(gè)問(wèn)題探討了受訪者對(duì)自己的工作可能被人工智能部分或全部取代的可能性的看法,這有助于評(píng)估工作安全問(wèn)題是否會(huì)影響他們的任務(wù)評(píng)估。下文表3概述了核心問(wèn)題。1您的性別是男/女/其他/不說(shuō)2你多大了?年齡范圍(例如,18-24、25-34、35-44等)3你的最高教育水平是什么1.高中或同等學(xué)歷;2。學(xué)士學(xué)位;3.碩士學(xué)位;4.博士以上;5.其他4你在目前的職業(yè)中工作了多少年1.不到一年;2。1-5年;3。6-10歲;4。11-15歲;5.超過(guò)15年51.是;2.否;3.難說(shuō)5a例如,ChatGPT)?1.很低;2。低;3.平均值;4.擊掌。非常高6您多久使用一次生成式人工智能工具)?1.2.我的世界很少(一年幾次);3。偶爾(一個(gè)月幾次);4。經(jīng)常(每周幾次);5。每日7您認(rèn)為生成式人工智能(GenAI,例如ChatGPT)將如何在未來(lái)5年內(nèi)影響1.沒(méi)有任何影響;2。輕微影響;3.中等影響;4.強(qiáng)大的沖擊力;5.轉(zhuǎn)化影響力18勞工組織工作文件1408在未來(lái)5年內(nèi),你的工作在多大程度上會(huì)被生成型AI(例如ChatGPT)取代?不會(huì)被替換(0%)|------------------------------------------|將完全替代(100%);我不知道在其主要部分,調(diào)查轉(zhuǎn)向評(píng)估受訪者對(duì)任務(wù)自動(dòng)化潛力的看法每個(gè)受訪者都從他們的職業(yè)組中隨機(jī)選擇了35個(gè)1位數(shù)ISCO-08水平的任務(wù),如之前在樣本選擇過(guò)程中所述(第4.2節(jié))。對(duì)于每項(xiàng)任務(wù),受訪者被要求在0到100的范圍內(nèi)評(píng)估任務(wù)對(duì)生成AI自動(dòng)化的敏感性,0表示“不可自動(dòng)化”,100表示“完全自動(dòng)化”。6除了對(duì)自動(dòng)化潛力的任務(wù)進(jìn)行評(píng)分外,受訪者還被要求在每個(gè)任務(wù)旁邊的方框中打勾,以表明他們是否在當(dāng)前工作中親自執(zhí)行類似的任務(wù)這樣就可以比較GenAI對(duì)僅存在于受訪者職業(yè)組中的任務(wù)的影響,以及與受訪者當(dāng)前工作直接相關(guān)的任務(wù)下面是不同職業(yè)的人所做的35項(xiàng)任務(wù)請(qǐng)?jiān)u價(jià)你認(rèn)為人工智能可以自動(dòng)化每項(xiàng)任務(wù)的程度使用滑塊在0到100的范圍內(nèi)表達(dá)您的意見,其中0表示沒(méi)有自動(dòng)化的潛力,100表示完全有自動(dòng)化的潛力職業(yè):演員任務(wù)1:發(fā)展自己對(duì)角色的藝術(shù)概念滑塊量表(0-100):|0-使用GenAI沒(méi)有自動(dòng)化潛力|公司簡(jiǎn)介---------------------------------------------|100-全電位-使用GenAI實(shí)現(xiàn)自動(dòng)化|我不知道你在目前的工作中是否執(zhí)行過(guò)這一任務(wù)或類似的任務(wù)●是的●沒(méi)有該調(diào)查旨在收集目前在1位數(shù)ISCO-08框架的各個(gè)職業(yè)類別中工作的個(gè)人的見解。這意味著管理者的任務(wù)由管理者個(gè)人評(píng)估,專業(yè)人員的任務(wù)由專業(yè)人員評(píng)估,等等。隨后的數(shù)據(jù)分析根據(jù)個(gè)人對(duì)技術(shù)的態(tài)度,人工智能的知識(shí)和核心問(wèn)題中捕獲的其他參數(shù)探索了個(gè)人之間的差異(表A3)。受訪者也可以選擇“不知道”作為答案。19勞工組織工作文件140這種方法的優(yōu)點(diǎn)是,任務(wù)由那些熟悉自己專業(yè)背景的人來(lái)評(píng)估。不利的一面是,這種調(diào)查設(shè)計(jì)意味著樣本可能不代表整個(gè)工作人口,對(duì)自動(dòng)化潛力的意見的解釋僅限于每個(gè)1位數(shù)組內(nèi)的比較。我們還預(yù)計(jì),不同職業(yè)群體對(duì)任務(wù)和GenAI的理解和經(jīng)驗(yàn)存在不平衡,因?yàn)楣芾砣藛T或?qū)I(yè)人員可能比初級(jí)工人更了解AI,后者可能更好地理解初級(jí)工人任務(wù)的性質(zhì),但可能對(duì)GenAI工具不太熟悉我們通過(guò)幾種方式減輕這些負(fù)面影響首先,為了平衡參與者的理解水平,在調(diào)查第二部分的介紹中顯示了關(guān)于GenAI當(dāng)前能力的提示(見附錄中的文本框2和完整調(diào)查問(wèn)卷)。其次,我們對(duì)ILO、NASK和MOL專家進(jìn)行了一項(xiàng)調(diào)查,調(diào)查對(duì)象是從所有ISCO-08組中抽取的較小樣本任務(wù),并將這些結(jié)果與主要調(diào)查受訪者的結(jié)果進(jìn)行比較(第5節(jié))。在出現(xiàn)嚴(yán)重差異的情況下,我們與專家組協(xié)商,手動(dòng)確定似乎最合理的分?jǐn)?shù)。、文本框2.對(duì)調(diào)查對(duì)象的介紹性提示我們有一個(gè)簡(jiǎn)短的信息給你關(guān)于生成人工智能(我們有一個(gè)簡(jiǎn)短的信息給你關(guān)于生成人工智能(GenAI)。在我們的研究中,我們希望將GenAI與人工智能(AI)區(qū)分開來(lái)。人工智能允許您根據(jù)數(shù)據(jù)(例如在網(wǎng)上商店里下一個(gè)要給你提供什么產(chǎn)品,在停車場(chǎng)入口處識(shí)別汽車牌照,并提高門檻)GenAI可以生成新內(nèi)容,例如圖像,文本,語(yǔ)音最受歡迎的工具是ChatGPT,它可以回答問(wèn)題,寫電子郵件,準(zhǔn)備辦公室應(yīng)用程序創(chuàng)建報(bào)告,總結(jié)指定的文本(例如,一篇文章,一本書)。GenAI能做什么●寫一個(gè)文本,“假裝”是一個(gè)特定的人,例如。一位官員、詩(shī)人、金融分析師;●準(zhǔn)備語(yǔ)言之間的翻譯,例如從波蘭語(yǔ)到英語(yǔ);●將書面文本為人類語(yǔ)音(以給定語(yǔ)言“閱讀”文本●程序-將指定的任務(wù)更改為計(jì)算機(jī)語(yǔ)言代碼,例如Python,HTML;●生成圖像,例如基于給定的描述來(lái)識(shí)別照片,或者識(shí)別和描述圖像(例如,照片中的東西)。主要調(diào)查樣本包括57,400個(gè)觀察結(jié)果和1,640個(gè)獨(dú)立受訪者。其中,105名參與者對(duì)大多數(shù)問(wèn)題的回答是“不知道”,提供的任務(wù)排名不到50%。由于參與程度有限,這些參與者被從分析中刪除,因?yàn)樗麄儽徽J(rèn)為不夠可信。被排除在外的群體包括各種人口和職業(yè)概況,這些概況經(jīng)過(guò)仔細(xì)審查,以確保他們的20勞工組織工作文件140刪除不會(huì)給結(jié)果帶來(lái)重大偏差作為下一步,我們排除了1,167個(gè)觀察結(jié)果,其中參與者對(duì)任務(wù)自動(dòng)化潛力的排名做出了“不知道”的回應(yīng)這確保了分析只關(guān)注參與者認(rèn)為有能力提供有意義的投入的響應(yīng)。對(duì)“不知道”答案的詳細(xì)研究表明,在手工或技術(shù)領(lǐng)域-特別是在技術(shù)人員和助理專業(yè)人員(第3組)、手工藝和相關(guān)行業(yè)工人(第7組)、工廠和機(jī)器操作員和裝配工(第8組)以及初級(jí)職業(yè)人員(第9組)-出現(xiàn)的頻率是其他職業(yè)群體的兩倍。7由于GenAI的暴露和使用頻率的差異似乎不能證明這種模式是合理的(見第4.5.2節(jié)),這表明參與者可能感覺(jué)不太適合評(píng)估需要專業(yè)技術(shù)知識(shí)或手工技能的任務(wù)的自動(dòng)化潛力。這通過(guò)具有最大數(shù)量的“不知道”響應(yīng)(各7個(gè))的三個(gè)任務(wù)來(lái)說(shuō)明i)操作用于將發(fā)酵乳塊分離成酵母漿的裝置(離心機(jī)和過(guò)濾器ii)記錄遞送的貨物和收集的硬幣(代幣以及(iii)組織和清潔工作站。排除后,我們保留了1,535名受訪者的大量樣本,共提供了52,558個(gè)數(shù)據(jù)點(diǎn)。這些數(shù)據(jù)點(diǎn)僅對(duì)應(yīng)于參與者對(duì)有關(guān)任務(wù)自動(dòng)化潛力的主要調(diào)查問(wèn)題提供有效回答的情況。重要的是,這種過(guò)濾過(guò)程并沒(méi)有減少評(píng)估的任務(wù)總數(shù),如表2所計(jì)算的,其仍然是2,861的代表性樣本量、圖3.與波蘭勞動(dòng)力調(diào)查數(shù)據(jù)相比,調(diào)查中的年齡和性別分布(就業(yè)個(gè)人)調(diào)查樣本在性別方面很均衡,51%為女性,49%為男性。波蘭18歲以上就業(yè)人口的實(shí)際性別分布更偏向于男性,53.9%的就業(yè)人員為男性,46%為女性。如圖3所示,這導(dǎo)致調(diào)查中年輕年齡段(18-29歲和30-39歲)的女性意見占多數(shù)。 平均而言,這些技術(shù)組中約10%的答案是“不知道”,而其他組中只有5%21勞工組織工作文件140、圖4.與波蘭勞動(dòng)力調(diào)查(就業(yè)個(gè)人)和所需樣本相比,調(diào)查中職業(yè)群體的分布情況(表2)圖4顯示了調(diào)查樣本在ISCO-081位數(shù)組中的更廣泛分布,與勞動(dòng)力調(diào)查中的就業(yè)人口和所需樣本(表2)一致專業(yè)人員(2)與實(shí)際就業(yè)人數(shù)相比,在調(diào)查答復(fù)中,第1、第8和第9組的就業(yè)人數(shù)明顯偏多。然而,值得注意的是,表2中根據(jù)每個(gè)1位數(shù)類別中的任務(wù)份額計(jì)算的理想樣本與某些職業(yè)組的LFS結(jié)構(gòu)更接近。、圖5.與波蘭勞動(dòng)力調(diào)查相比,調(diào)查參與者的職業(yè)和性別分布情況(就業(yè)人員)就職業(yè)中與性別有關(guān)的代表性而言,最大的不平衡發(fā)生在公共當(dāng)局、高級(jí)官員和管理人員(1人)、辦事員和初級(jí)職業(yè)(9人)等職業(yè)群體中,在調(diào)查中,這些職業(yè)群體的婦女代表性明顯高于勞動(dòng)力市場(chǎng)(圖5)。與勞動(dòng)力調(diào)查相比,男性在專業(yè)人員(1人)和手工藝工人(7人)中的代表性不足。對(duì)于其他職業(yè)群體,調(diào)查模式與國(guó)家勞動(dòng)力市場(chǎng)趨勢(shì)相當(dāng)一致。這些差異值得注意,但并不影響我們的戰(zhàn)略,因?yàn)槲覀兊氖滓繕?biāo)是抽樣是為了確保任務(wù)在職業(yè)1位數(shù)組水平上的代表性22勞工組織工作文件140而不是復(fù)制就業(yè)人口的確切性別和經(jīng)濟(jì)結(jié)構(gòu)(表2)。在達(dá)到這個(gè)目標(biāo)后,我們沒(méi)有對(duì)調(diào)查樣本進(jìn)行額外的權(quán)重調(diào)整相反,調(diào)查和LFS之間的偏差被視為本研究特定任務(wù)特征固有的自然變化,這遵循了1位數(shù)組之間任務(wù)總數(shù)的不平衡以及第4.2節(jié)中的其他假設(shè)3.5.2.參與者對(duì)GenAI的暴露:篩選問(wèn)題調(diào)查的篩選部分測(cè)試了參與者之前對(duì)GenAI的暴露絕大多數(shù)調(diào)查參與者(71.2%)報(bào)告說(shuō)聽說(shuō)過(guò)這項(xiàng)技術(shù),性別和職業(yè)群體之間的差異相對(duì)較小盡管人們對(duì)GenAI的認(rèn)知程度很高,但GenAI的實(shí)際使用仍然有限,大多數(shù)受訪者表示他們“從不”(50.1%)或“很少”(26%)使用它。17.4%的參與者報(bào)告偶爾使用(每月幾次只有4.8%的人報(bào)告經(jīng)常使用,不到2%的人經(jīng)常使用。在1位數(shù)職業(yè)群體中,專業(yè)人員、技術(shù)人員、公共機(jī)構(gòu)、高級(jí)官員和管理人員比手工任務(wù)較多的群體更頻繁地使用這些技術(shù)(圖6)。這似乎與最近對(duì)GenAI采用的研究一致,這些研究表明,在認(rèn)知工作份額較大的職業(yè)中,GenAI的使用率較高(Bick等人,2024;Parker等人,2025年)。在考慮GenAI對(duì)其行業(yè)內(nèi)工作的潛在影響時(shí),大多數(shù)受訪者預(yù)計(jì)不會(huì)產(chǎn)生影響(26.5%)或只有輕微影響(30.2%)。如圖7所示,手冊(cè)和技術(shù)組的此類響應(yīng)所占比例明顯較高。報(bào)告中度和重大影響的專業(yè)人員(33.8%和20.4%),公共機(jī)構(gòu),高級(jí)官員和管理人員(31.5%和24%),文書支持人員(22.5%和21.1%)和技術(shù)人員(27.3%為中度影響),盡管后者對(duì)重大影響的預(yù)期明顯較低(14.4%)。這可能是由于這個(gè)專業(yè)群體的許多任務(wù)固有的復(fù)雜性。相比之下,相對(duì)較少的受訪者預(yù)測(cè)他們的職業(yè)會(huì)發(fā)生徹底的轉(zhuǎn)變,其中服務(wù)和銷售工作者(5.1%)和文書支持工作者(4.2%)的這種反應(yīng)比例最高,這些觀察結(jié)果的總數(shù)很少23勞工組織工作文件140、圖7.對(duì)工作區(qū)域的影響預(yù)期我們通過(guò)詢問(wèn)受訪者一個(gè)更私人的問(wèn)題來(lái)進(jìn)一步研究這些趨勢(shì),這個(gè)問(wèn)題與他們認(rèn)為GenAI在未來(lái)五年內(nèi)取代他們目前工作的可能性有關(guān)。對(duì)于大多數(shù)專業(yè)人士來(lái)說(shuō),反應(yīng)集中在風(fēng)險(xiǎn)譜的低端,表明對(duì)中期GenAI替代的關(guān)注有限(圖8)。然而,在文書支持人員中,代表中度至高度關(guān)注的答復(fù)密度明顯較高,女性報(bào)告的風(fēng)險(xiǎn)略高于男性,而在工廠和機(jī)器操作員和裝配工中觀察到的情況正好相反。該調(diào)查要求受訪者評(píng)估GenAI可以自動(dòng)執(zhí)行各種任務(wù)的程度(見文本框1)。如圖9所示,答復(fù)顯示了與職業(yè)隔離相一致的性別評(píng)分。例如,文書支助人員提供的分?jǐn)?shù)主要來(lái)自婦女,反映了婦女在這一職業(yè)群體中的高代表性。然而,從事這一職業(yè)的男性往往會(huì)給自己打更高的分?jǐn)?shù),24勞工組織工作文件140反映了對(duì)任務(wù)自動(dòng)化的不同看法或?qū)ξ穆毠ぷ鞯钠姡M管他們?cè)谶@一群體中的代表性較低。相反,在手工藝和貿(mào)易工人以及工廠和機(jī)器操作員等職業(yè)中,男性占主導(dǎo)地位,但對(duì)于這些職業(yè)中的任務(wù),他們的得分低于女性。這些差異可能代表了不同的任務(wù)構(gòu)成,甚至是男女所從事的任務(wù),即使是在同一職業(yè)類別中,也會(huì)影響他們的得分。為了更好地了解與較高的任務(wù)自動(dòng)化分?jǐn)?shù)相關(guān)的因素,我們使用主要任務(wù)水平分?jǐn)?shù)作為因變量并控制職業(yè)聚類進(jìn)行了一組探索性回歸。結(jié)果表明,在不同的職業(yè)中,對(duì)任務(wù)的熟悉程度與更高的分?jǐn)?shù)相關(guān),并且這種關(guān)系隨著GenAI的暴露而加強(qiáng)。經(jīng)常使用GenAI的受訪者-例如每天或每周-傾向于分配更高的分?jǐn)?shù)。同樣,那些認(rèn)為GenAI將對(duì)他們的職業(yè)產(chǎn)生“完全”或“重大影響”的人始終分配最高的任務(wù)分?jǐn)?shù)(圖10)。8 這些結(jié)果是基于為描述目的而進(jìn)行的探索性回歸完整的模型規(guī)范、診斷和魯棒性檢查超出了本文的范圍,因?yàn)樵撜{(diào)查是多層細(xì)化方法的起點(diǎn)。對(duì)評(píng)分行為進(jìn)行更全面的計(jì)量經(jīng)濟(jì)學(xué)分析,包括模型選擇和潛在混淆因素的處理,可以作為單獨(dú)的方法論論文的重點(diǎn)25勞工組織工作文件140、圖10.評(píng)分作為GenAI熟悉度和評(píng)分任務(wù)的函數(shù)-個(gè)體評(píng)分分布解決這種評(píng)分差異的一種方法是對(duì)答復(fù)采用糾正權(quán)重,使可能具有更相關(guān)專門知識(shí)的答復(fù)者概況具有更大的影響力例如,可以為報(bào)告對(duì)GenAI更熟悉或頻繁使用的受訪者分配更多權(quán)重,或者優(yōu)先考慮在日常工作中執(zhí)行類似任務(wù)的個(gè)人的分?jǐn)?shù)然而,在我們的樣本中,這將引入顯著的限制。對(duì)于91.5%的任務(wù),受訪者沒(méi)有報(bào)告在他們的工作中執(zhí)行類似的任務(wù)-即使任務(wù)屬于與他們當(dāng)前工作相同的1位數(shù)職業(yè)組這并不奇怪。例如,僅在“專業(yè)人員”組中,代表性樣本包括從8,715個(gè)任務(wù)池中抽取的368個(gè)任務(wù)(表2),使得精確的任務(wù)匹配不太可能。此外,調(diào)整信念或使用將需要強(qiáng)有力的理論假設(shè),什么構(gòu)成“可信”的評(píng)分。例如,一個(gè)認(rèn)為自己的職業(yè)將在未來(lái)五年內(nèi)被GenAI徹底改變的受訪者可能是高度知情的,或者可能表達(dá)了焦慮、猜測(cè)或反烏托邦式的恐懼。如果沒(méi)有更豐富的數(shù)據(jù)來(lái)區(qū)分這些解釋,應(yīng)用校正權(quán)重可能會(huì)引入新的偏見。鑒于我們的數(shù)據(jù)集中這些特定亞組的規(guī)模相對(duì)較小,我們避免在當(dāng)前分析中實(shí)施此類調(diào)整,以避免過(guò)度擬合或損害可驗(yàn)證性。相反,我們將此標(biāo)記為未來(lái)調(diào)查設(shè)計(jì)的一個(gè)重要領(lǐng)域,特別是在更系統(tǒng)地捕捉受訪者的專業(yè)知識(shí)和任務(wù)熟悉度在本研究中,我們將調(diào)查作為起點(diǎn),旨在捕捉廣泛的視角,反映對(duì)任務(wù)和GenAI的不同熟悉程度在許多情況下,受訪者對(duì)任務(wù)本身的理解可能比他們對(duì)技術(shù)的理解更有影響力,特別是對(duì)于具體的物理任務(wù)(例如,修剪花卉、組裝機(jī)械部件)。因此,我們依靠所有受訪者的平均得分來(lái)反映基于工作經(jīng)驗(yàn)的多元化樣本的集體判斷加強(qiáng)26勞工組織工作文件140魯棒性,我們用專家對(duì)任務(wù)子集的評(píng)估來(lái)補(bǔ)充這一點(diǎn)(第5節(jié)),確保27勞工組織工作文件140專家組包括國(guó)際勞工組織及其伙伴組織、NASK以及波蘭家庭、勞動(dòng)和社會(huì)政策部的國(guó)際專家。9專家選擇的主要標(biāo)準(zhǔn)是他們對(duì)勞動(dòng)力市場(chǎng)的理解,包括職業(yè)和任務(wù)的復(fù)雜性及其實(shí)際應(yīng)用。雖然專家應(yīng)該熟悉當(dāng)前的生成式AI技術(shù)及其應(yīng)用,但AI設(shè)計(jì)或開發(fā)方面的專業(yè)知識(shí)不是必需的。這種方法確保重點(diǎn)仍然放在現(xiàn)有技術(shù)限制下自動(dòng)化的可行性和實(shí)際影響上,因?yàn)榧夹g(shù)專家在評(píng)估更廣泛的應(yīng)用,特別是在工作場(chǎng)所環(huán)境中,往往會(huì)夸大技術(shù)能力和風(fēng)險(xiǎn)(Karger等人,2023年)。這種趨勢(shì)在早期的自動(dòng)化研究中很明顯,這些研究通常將高位移潛力分配給常規(guī)任務(wù)或完整的職業(yè),如服裝生產(chǎn)。如deMattosetal.(2020)舉例說(shuō)明,這些技術(shù)預(yù)測(cè)經(jīng)常未能解決需要高度靈活性或處理復(fù)雜材料(例如縫合柔韌織物)的自動(dòng)化任務(wù)的挑戰(zhàn)。因此,我們研究中對(duì)自動(dòng)化潛力的評(píng)估優(yōu)先考慮任務(wù)執(zhí)行和工作場(chǎng)所現(xiàn)實(shí)的專業(yè)知識(shí),而不是純粹的技術(shù)專業(yè)知識(shí)。由于專家無(wú)法審查調(diào)查中使用的所有2,861個(gè)任務(wù),我們將重點(diǎn)放在一個(gè)具有代表性的子樣本上,以這種方式選擇,以便隨后對(duì)整個(gè)任務(wù)集群進(jìn)行調(diào)整。該評(píng)分調(diào)整程序的總體方案見圖11。首先,我們根據(jù)調(diào)查平均分的分布將任務(wù)聚類為四個(gè)固定間隔。10然后,我們使用層次聚類,根據(jù)它們的語(yǔ)義內(nèi)容在這些聚類中對(duì)相似的任務(wù)進(jìn)行分組。首先,我們使用OpenAI的text-embedding-ada-002模型為每個(gè)任務(wù)描述分配接下來(lái),對(duì)于每個(gè)子組(由ISCO-081位數(shù)級(jí)別的職業(yè)組和特定調(diào)查得分聚類的組合定義我們 在致謝一節(jié)中提供了完整的捐助者名單μ[0,0.1](0.1,0.3](0.3,0.5](0.5,1]28勞工組織工作文件140Ward'shierarchicalclustering(Ward的分層聚類)[11]我們?yōu)槊總€(gè)子組生成一個(gè)樹狀圖,沿水平軸繪制任務(wù),沿垂直軸繪制鏈接距離(或“高度”)然后通過(guò)在選定的連鎖高度“切割”樹狀圖來(lái)形成簇,使得該切割線以下的每個(gè)分支成為其自己的簇(圖12)。在我們的方法中,我們通過(guò)對(duì)譜系圖的目視檢查為每個(gè)子組手動(dòng)選擇高度閾值。這允許我們靈活地適應(yīng)子組任務(wù)之間的異質(zhì)性,以確保每個(gè)最終集群包含內(nèi)容真正相似的任務(wù)。一旦確定了距離閾值,子組中的所有任務(wù)都被分配到一個(gè)唯一的集群。對(duì)于每個(gè)職業(yè)分?jǐn)?shù)聚類組合重復(fù)該過(guò)程。雖然我們的視覺(jué)檢查引入了主觀判斷的元素,但它確保避免了虛假或極細(xì)粒度的分割,有助于為隨后的專家評(píng)審保持任務(wù)的連貫分組、圖12.用于查看任務(wù)語(yǔ)義聚類的樹狀圖示例一旦每個(gè)任務(wù)被分配到一個(gè)集群,根據(jù)其1位數(shù)的職業(yè)組,從調(diào)查和任務(wù)的語(yǔ)義相似性得分括號(hào),我們生成的任務(wù)的最終樣本的專家審查。為了確保覆蓋所有集群,同時(shí)限制專家的總負(fù)擔(dān),我們應(yīng)用了一個(gè)縮放因子(設(shè)置為20%)來(lái)確定從每個(gè)組中采樣的12然后,我們強(qiáng)制每個(gè)集群最少執(zhí)行一個(gè)任務(wù)(以避免完全排除較小的集群),每個(gè)集群最多執(zhí)行五個(gè)任務(wù),以保持工作負(fù)載可管理。通過(guò)這個(gè)過(guò)程,我們實(shí)現(xiàn)了一個(gè)平衡的,但緊湊的樣本,捕捉語(yǔ)義的多樣性,同時(shí)防止過(guò)采樣從任何單一的集群。我們保留每個(gè)任務(wù)的聚類分配,以便專家評(píng)審可以隨后循環(huán)回抽樣任務(wù)所源自的聚類中的分?jǐn)?shù)。 Ward的方法尋求最小化每個(gè)聚類內(nèi)的方差,使其特別適合于具有不同文本內(nèi)容的任務(wù)具體而言,該公式采用每個(gè)聚類相對(duì)于組總數(shù)的大小乘以縮放因子。29勞工組織工作文件140然后將選定的608項(xiàng)任務(wù)中的每一項(xiàng)提交給一個(gè)專家小組對(duì)于每項(xiàng)任務(wù),向?qū)嶒?yàn)者顯示(i)職業(yè)和聚類信息ii)平均調(diào)查分?jǐn)?shù)(重新標(biāo)度為0-1以及(iii)完整的任務(wù)描述。如果他們同意調(diào)查分?jǐn)?shù),他們保持不變;否則,他們輸入修改后的專家分?jǐn)?shù)(0-1)。在許多情況下,調(diào)查和專家評(píng)分之間的差異是不小的。不同職業(yè)組之間的差異也很大,顯示出基于相關(guān)任務(wù)性質(zhì)的不同模式(圖13)。在手工和體力任務(wù)占主導(dǎo)地位的職業(yè)中,如手工藝和相關(guān)行業(yè)工人、工廠和機(jī)器操作員以及農(nóng)民、園丁、林業(yè)工人和漁民,與調(diào)查回復(fù)相比,專家們的評(píng)分一直較低,反映了需要體力操作或手工靈巧的自動(dòng)化任務(wù)的實(shí)際局限性。相比之下,涉及更多認(rèn)知或知識(shí)密集型任務(wù)的職業(yè),如文書支持人員和專業(yè)人員,則表現(xiàn)出更為復(fù)雜的情況。雖然這些組中的一些任務(wù)得分較低,但專家組對(duì)其他許多任務(wù)進(jìn)行了向上修訂,反映了生成式人工智能對(duì)結(jié)構(gòu)化、數(shù)據(jù)驅(qū)動(dòng)或以通信為重點(diǎn)的任務(wù)的更大適應(yīng)性。例如,文書支持工作人員顯示出增加和減少的組合,這表明對(duì)特定任務(wù)進(jìn)行了細(xì)致入微的評(píng)估,其中自動(dòng)化潛力在很大程度上取決于單個(gè)任務(wù)的性質(zhì)。30勞工組織工作文件140、在下一步中,我們使用兩個(gè)獨(dú)立的AI模型作為公正的仲裁者,將專家評(píng)分的平均值與原始平均調(diào)查評(píng)分進(jìn)行比較,以提出調(diào)整后的評(píng)分。13模型被告知評(píng)分來(lái)源的方式將防止他們自動(dòng)站在專家組一邊:第一組被定義為“對(duì)他們所面臨的工作和任務(wù)類型的實(shí)際知識(shí),因?yàn)樗麄冊(cè)谖覀冞x擇他們?cè)u(píng)分的任務(wù)的相同職業(yè)組中工作”,而第二組被描述為“對(duì)技術(shù)和勞動(dòng)力市場(chǎng)具有更多理論知識(shí)的受訪者”。這些模型不是簡(jiǎn)單地平均兩個(gè)分?jǐn)?shù),而是被明確指示將其分析集中在任務(wù)特征和生成AI的當(dāng)前能力上,并要求為每次調(diào)整及其與原始分?jǐn)?shù)的相對(duì)位置提供理由。、圖13.來(lái)自調(diào)查和專家的任務(wù)級(jí)別分?jǐn)?shù),與人工智能仲裁的分?jǐn)?shù)相比兩個(gè)人工智能模型產(chǎn)生的調(diào)整后分?jǐn)?shù)之間的總體相關(guān)性為0.96,除一個(gè)案例外,職業(yè)組內(nèi)的相關(guān)性均超過(guò)0.9(圖14)。這種高水平的一致性表明,當(dāng)以分?jǐn)?shù)的參考范圍的形式提供足夠的背景知識(shí)時(shí),模型收斂于非常相似的預(yù)測(cè)。值得注意的是,只有三項(xiàng)任務(wù)的得分絕對(duì)差異超過(guò)0.2(圖13中的橙色點(diǎn))。在這些情況下,GPT-4o傾向于對(duì)自動(dòng)化的可行性采取更樂(lè)觀的觀點(diǎn),而Gemini則強(qiáng)調(diào)人類判斷的重要性。 我們使用了OpenAI的GPT-4o和Google的GeminiFlash1.5,它們具有相當(dāng)?shù)哪芰ΑN覀冞€測(cè)試了OpenAIo1,它在撰寫本文時(shí)是具有最強(qiáng)“算法推理”能力的模型之一,并觀察到非常相似的結(jié)果。這個(gè)過(guò)程被設(shè)置為一個(gè)順序API調(diào)用的循環(huán),它循環(huán)每個(gè)任務(wù)并將響應(yīng)捕獲到數(shù)據(jù)幀中。公共當(dāng)局、高級(jí)官員和管理人員。31勞工組織工作文件140對(duì)于最后的調(diào)整,我們對(duì)兩個(gè)仲裁模型的得分取平均值,并手動(dòng)審查理由,沒(méi)有觀察到任何顯著的不一致。表4通過(guò)專家評(píng)分顯著高于或低于調(diào)查平均值的任務(wù)示例說(shuō)明了調(diào)整過(guò)程的結(jié)果,并給出了最終調(diào)整后的評(píng)分和GPT-4o理由。對(duì)于“操作注塑機(jī)”或“執(zhí)行硅的機(jī)械加工”等任務(wù),專家們強(qiáng)調(diào)了生成式人工智能在處理物理和手動(dòng)組件方面的局限性,導(dǎo)致調(diào)整后的分?jǐn)?shù)與調(diào)查相比顯著降低相反,對(duì)于“維護(hù)有孩子的課程文件”或“對(duì)家庭預(yù)算進(jìn)行財(cái)務(wù)估算”等任務(wù),專家們認(rèn)識(shí)到這些任務(wù)的結(jié)構(gòu)化和分析性,生成式人工智能可以在很大程度上提供幫助。、表4.調(diào)查和專家評(píng)分之間的調(diào)整和理由示例(最大幅度上調(diào)和下調(diào)的理由根據(jù)培訓(xùn)或資質(zhì),采用各種焊接方法,使用不同類型的焊接機(jī)器和設(shè)0.430.050.05這項(xiàng)任務(wù)涉及需要技能和精度的實(shí)際工作,例如使用各種機(jī)器進(jìn)行焊接,目前還無(wú)法通過(guò)ChatGPT等生成式AI技術(shù)實(shí)現(xiàn)自動(dòng)化。這些技術(shù)在涉及數(shù)據(jù)處理、語(yǔ)言理解和信息生后的分?jǐn)?shù)更接近。32勞工組織工作文件140理由進(jìn)行紙牌游戲-檢查用于游戲的牌的標(biāo)記、磨損程度和數(shù)量的狀況,驗(yàn)證下注、洗牌、發(fā)牌和展示牌的正確性,宣布牌的總數(shù),根據(jù)游戲規(guī)則中規(guī)定的比率進(jìn)行支付。0.550.190.25雖然生成式人工智能可以幫助理解游戲規(guī)則、驗(yàn)證投注以及進(jìn)行數(shù)字紙牌游戲的某些方面,但紙牌的物理處理、檢查其狀況以及確保洗牌和發(fā)牌的公平性仍然需要人性化。理論組較低的分?jǐn)?shù)反映了將AI應(yīng)用于任務(wù)的特定物理和交互元素的挑戰(zhàn)。因此,較低的修訂分?jǐn)?shù)更多地反映了自動(dòng)化此類工作的實(shí)際限制。在新工作站安裝和啟動(dòng)機(jī)械和電氣機(jī)器人及外圍設(shè)備0.550.190.25在新工作站安裝和啟動(dòng)機(jī)械和電氣機(jī)器人及外圍設(shè)備需要?jiǎng)邮旨寄堋⒕_校準(zhǔn)以及與物理硬件交互的能力雖然生成式AI可以幫助規(guī)劃、文檔和故障排除指南,但物理安裝和因此,較低的0.1925分更能反映真實(shí)性,盡管略微向上調(diào)整至0.25分,以承認(rèn)人工智能在提供信息或指示方面的支持作執(zhí)行任務(wù)。為不同年齡組舉辦主題活動(dòng)(康樂(lè)、體育、娛樂(lè))0.160.380.3雖然生成式人工智能可以根據(jù)輸入?yún)?shù)提出想法并開發(fā)主題活動(dòng),但組織此類活動(dòng)需要了解群體動(dòng)態(tài),自發(fā)決策以及根據(jù)參與者互動(dòng)和偏好調(diào)整計(jì)劃的能力人工智能可以幫助規(guī)劃和提供內(nèi)容創(chuàng)意,但人類監(jiān)督仍然是確保參與和安全的必要條件,特別是在迎合不同年齡組時(shí)。因此,0.3分反映了人工智能在這項(xiàng)任務(wù)中的支持作用,而不是完全自動(dòng)化的能力。執(zhí)行財(cái)務(wù)評(píng)估以制定家庭預(yù)算0.370.640.64化。GenAI可以生成預(yù)算模板,根據(jù)數(shù)據(jù)輸入提供財(cái)務(wù)建議,并模擬不同的財(cái)務(wù)場(chǎng)景,這與理論組的0.64的較高得分密切相關(guān),表明AI當(dāng)前能力的自動(dòng)化潛力很大。33勞工組織工作文件140理由維護(hù)與兒童一起上課的0.160.430.3生成式AI可以通過(guò)生成模板、格式化和匯總信息來(lái)幫助維護(hù)文檔然而,課堂內(nèi)容、學(xué)生個(gè)人進(jìn)步和教師觀察的細(xì)微差別需要人工監(jiān)督,限制了完全自動(dòng)化的潛力。我的分?jǐn)?shù)與更高的修訂分?jǐn)?shù)更接近,承認(rèn)GenAI的能力,同時(shí)認(rèn)識(shí)到人類參與的必要性34勞工組織工作文件140在調(diào)整了608項(xiàng)任務(wù)后,我們對(duì)剩下的2,253項(xiàng)任務(wù)進(jìn)行了預(yù)測(cè),其中2,861項(xiàng)任務(wù)在最初的調(diào)查中得到了分?jǐn)?shù)。這些任務(wù)中的每一個(gè)都鏈接到一個(gè)參考集群和語(yǔ)義相似的任務(wù),這些任務(wù)在前面的步驟中進(jìn)行了審查和調(diào)整(見第5節(jié)和第6節(jié))。為了確保一致性,AI模型提供了相同職業(yè)組和評(píng)分范圍內(nèi)語(yǔ)義相似任務(wù)按照第6節(jié)中概述的方法,我們利用兩個(gè)獨(dú)立的AI模型來(lái)生成預(yù)測(cè),在所有數(shù)據(jù)點(diǎn)上實(shí)現(xiàn)了0.95的相關(guān)系數(shù)。最終預(yù)測(cè)得分確定為兩個(gè)模型輸出的平均值。、圖15.對(duì)主調(diào)查中的2,861項(xiàng)任務(wù)進(jìn)行調(diào)查評(píng)分、專家評(píng)估和最終調(diào)整圖15顯示了主調(diào)查中所有2,861項(xiàng)任務(wù)的得分,按初始調(diào)查得分的大小順序排列在橫軸上。每個(gè)小組代表一個(gè)不同的職業(yè)群體。紅點(diǎn)表示從調(diào)查答復(fù)中得出的平均分?jǐn)?shù),而紫色菱形表示專家對(duì)有此類分?jǐn)?shù)的任務(wù)的評(píng)價(jià)。橙色正方形顯示最終調(diào)整后的分?jǐn)?shù),基于人工智能驅(qū)動(dòng)的調(diào)查和專家評(píng)估的協(xié)調(diào),對(duì)于具有兩個(gè)輸入的任務(wù),綠色三角形表示基于人工智能的預(yù)測(cè),對(duì)于沒(méi)有專家分?jǐn)?shù)的任務(wù),使用相應(yīng)集群的參考分?jǐn)?shù)作為上下文。藍(lán)線說(shuō)明了最終得分的總體趨勢(shì)(調(diào)整后和預(yù)測(cè)得分的混合),更多手動(dòng)任務(wù)的得分明顯降低。35勞工組織工作文件140作為最后一步,我們使用2,861個(gè)任務(wù)的調(diào)整后的調(diào)查分?jǐn)?shù)來(lái)開發(fā)一個(gè)AI助手,該助手能夠預(yù)測(cè)各種分類系統(tǒng)中新任務(wù)的綜合分?jǐn)?shù)。這將人類專業(yè)知識(shí)的優(yōu)勢(shì)與生成式AI的能力相結(jié)合,能夠根據(jù)精確的指令生成一致的大規(guī)模響應(yīng)。、文本框3.LLM提示符的概念結(jié)構(gòu)(GPT-4o的Python代碼為了開發(fā)我們的預(yù)測(cè)模型,我們?cè)u(píng)估了兩種方法i)使用2,861個(gè)任務(wù)數(shù)據(jù)集微調(diào)大型語(yǔ)言模型(LLM)或(ii)設(shè)計(jì)高級(jí)提示策略(提示工程)。微調(diào),雖然有希望學(xué)習(xí)特定領(lǐng)域的模式,36勞工組織工作文件140資源密集型,并受到我們相對(duì)較小的數(shù)據(jù)集的限制。[15]相反,通過(guò)在提示符中使用足夠大的示例任務(wù)集,我們可以為模型提供主數(shù)據(jù)集中類似任務(wù)評(píng)分的顯式“演示”。為了確保平衡的方法,我們?yōu)槊總€(gè)提示提供了具有最高50分和最低50分的任務(wù)的樣本,以及與模型被要求評(píng)分的任務(wù)具有最大語(yǔ)義相似性的30個(gè)任務(wù)的分?jǐn)?shù)為了創(chuàng)建語(yǔ)義上下文,我們構(gòu)建了一個(gè)快速搜索向量數(shù)據(jù)庫(kù),其中包含所有2,861個(gè)調(diào)整后的分?jǐn)?shù)。在每個(gè)API調(diào)用開始時(shí)查詢數(shù)據(jù)庫(kù),并提取與正在評(píng)分的任務(wù)具有語(yǔ)義相似性一旦檢索到30個(gè)最相似的任務(wù),一組完整的指令就被傳遞給模型的API,如方框3中所示的一般提示策略我們首先使用來(lái)自調(diào)查的任務(wù)樣本來(lái)驗(yàn)證預(yù)測(cè)模型,這些任務(wù)根據(jù)第5-7節(jié)進(jìn)行了調(diào)整,但不包括在提供給模型的語(yǔ)義上下文[16]一旦即時(shí)調(diào)整提供了令人滿意的性能,我們使用相同的系統(tǒng)來(lái)預(yù)測(cè)ISCO-08中3,265個(gè)任務(wù)的自動(dòng)化分?jǐn)?shù)(如Gmyrek等人,2023年)。17這種方法將專家驗(yàn)證的人工評(píng)估與基于LLM的預(yù)測(cè)的可擴(kuò)展性聯(lián)系在一起,為跨分類系統(tǒng)的任務(wù)提供一致和可擴(kuò)展的評(píng)分。為了進(jìn)一步完善我們的評(píng)分系統(tǒng),我們過(guò)濾了364個(gè)任務(wù),其中2025年的評(píng)分變化超過(guò)2023年評(píng)分絕對(duì)值的25%。我們使用專家共識(shí)建立方法手動(dòng)審查這些任務(wù)首先,我們?cè)诤现咧羞M(jìn)行了一次小型調(diào)查,要求每位受訪者在不同的分?jǐn)?shù)之間進(jìn)行仲裁。對(duì)于64個(gè)ISCO-08任務(wù),我們?nèi)匀挥^察到專家意見的分歧,我們進(jìn)行了詳細(xì)的小組討論,以達(dá)成共識(shí)并就理由達(dá)成一致在最后的手動(dòng)驗(yàn)證過(guò)程之后,我們建立了第二個(gè)知識(shí)庫(kù),也存儲(chǔ)在矢量數(shù)據(jù)庫(kù)中。然后,通過(guò)對(duì)每個(gè)預(yù)測(cè)進(jìn)行兩次連續(xù)的語(yǔ)義上下文檢索,更新主LLM提示,以納入此額外的參考,進(jìn)一步提高模型在預(yù)測(cè)新任務(wù)得分時(shí)的精度。使用這種方法,我們?yōu)椴ㄌm分類系統(tǒng)中的所有29,753個(gè)任務(wù)生成預(yù)測(cè)(表1)。為了將這些6位數(shù)的預(yù)測(cè)與4位數(shù)的ISCO-08分類進(jìn)行比較,我們計(jì)算了(i)在4位數(shù)水平上匯總的所有任務(wù)得分的平均值和(ii)6位數(shù)水平上的職業(yè)平均值,隨后從這些6位數(shù)組成部分推導(dǎo)出4位數(shù)平均值在這兩種情況下,基于ISCO-08任務(wù)和波蘭語(yǔ)6位數(shù)任務(wù)的預(yù)測(cè)之間的相關(guān)性為0.92,證明了預(yù)測(cè)的異常穩(wěn)定性換句話說(shuō),盡管人們可能會(huì)質(zhì)疑我們知識(shí)庫(kù)中任務(wù)的準(zhǔn)確得分--這并非我們研究所獨(dú)有的挑戰(zhàn)--但一旦知識(shí)庫(kù)和提示技術(shù)到位,模型就會(huì)根據(jù)參考任務(wù)及其得分持續(xù)產(chǎn)生穩(wěn)定的預(yù)測(cè),而不考慮職業(yè)分類系統(tǒng)。這種方法為在其他職業(yè)分類中復(fù)制提供了有希望的可能性,我們打算進(jìn)一步探索在本文的其余部分,我們主要關(guān)注修訂ISCO-08分?jǐn)?shù),將波蘭6位數(shù)職業(yè)的詳細(xì)分析留給單獨(dú)的研究(Gmyrek等人,即將于2025年出版)。參見OpenAI微調(diào)指南和開發(fā)者論壇/docs/guides/fine-tuning。這些任務(wù)被分成80-20的比例,其中80%用于培訓(xùn),20%用于驗(yàn)證。使用均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)來(lái)測(cè)量性能=0.0494
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位房屋租賃合同書
- 2025西安美術(shù)學(xué)院輔導(dǎo)員考試試題及答案
- 2025遼寧理工學(xué)院輔導(dǎo)員考試試題及答案
- 2025鹽城工業(yè)職業(yè)技術(shù)學(xué)院輔導(dǎo)員考試試題及答案
- 2025赤峰學(xué)院輔導(dǎo)員考試試題及答案
- 2025福建水利電力職業(yè)技術(shù)學(xué)院輔導(dǎo)員考試試題及答案
- 江蘇蘇州凌曄進(jìn)出口有限公司招聘筆試題庫(kù)2025
- 內(nèi)蒙古賽一建建筑工程有限公司招聘筆試題庫(kù)2025
- 四川綿陽(yáng)愛聯(lián)科技股份有限公司招聘筆試題庫(kù)2025
- 社區(qū)矯正集中教育
- 實(shí)測(cè)實(shí)量方案交底
- 銀行客戶經(jīng)理之情緒管理
- 生產(chǎn)良率系統(tǒng)統(tǒng)計(jì)表
- 用TOC理論提高生產(chǎn)制造的競(jìng)爭(zhēng)力課件
- SketchUp (草圖大師) 基礎(chǔ)培訓(xùn)PPT課件
- 生命線安裝方案
- 代理機(jī)構(gòu)服務(wù)質(zhì)量考核評(píng)價(jià)表
- 電廠保安人員管理制度
- 2018年瀘州市生物中考試題含答案
- ge核磁共振機(jī)房專用精密空調(diào)機(jī)技術(shù)要求
- 新干縣人民醫(yī)院血液透析治療患者告知書
評(píng)論
0/150
提交評(píng)論