




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 文本挖掘在企業社會責任報告研究中的應用探析 趙美+黃麒摘要隨著經濟社會的發展,企業被要求承擔更多的社會責任,國家有關部門也制定了相關規定,要求企業披露社會責任報告。社會責任的承擔與報告的披露有其法律基礎,但是法律并沒有規定企業的社會責任義務的具體內容與報告的披露。文章擬通過文本挖掘技術,探究社會責任報告披露內容的特征,通過詞頻統計、共現分析、語義網絡分析等過程探究披露內容關鍵詞之間的聯系。通過技術的應用路徑探究,以期為未來法律對企業社會責任內容的規范進行合理借鑒。關鍵詞文本挖掘;企業社會責任;法律doi1013939/jcnkizgsc20
2、17190141前言隨著中國經濟和社會的快速發展,企業行為引起的外部性問題和社會公共問題也逐漸突出,為了促進經濟、社會和諧和可持續發展,國家有關部門加強了對企業的外部監管,同時也要求企業嚴格自律,主動承擔一定的社會責任并及時向社會報告。越來越多的企業正以積極的姿態履行自己應承擔的社會責任,并且在有關部門專門規范的指導下積極披露其履行社會責任情況的信息。從2006年中國企業社會責任的元年到2015年這十年,社會責任報告的總量從32份增長到了1703份,實現了迅速的增長。但是不同于企業的財務信息披露,社會責任披露具有自愿性、選擇性、低規范化等特點。可以預測將來法律對企業應承擔的社會責任內容會有明確
3、的規范,并對報告披露的內容有著具體的要求,通過文本挖掘技術,發現目前企業社會責任報告內容的特征,對未來規范的制定將會有一定的借鑒意義。2企業社會責任21概念界定企業社會責任金字塔理論,其創立者卡羅爾(2000)認為,四責任模型實際上是利益相關者模型。第一層的經濟責任是基本責任,對不同利益相關者的關注各有側重,影響最大的是所有者和員工;第二層是法律責任,法律是社會關于可接受和不可接受行為的法規集成,法律責任是期望企業依法經營;第三層是倫理責任,企業倫理責任意指企業有義務去做那些正確的、正義的、公平的事情,避免或盡量減少對利益相關者的損害;第四層是慈善責任,慈善責任是寄望企業成為一位好的企業公民,
4、期望企業履行其慈善責任,為社會生活質量的改善做出財力和人力方面的貢獻。122理論基礎:社會契約論1937年,被譽為“現代企業理論之父”的科斯在其企業的性質一文中開辟了以契約分析企業現象的新思路,奠定了企業契約性質的理論基礎。企業在經營活動過程中處理的關系是多方面的,一方面與員工、管理者等內部利益相關者締結內部社會契約,另一方面與消費者、政府等外部利益相關者締結外部社會契約,在這個意義上,社會契約理論為企業社會責任奠定了理論基礎。喬治·斯蒂納與約翰·斯蒂納提出,“社會契約理論”是一種非常抽象的概念,但它卻暗含著企業所必須符合公眾的期望,契約主要是企業社會責任的一種擴展概念,因
5、為它不加任何嚴格限制地增強了企業對許多社會因素的義務。2根據契約理論,企業與多方締結了一系列契約,企業社會責任也就是企業對利益相關者承擔責任的綜合體。契約在本質上就是一種法律,一種在特定人之間形成的特殊關系??梢哉f,企業的契約本質決定了企業社會責任具備法律屬性。23相關法律規范2005年年底,國務院國資委發起的“中國企業社會責任聯盟”正式成立,同時召開了“2005年中國企業社會責任論壇”,制定了國內第一部中國企業社會責任標準。2007年12月,國資委發布關于中央企業履行企業社會責任的指導意見,其中規定的關于中央企業履行的社會責任內部包括堅持依法經營誠實守信、不斷提高持續盈利能力、切實提高產品質
6、量和服務水平、加強資源節約和環境保護、推進自主創新和技術進步、保障生產安全、維護職工合法權益、參與社會公益事業這個八個方面。承擔社會責任已被寫入法律,中華人民共和國公司法第5條第1款規定,公司從事經營活動,必須遵守法律、行政法規,遵守社會公德、商業道德,誠實守信,接受政府和社會公眾的監督,承擔社會責任。但這宣言式的規定并沒有社會責任的具體內容。而且就立法而言,現在已有公司法企業國有資產法等幾部經濟法律作出了企業“承擔社會責任”的原則性規定,但究竟還有哪些具體的制度是貫徹這一原則性規定的,目前人們還不是很明確,這方面的立法工作與解釋工作還需要加強。3立法的工作來源于實踐,企業主動承擔的社會責任也
7、會引導立法工作者將來對企業社會責任的規范。企業社會責任報告正式企業披露其承擔責任的載體,通過研究企業社會責任報告,探究其責任內容、責任特征,對以后加強立法工作、引導企業社會責任規范具有一定的參考意義。3文本挖掘技術31文本挖掘的定義“文本挖掘”可以定義為一個知識密集型的處理過程,在此過程中,用戶使用一套分析工具處理文本集。與數據挖掘類似,文本挖掘旨在通過識別和檢索令人感興趣的模式,進而從數據源中抽取有用的信息。432文本數據分析作業過程第一步是進行數據清洗。數據清洗包括數據匯總與統計清洗,數據可匯集來自不同數據庫的不同數據,通過統計計算以了解字段數據之間的關聯程度及重復性,進行數據間的相互比對
8、,可以通過專家進行協助校正。第二步是建立基本詞匯語料庫。對文本數據進行自動斷詞處理,可以從文章中自動學習斷出常出現的字詞,也可以自定義、新增、修改與刪除字詞。用戶可以匯入或擴充專業詞庫,強化及運用既有的語料庫。之后,自動分析及計算詞匯在文本中的分布及其重要程度排序。第三步是對文本數據進行分類與聚類。非結構化的數據可進行系統自動聚類與半自動式分類,主要借由機器學習,以能正確建立非結構分類的概念類別與分類的準則。也可利用專家事先所定義的類別,通過彼此間的差異建立分類原則。533文本挖掘的應用目前我國文本挖掘研究還處在消化吸收國外相關的理論和技術與小規模實驗階段,還沒有形成完整的適合中文信息處理的文
9、本挖掘理論與技術體系。文本挖掘技術主要用于商業文檔的分類、聚類、總結,主要表現在微博、在線評論等網頁數據的主觀性內容識別、褒貶情感分類、經濟價值挖掘等幾個方面。文本挖掘在企業社會責任報告、年度報告、通知公告、法律文書等純文本式文檔中應用較少,有關領域的研究甚至為空白。文章擬以文本挖掘技術,探究其在企業社會責任報告分析中的應用。 4文本挖掘在企業社會責任中的應用探析41資料來源文章選取了中國國際航空股份有限公司的2016年度企業責任報告作為樣本,來探究文本挖掘技術在企業社會責任報告中的應用。中國國際航空股份有限公司,簡稱“中國國航”,在a股上市,股票代碼為601111,第一大控股股東為中國航空集
10、團公司,最終控制人為國務院國資委。該報告下載于中國國航官網,下載后的報告為pdf格式,首先通過手工處理,進行txt文本化,保留了文本部分。42研究工具rost content mining,簡稱rost cm,內容挖掘軟件,是武漢大學沈陽教授研發的用以輔助人文社會科學研究的大型免費社會計算平臺。該軟件可以實現微博分析、聊天分析、全網分析等功能,用戶遍布海內外100多所大學。本文使用的是該軟件的分詞、詞頻統計、語義網絡分析等功能。43分析過程431分詞后形成高頻詞將文本化后的社會責任報告文檔導入rost cm軟件,對文本內容進行分詞。非結構化的文本通過分詞切分后將會形成獨立含義的詞語。在分詞前,
11、設定企業社會責任報告自定義詞表,使一些專業詞匯不被進一步分詞,包括“企業社會責任”“社會責任”等,保證分詞結果的準確,分詞之后,最后得到企業社會責任報告高頻特征詞。將分詞后的文檔進行詞頻統計,得到社會責任報告詞頻表,可以得到每個詞語出現的頻數(見表1)。摘取詞頻最多的前30個的詞,得到社會責任報告文本高頻詞匯表??梢钥闯龉久Q“國航”是出現最多的詞;其次是“員工”“服務”“安全”“管理”與“旅客”,可以認為該企業社會責任報告關注披露的內部重點在于職工與管理,外部內容在于服務、安全與客戶。高頻特征詞表只能從最直觀的出現次數來觀測出報告所披露的內容,對于披露內容關鍵詞之間的聯系則觀察不出來,還需
12、要進一步分析。432共現分析根據分詞后統計的文本詞匯庫,繼續導入rost cm軟件,進行共現矩陣分析。社會責任報告關鍵詞共現是指相同或不同特征的關鍵詞共同出現的現象,共同出現的高頻詞之間存在著關聯,關聯程度可以通過共現頻次來測量。由于篇幅有限,文章只選取了頻次前10的高頻詞,構建了10×10的共現矩陣(見表2)??梢钥闯觯疤嵘迸c“管理”共同出現了22次,“旅客”與“服務”共同出現了22次,表明報告強調了公司要提升管理,加強旅客服務。通過共現分析,可以看出相鄰關鍵詞直接共同出現的頻次,觀測出報告披露內容特征之間的關聯程度。433語義網絡分析對關鍵詞直接進行關聯性分析后可以進一步構建
13、出知識地圖;共現分析只能觀察出關鍵詞之間的直接聯系,而社會網絡則可以觀察關鍵詞之間直接與間接的關聯性,以及彼此之間的相關性強弱。通過共現矩陣導入到ucient中,生成高頻關鍵詞共現網絡。根據關鍵詞之間關系的緊密程度,通過netdraw可視化軟件導出企業社會責任報告內容關鍵詞語義網絡(見下圖)。通過關鍵詞語義網絡圖可以看出,公司名稱“國航”處于網絡中心,“員工”“服務”“管理”“發展”“旅客”等一系列名詞關鍵詞與動詞關鍵詞處于網絡的第二層核心,一方面與內核“國航”聯系,另一方面與外圍“理念”“文化”“運營”等第三層關鍵詞聯系。第一層“國航”是報告披露的主體,報告披露的內容圍繞著主體的一系列行為展
14、開;第二層則是報告披露的核心與紐帶,披露出企業社會責任重點關注的內容,一方面是“員工”“服務”等名詞反映出報告披露的不同模塊,包括員工權益、提供的航空服務、旅客客戶等,另一方面是“開展”“推進”“建設”“提升”等一系列動詞表明了主體所進行的企業社會責任行為,聯系了不同層次之間的名詞內容;最外圍的“價值”“運輸”“培訓”“環境”等關鍵詞則是對披露內容的豐富與完善,出現的次數較少,與其他關鍵詞直接關聯程度較低。關鍵詞語義網絡圖5結果與展望目前,國內的企業社會責任還是以文獻綜述式、案例式、問卷調查式等方法進行研究,以文本挖掘、內容分析法、數據挖掘等形式的研究較少。企業社會責任報告披露的內容相對較多,
15、內容呈現為非結構化的特征,通過計算機量化,把非結構化文本轉化為關鍵詞并進行相應的分析可以更客觀地評價企業披露的社會責任的內容與特征。文章借鑒信息學科的文本挖掘技術,通過武漢大學沈陽教授開發的rost cm軟件,對企業社會責任報告內容進行文本處理,通過分詞把無序的文本處理為可分析的詞匯,對詞匯進行統計得到高頻詞匯表,可以最直接觀察出企業社會責任報告披露的重點內容;對關鍵詞進一步分析,通過構建共現矩陣,可以觀察出關鍵詞共同出現的頻次,即觀察出不同關鍵詞的直接聯系與關聯程度;對共現矩陣進一步轉化可以得到關鍵詞語義網絡,通過知識地圖可以觀察出關鍵詞的直接聯系與間接聯系,并且可以觀察出不同關鍵詞直接的關
16、聯程度與緊密程度。對社會責任報告內容特征的探究,可以看出企業披露的其主要承擔的社會責任,這對以后法律具體規范企業社會責任具有很大的參考意義。文章還存在著很多不足,由于時間和精力有限,只選擇了中國國航的企業社會責任報告作為研究對象,樣本量單一,后期可以選擇上市公司近年披露的報告進行批量化研究。文章只是探究了分詞、詞頻、共現矩陣、語義網絡在企業社會責任報告分析中的初步應用,后期進一步的研究還可以深入,比如通過關鍵詞之間的聯系與關聯程度,探究不同因素之間的影響關系。另外,還可以通過文本挖掘技術中的聚類分析,對關鍵詞進行聚類,與國資委發布的中央企業應該披露的內容進行比照。通過這些進一步的研究,以期可以探究文本挖掘技術在企業社會責任報告研究中的廣泛應用。參考文獻:1美阿奇·b卡羅爾,等企業與社會倫理與利益相關者管理m.黃煜平,等,譯北京:機械工業出版
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 春天的色彩繪畫比賽話題作文(11篇)
- 我的暑期見聞周記記事作文9篇范文
- 初中學以致用作文(15篇)
- 沒電的日子350字15篇
- 我的文具盒的故事作文13篇
- 一年級期末考試作文我的同學500字(8篇)
- 《牛頓第二定律的實踐應用:高二年級物理教案》
- 動物森林里的奇幻之旅想象作文4篇范文
- 最熟悉的陌生人作文400字(9篇)
- 個人購房倒貸與短期過橋資金管理合同
- 車間物料員員試題及答案
- 2025國內外虛擬電廠實踐經驗分析及高質量發展相關建議報告-國網能源院
- 錨桿錨固質量無損檢測技術規程
- 百香果購銷合同協議
- 老年癡呆健康知識講座課件
- 蔚來:2024年環境、社會及公司治理報告(ESG)
- 2025年中考語文二輪復習:散文閱讀 專題練習題(含答案)
- 高中生物2015-2024年10年高考真題專題分類匯編-專題14體液調節考點2激素調節的過程
- 2025年高考英語一模試題分類匯編:讀后續寫(新高考)
- 《鐵路建設工程生產安全重大事故隱患判定標準》知識培訓
- 2024年四川省成都市中考地理試卷(含答案與解析)
評論
0/150
提交評論