語言學(xué)理論中依存樹庫的應(yīng)用分析_第1頁
語言學(xué)理論中依存樹庫的應(yīng)用分析_第2頁
語言學(xué)理論中依存樹庫的應(yīng)用分析_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語言學(xué)理論中依存樹庫的應(yīng)用分析語言學(xué)理論中依存樹庫的應(yīng)用分析前言目前在語言知識(shí)的獲得方法上已經(jīng)獲得了重大打破,即由傳統(tǒng)手工方法完成了向語料庫輔助方法的過渡,進(jìn)而促進(jìn)了語言知識(shí)獲得準(zhǔn)確率和效率的提升,同時(shí)還可以將研究者的片面性和主觀性獲得,該方法使得語言學(xué)方法論和理論均獲得了很大的開展。基于計(jì)算機(jī)語言學(xué)家是提出依存樹庫者,故而在進(jìn)展研究的過程中語言學(xué)理論研究著并未重視,但是隨著理解層度的加深,使得在語言學(xué)理論中依存樹庫被不斷的應(yīng)用,并且也將一定的研究成果獲得。一、依存樹庫概述所謂的樹庫就是這標(biāo)注了語義信息、句法、詞類的語料庫,在語言處理上存在困難和復(fù)雜性,因此,要想將語言知識(shí)獲取,就必須將標(biāo)有語

2、言信息的語料庫充分應(yīng)用。目前人們將樹庫作為了知識(shí)源、句法構(gòu)造獲得、句法分析結(jié)果評(píng)價(jià)的主要工具,并且相關(guān)研究者對(duì)其重視度也在不斷增強(qiáng)。并且國外研究發(fā)現(xiàn),樹庫囊括了豐富的句法分布和詞類信息,是研究句法和詞類的重要根據(jù)。同時(shí)還可以將語言信息從樹庫中抽取,在研究語言學(xué)時(shí)將樹庫作為重要工具。目前國內(nèi)外開發(fā)了眾多樹庫,其中以PSG句法標(biāo)本文由論文聯(lián)盟.Ll.搜集整理注和DG句法標(biāo)注為主要的句法標(biāo)注體系,其中前者建立的漢語短語構(gòu)造樹庫包括了北京大學(xué)的漢語樹庫、臺(tái)灣中央研究院的漢語樹庫、清華大學(xué)的句法樹庫及其美國的賓州樹庫等。依存語法與短語構(gòu)造語法比照之下,前者對(duì)于漢語句法構(gòu)造的描繪更合適,這主要是因?yàn)闈h語中

3、語法意義的表達(dá)主要是通過虛詞和語序表示的,并且漢語的詞間關(guān)系具有復(fù)雜性。然而依存樹庫是在依存語法的根底上標(biāo)注句法體系的語料庫,在描繪句法構(gòu)造時(shí)主要是通過將詞與詞之間的關(guān)系建立實(shí)現(xiàn)的。二、語言學(xué)理論研究中依存樹庫的應(yīng)用1.研究語言類型學(xué)在語言學(xué)中,語言類型學(xué)屬于一門顯學(xué),其任務(wù)是總結(jié)人類語言共性及其跨語言比擬。學(xué)者劉海濤研究了漢語句法的類型學(xué)特征與漢語依存樹庫的相關(guān)性得出,漢語中50%左右的依存關(guān)系是在不相鄰詞間發(fā)生,使句子中依存關(guān)系形成的兩個(gè)詞間平均存在著1.84個(gè)詞,換言之2.84就是漢語的平均依存間隔 。漢語屬于AdjN、V、SV型語言,還是對(duì)混合型語言。該研究結(jié)論與其他語言類型學(xué)家得出的

4、結(jié)果具有一樣性。劉明杰也研究了不同語體文本的依存樹庫,同時(shí)比照了英漢依存間隔 ,并得出,英語與漢語的依存間隔 相比,前者更小,由此可見,依存樹庫對(duì)于研究語言類型學(xué)可操作性很強(qiáng),可以幫助我們對(duì)漢語句法構(gòu)造的特點(diǎn)更好從依存句法角度理解,并對(duì)人類語言普遍性的發(fā)現(xiàn)有利。2.研究語言中的詞類高松以依存樹庫統(tǒng)計(jì)了現(xiàn)代漢語動(dòng)詞、名詞、附屬詞、支配詞的依存關(guān)系類型,得出了動(dòng)詞和名詞句法功能分布概率,對(duì)前人的研究結(jié)果進(jìn)展了補(bǔ)充,同時(shí)也驗(yàn)證了研究結(jié)論。袁芬瑜以依存樹庫對(duì)英語名詞的搭配進(jìn)展了描繪,并且將英語名詞依存關(guān)系分析得出,同時(shí)還對(duì)英語名詞的罕見句法、主要、次要功能進(jìn)展了總結(jié)。在對(duì)前人理論檢驗(yàn)的同時(shí),也將改良建

5、議提出。陳芯瑩研究了虛詞,資源選擇為漢語依存句法樹庫,將復(fù)雜網(wǎng)絡(luò)分析技術(shù)和方法運(yùn)用的情況下,對(duì)漢語句法中的介詞在、動(dòng)態(tài)助詞了和構(gòu)造助詞的的特點(diǎn)進(jìn)展了研究,同時(shí)對(duì)虛詞的被支配力和支配力做了計(jì)量地分析。3.研究播送電視語體語言學(xué)研究的核心領(lǐng)域就是語體研究,劉丙麗將實(shí)話實(shí)說、新聞聯(lián)播作為了依存樹庫,同時(shí)還自建了兩個(gè)依存樹庫,并將其作為資源,對(duì)口語體和書面語體不同句法成分的差異進(jìn)展了分析,得出在口語體和書面語體中句法成分的各詞類比重差異顯著,同時(shí)還將不同語體中充當(dāng)句法成分時(shí)各優(yōu)勢(shì)詞類統(tǒng)計(jì)得出。4.研究外漢語教學(xué)依存樹庫對(duì)于外漢語教學(xué)中詞匯教學(xué)具有重要的作用,通常使用頻率及其詞語搭配情況等信息與詞匯教學(xué)

6、具有親密相關(guān)性。高松的研究統(tǒng)計(jì)了偏誤頻率最高的50個(gè)錯(cuò)詞,并將其根據(jù)錯(cuò)誤頻率進(jìn)展甲、乙、丙三級(jí)劃分,并將不同等級(jí)錯(cuò)詞的配價(jià)信息在依存樹庫中提取,并將其制作為配價(jià)詞表。其研究結(jié)果顯示了在實(shí)際使用中高頻錯(cuò)詞可能出現(xiàn)的所有用法和情況,同時(shí)將各個(gè)用法出現(xiàn)的頻次統(tǒng)計(jì),實(shí)現(xiàn)了量化信息的統(tǒng)計(jì),有助于外漢語詞匯教學(xué)。三、依存樹庫對(duì)語言學(xué)理論研究的啟示1.將依存樹庫的應(yīng)用領(lǐng)域拓展除了將依存樹庫應(yīng)用于計(jì)算語言學(xué)研究之外,還可將其在理論語言學(xué)研究中應(yīng)用。依存樹庫對(duì)語言學(xué)理論研究來說,具有語言資源可靠、語言數(shù)據(jù)真實(shí)、客觀的特點(diǎn)。時(shí)至今日,學(xué)者將依存樹庫應(yīng)用于語言學(xué)理論研究,使用的方為主要包括了對(duì)外漢語教學(xué)研究、電視節(jié)

7、目語體研究、現(xiàn)代漢語虛詞的地位研究、英語詞類句法功能的計(jì)量研究及其漢語的語言類型學(xué)研究等。可見依存樹庫對(duì)于理論語言學(xué)研究具有有效性和可行性。要想將依存樹庫資源優(yōu)勢(shì)充分利用,就必須對(duì)語言知識(shí)深化挖掘,將語言現(xiàn)象發(fā)現(xiàn)更多,這樣才可以將依存樹庫的應(yīng)用領(lǐng)域不斷拓展,并將其應(yīng)用于語言學(xué)理論研究中。進(jìn)而對(duì)語言計(jì)量更加深化、細(xì)致的研究,如語義、句法、現(xiàn)代漢語詞類等方面,將依存樹庫與應(yīng)用研究和語言學(xué)本體研究結(jié)合,并從不同角度挖掘,同時(shí)還可以將針對(duì)性的語言研究開展。2.對(duì)依存樹庫資源優(yōu)勢(shì)予以重視基于依存樹庫得天獨(dú)厚的優(yōu)勢(shì)就是句子構(gòu)造的分析和理解,依存樹庫富含豐富的語義、句法、詞類等信息,既能將中心詞信息給出,同時(shí)還能將句子中的詞間關(guān)系提供。并且還可以根據(jù)研究需求完成語義描繪。統(tǒng)計(jì)分析依存樹庫中抽取的數(shù)據(jù),就可以總結(jié)成為語言學(xué)知識(shí),對(duì)前人的研究結(jié)論檢驗(yàn)的同時(shí),還可將語言學(xué)理論體系中的缺乏彌補(bǔ),將語言現(xiàn)象發(fā)現(xiàn),將問題充分解決。當(dāng)下眾多學(xué)者倡導(dǎo)將語言學(xué)返回計(jì)算語言學(xué),使語言學(xué)根底問題在計(jì)算語言學(xué)研究中重現(xiàn),共享語言學(xué)資源。但是基于大局部依存樹庫的提出和構(gòu)建都不是理論語言學(xué)家,因此在語言學(xué)理論中依存樹庫的應(yīng)用不多,多局限于計(jì)算語言學(xué)研究中。進(jìn)而導(dǎo)致眾多的理論語言學(xué)家對(duì)依存樹庫沒有一個(gè)正確的認(rèn)知和理解,進(jìn)而無視了語言學(xué)理論研究中依存樹庫的重要性。由此可見,語言學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論