語言學有哪些重要理論語料庫語言學對語言學理論的貢獻分析_第1頁
語言學有哪些重要理論語料庫語言學對語言學理論的貢獻分析_第2頁
語言學有哪些重要理論語料庫語言學對語言學理論的貢獻分析_第3頁
語言學有哪些重要理論語料庫語言學對語言學理論的貢獻分析_第4頁
語言學有哪些重要理論語料庫語言學對語言學理論的貢獻分析_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

語言學有哪些重要理論語料庫語言學對語言學理論的貢獻分析語料庫語言學是20世紀80年代才嶄露頭角的一門交叉學科。語料庫通常指為語言研究收集的、用形式保存的語言材料;是由出現的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體。它是一個由大量的語言實際使用的信息組成的、專供語言研究與分析和描述的語言資料庫。語料庫語言學為語言研究提供了一種全新的方法和思路。它以真實的語言數據為研究對象,對大量的語言事實進行系統分析。它研究的是語言行為(languageperformance),其目的是憑借大規模語料庫提供的客觀翔實的語言證據來從事語言學研究和指導自然語言信息處理系統的開發。如:Sinclair教授領導的“柯林斯一伯明翰大學國際語料庫”(CollinsBirminghamUniversityInternationalLanguageDatabase;簡稱為*****)利用計算機進行語料開發,*****語料庫至2009年8月,所含的語料庫已由原來的6百萬次擴展到2億次,成為當今世界上最大的英語庫之一。本文將簡要地探討語料庫語言學與西方語言哲學的歷史淵源,并從語言哲學史的角度分析語料庫語言學對整個語言學體系的貢獻。一科學哲學上的經驗論與唯理論西方科學哲學的經驗論認為感性經驗是知識的唯一源泉,主張一切知識都通過經驗而獲得。唯理論則承認理性認識的可靠性,否認理性認識依賴于感性經驗。康德對人的認知能力進行了批判考察,他認為人的認知能力是有限的。正是由于人認識能力的局限性,先天地注定了理論的局限性。波普(KarlPopper)贊同康德關于理性為自然立法的思想,但又認為科學知識的增長是一個猜想與反駁的過程,即通過不斷提出嘗試性的猜測,并不斷清除猜測中的錯誤的過程。在波普看來,科學的合理性,實質上就在于科學的批判和不斷進步性。二語言學界的經驗論與唯理論語言學界的經驗論體現為結構主義。該流派非常強調可以直觀的感性,也就是語言材料的收集、描寫和實地調查,注重語言行為的描寫。語言學界的唯理論體現為認知主義,其代表人為喬姆斯基(NoamChomsky)。他認為結構決定功能,人的認知能力是有限的。這就暗含了語言學理論的局限性以及語言學理論被證偽的合理之處。三語料庫語言學對整個語言學體系的意義西方現代理論的特征是對比研究法、理論逼近法、比較研究法。從西方語言學哲學史的角度看,對比研究法和比較研究法的哲學基礎是經驗論,而理論逼近法的哲學基礎則是康德的先驗論和波普的證偽論。因此,無論從經驗論的立場看,還是康德的先驗論或者波普的證偽論的立場看,語料庫語言學整個語言學理論體系有著深遠的哲學涵義。歸納起來,其哲學影響主要體現在三方面:1沿襲了經驗論重語言實事的傳統利用真實的語言材料研究語言一直是語言學家的傳統。美國結構主義語言學派都曾以原始的方法認真積累真實語言素材,并且以這些素材為基礎來發現規律和解釋語言現象。提供真實語料可以說是語料庫語言學的生命線。現在一些重大的語言項目幾乎都是基于大規模語料庫而進行的,通過大規模語料庫建立統計模型也成為語言信息處理和加工的主流模式。在語料庫語言學研究中,特別是口語文本一直向合語法—不合語法的兩分法提出了挑戰。Aarts(1991)就提供了一些很好的例子,語料庫里的一些句子并不符合以直覺為基礎描述的可能的情況,但這些“不合語法的”或邊緣現象往往有相當高的出現頻率。語料庫類型可以根據研究需要而定。建庫人可以根據需要收集某一語域的口語或書面語的共時語言實例;也可以收集該語域歷時的語言實例(如:赫爾辛基英文文本語料庫歷時部分);還可以建用于翻譯或對比研究的雙語或多語的平行語料庫;還有像國際英語語料庫(ICE)那樣的某一語言的不同變體之間的語料庫;還有研究一語、二語或外語學習者(口語、筆語)語料庫等等。一個典型的例子是,上海交通大學的JDEST英語語料庫。利用這個語料庫,通過語料比較、統計、篩選等方法為中國大學英語教學提供通用詞匯和技術詞匯的應用信息,為確定大學英語教學大綱的詞表提供了可靠的量化依據。這個語料庫也在英語語言研究中發揮了作用,支持基于語料庫的英語語法的頻率特征、語料庫驅動的詞語搭配等項研究。從理論上來講,只要我們按照嚴格的統計取樣(輔以前期實驗性取樣并驗證)的辦法去收集,就可以獲得我們所想要的具有足夠代表性的語料。語料反映了語言使用的真實狀態,接近其本質特征。研究者可以借助諸如句法學、話語分析、語用學、社會學、人類學、民俗學等其他理論手段,對語言的本質和實際運作進行描寫和研究。語料庫標注的好壞、類型的多寡和有無適合專項研究的處理軟件很大程度上決定了語料庫的有用程度。語料庫標注就是把文章中的語句按一定的標準切開,并對每個詞標上標記。因此,語料庫標注也可以被理解為一種元語言形式。它是對原始語料進行一種初步的靜態的注解。詞性標注是這樣,某些句法層的標注也是這樣。還有一些研究者將所有語料進行主位、述位的標注,以便對其施行系統功能分析。因此,如果對口語語料再進行音段和超音段的標注,那將會給對話語的動態分析帶來極大方便。2大大提高了人的認識能力語言研究者既要面對康德和喬姆斯基提出的認知能力有限論,又要面對無限的語言事實,而“語言研究者的任務是要找出造成無限事實的有限成因來。西方當代理論語言學家講得更加明確,不但要找到一種語言中無限語言事實的成因,而且要找到所有可能語言中無限語言事實的成因”。語料庫的處理工具,主要有轉寫工具(transcriber)、檢索工具(concordance。、對齊工具(aligner)和其它一些統計工具等等。這些計算機程序的出現使語料庫語言學的定性與定量相結合的方法成為可能。借助計算機和文本分析軟件強大的檢索功能和文本分析能力,研究者可以對百萬級的語料進行詞性附碼(tagging)和句法分析(parsing)等標注(annotate)操作,而這種工作量如果用過去手工方式進行,簡直無法想象,而且出錯率比手工方式低很多。顯而易見,語料庫語言學大大提高了人的有限理性,增強了人的認知能力。一個著名的例子是,Biber(1988)和Biber(1989)描述了如何從蘭開斯特一奧斯陸/卑爾根語料庫(LOB)和倫敦一朗德語料庫(LLC)近100萬字的語料中發現了67個語言特征。這些語言特征被列出來,并計算它們在481個抽樣文本中每個文本出現的次數。利用因素分析,識別出這67個語言特征共現的模式,然后建立一些文本變化的重要維度。通過這種方法,某些文本或文本群可以被視為具有共同的語言維度。因此,并不是通過模式、使用,或功能來定義文體或語域,Biber的方法是找到哪些文本具有共同的語法和詞匯特點,并根據它們是否反映因素維度而建立文本類型學。運用語料庫,研究者可以進行句法、詞法及自動語法分析。利用語料庫進行語法分析是語料庫語言學的早期目的之一。如今,人們對語料庫內的語料進行更高層次的研究,對入庫的語篇做進一步的處理,如進行詞性附碼和句法分析(句法分析是指對經過自動詞性附碼的語料庫根據某種特定的語法描述進行語法分析),使語料的自動語法分析成為可能。從而也大大方便了詞的語義及功能研究、近義詞的比較研究、搭配及其結構的研究、語體的研究、英語口語音型和語調研究、英語名詞短語的成語性研究和英語句法發展的研究。自動語法分析還被應用于語法檢查、詞義排歧、自然語言接口、對名詞短語辯識的改進、機器翻譯等。此外,語料庫語言學還為語義學和語用學研究、話語及會話分析、言語變體(口筆語,語言與性別,文體學及方言)、語音科學、兒童語言習得和心理語言學研究等方面提供了非常豐富的實例,充分體現了語料庫語言學在語言研究方面的作用。3提高了對語言理論的批判能力或證偽能力Blackburn認為:“作為與假科學相對的科學,其真諦不在于它提出了一些假設等待證據在某種高的程度上被證實,而在于它的假設能夠被證據反駁。這就是說,它們真正地要面對這樣的可能性:被驗證,因不合經驗終被否定。如此說來,科學的方法不是從積累的材料中機械地歸納出一般來,而是形成大膽假設,然后(此假設)服從嚴格的驗證,這是一種猜想與被反駁之法。科學家提出一個有趣的猜想隨后被推翻并不為錯,錯的是提出一個猜想而不允許被反駁或者面對反駁的證據而死守那個猜想。”波普的證偽論對語言哲學產生了重大的影。根據波普的證偽論,理論的發展需要反例來證偽。研究者,“提出大膽的理論假設、猜想、或科學發現的假設,然后等待證偽,如不能被證實為偽,或者在證偽之前的一刻,這個假設的理論或科學發現就應該被認為是可行的或為真的。如果一個假設或猜想提出來,連有限的反例都找不到,永遠等待證偽而終于未被證偽,這剛好不是證明某個猜想是一個真科學理論么?”語言學的理論逼近法尤其需要語料來做支持。應用語料庫語言學的檢索功能,語言研究者可以輕松地檢索某種語言現象,進而對理論假設進行驗證和修改。語言學家Taylor(2002)在研究英語同義詞時,就借助語料庫證偽了他自己以前的理論。DirvenandTaylor(1988)的受試者認為“tallwindow"是很糟糕的表達。然而,這個表達卻出現在小說家IrisMurdoch的一段話里(DirvenandTaylor1988)……事實上,DirvenandTaylor(1988,p.393)錯在說“human"必須被描述為“tall”而不能是“high”。蘭開斯特一奧斯陸/卑爾根語料庫卻包含兩個“high"被用于“human"的例子”。從以上例子可以看出,借助于語料庫語言學所提供的方法,語言學家一方面可以驗證由內省得到的語言規則,也可以基于語料庫提供的數據推演出語法、語用規則。由于不同類型的語料庫和豐富的標注手段的出現,語料庫語言學使研究者的視野更加開闊,證偽能力也愈加強大了。四結語綜上所述,語料庫語言學是一門語言研究和相應的計算機技術相伴相生的產物,是語言研究中定量和定性方法相互結合的典范,為揭示

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論