面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第1頁(yè)
面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第2頁(yè)
面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第3頁(yè)
面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第4頁(yè)
面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究第一章 引言1.1 課題的提出日本英文版的科技論著已占相當(dāng)大的比重。可以說(shuō)日本的科學(xué)技術(shù)發(fā)展較快,與出版界注意信息的國(guó)際性和利用英文出版物把日本的科學(xué)界直接推向了國(guó)際大舞臺(tái)不無(wú)關(guān)系。我國(guó)有著一批世界級(jí)的優(yōu)秀科學(xué)家,在許多科學(xué)領(lǐng)域在國(guó)際上有一定的地位,甚至是領(lǐng)先地位。我們多出一些優(yōu)質(zhì)的英文版專著,可以將中國(guó)的科學(xué)技術(shù)事業(yè)推向世界。同時(shí)英文版專著的增加乃至普及則可能使我國(guó)的科技人員進(jìn)一步提高英語(yǔ)水平,全面進(jìn)入世界科技信息前沿,充分吸收借鑒國(guó)際上先進(jìn)的科技成果,從而促進(jìn)我國(guó)的科學(xué)技術(shù)進(jìn)步。同時(shí)又形成良性循環(huán),進(jìn)一步促進(jìn)我國(guó)科技專著的英語(yǔ)化和走向國(guó)際市場(chǎng),全面促進(jìn)提高全民族的文化素質(zhì),使我們真正在科學(xué)上樹(shù)立起我國(guó)應(yīng)該有的國(guó)際威信。從一個(gè)較小的視角,探索機(jī)器輔助翻譯的發(fā)展方向及相關(guān)研究工作的任務(wù)。本研究同時(shí)也是一個(gè)實(shí)例:在自然語(yǔ)言處理領(lǐng)域,把現(xiàn)實(shí)的需求和現(xiàn)有的技術(shù)有效的結(jié)合起來(lái)。專著的情況(期刊網(wǎng)專著),專著翻譯的情況專著版本更新面向人的翻譯過(guò)程是怎樣的(相關(guān)研究)機(jī)器輔助的翻譯過(guò)程又是怎樣的(為什么有這個(gè)必要?)哪些東西是可以利用的?現(xiàn)有的技術(shù);翻譯策略限制領(lǐng)域 + 人機(jī)協(xié)作針對(duì)一個(gè)小范圍的用戶,但開(kāi)發(fā)方法可以在較短時(shí)間內(nèi)適應(yīng)到一個(gè)新的應(yīng)用范圍。專著(Monograph),是指著作者針對(duì)某一問(wèn)題進(jìn)行深入研究后撰寫的、具有較高學(xué)術(shù)水平和一定創(chuàng)造性的專門著作。本文的主要目標(biāo)是針對(duì)中文科技專著的機(jī)器輔助翻譯(Computer Aided Translation)這一過(guò)程,系統(tǒng)地研究其中的要素(即做什么和由誰(shuí)來(lái)做)和行為(即按什么順序做和怎么做),為其建立一個(gè)模型,從而使翻譯人員和計(jì)算機(jī)的勞動(dòng)在該過(guò)程中實(shí)現(xiàn)最優(yōu)的結(jié)合,合理地安排翻譯過(guò)程的每個(gè)環(huán)節(jié),有效地利用各項(xiàng)翻譯資源,以機(jī)助人譯的方式提高翻譯人員的工作效率和工作質(zhì)量。圍繞機(jī)器輔助翻譯和科技專著的語(yǔ)言特點(diǎn),本文的漢英對(duì)比研究擬從兩種語(yǔ)言在被動(dòng)表述問(wèn)題上的差異著手,為機(jī)器輔助翻譯系統(tǒng)中的翻譯記憶模塊提供支持。本文需要關(guān)注的要點(diǎn)分別是機(jī)器輔助翻譯、科技專著、漢英對(duì)比。選題的定位主要出于以下考慮:一,隨著我國(guó)科研水平的提高以及國(guó)際合作與交流的加強(qiáng),中文專著的“出口”需求日益增大。這種工作量極大、質(zhì)量要求又相當(dāng)高的翻譯任務(wù)亟需一種有效的解決方案。二,全自動(dòng)高質(zhì)量的機(jī)器翻譯在可預(yù)見(jiàn)的將來(lái)尚不能實(shí)現(xiàn),這已成為一個(gè)不爭(zhēng)的事實(shí)。然而,自然語(yǔ)言處理技術(shù)仍在不斷地向前發(fā)展,新成果層出不窮,對(duì)已有研究成果的合理利用是我們邁向全自動(dòng)高質(zhì)量機(jī)器翻譯這一最終目標(biāo)的必經(jīng)之路。機(jī)器輔助翻譯為現(xiàn)有的技術(shù)提供了一個(gè)很好的應(yīng)用場(chǎng)景,它既能保證翻譯質(zhì)量又能提高工作效率。三,不同領(lǐng)域的專著在寫作風(fēng)格上的差異會(huì)對(duì)其翻譯任務(wù)提出不同的要求。科技文獻(xiàn)中,語(yǔ)言的語(yǔ)法結(jié)構(gòu)較為固定、詞匯歧義較少,相對(duì)于文學(xué)專著而言,科技專著的翻譯更適于計(jì)算機(jī)處理。因此,作為面向?qū)V臋C(jī)器輔助翻譯的一次初探,本文的研究將“專著”的范圍限定為科學(xué)技術(shù)領(lǐng)域的著作。四,翻譯記憶(Translation Memory)是機(jī)器輔助翻譯系統(tǒng)的一項(xiàng)關(guān)鍵技術(shù),其常用的算法在句子一級(jí)匹配的成功率較低。面向?qū)V臐h英對(duì)比研究將為翻譯記憶提供語(yǔ)言學(xué)知識(shí),從而使機(jī)器輔助翻譯系統(tǒng)的翻譯記憶機(jī)制更為實(shí)用。本文的研究將以北大俞士汶教授等編著的現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典詳解一書的導(dǎo)引部分(后簡(jiǎn)稱詳解)作為專著的藍(lán)本,以該書的漢英翻譯過(guò)程作為建模工作的參考實(shí)例,同時(shí)配合研究工作開(kāi)發(fā)一個(gè)演示系統(tǒng),作為面向?qū)V臋C(jī)器輔助翻譯模型中的軟件環(huán)境。1.2 語(yǔ)言翻譯中人和機(jī)器的協(xié)作人們把一種勞動(dòng)稱為“機(jī)械性的”是因?yàn)橐呀?jīng)掌握了其中的運(yùn)作規(guī)律,而把另一種勞動(dòng)稱為“創(chuàng)造性的”是因?yàn)檫€無(wú)法把握其中的端倪。翻譯被稱為一門精細(xì)的藝術(shù),一種創(chuàng)造性的勞動(dòng),因此很多人否定全自動(dòng)高質(zhì)量的機(jī)器翻譯(FAHQT)。然而,科學(xué)研究仍在這方面做著不懈的努力,讓計(jì)算機(jī)通過(guò)不同的途徑去嘗試這項(xiàng)尚無(wú)規(guī)律可循的任務(wù)。每一次失敗都會(huì)指出我們的一個(gè)“無(wú)知”之處,每一次失敗都是在向最終發(fā)現(xiàn)規(guī)律邁進(jìn)。今天,當(dāng)人們?cè)谡f(shuō)“翻譯中也有機(jī)械、重復(fù)的勞動(dòng)”的時(shí)候,機(jī)器輔助翻譯系統(tǒng)就開(kāi)始進(jìn)入了我們的視線。1.2.1 前人的研究相關(guān)的翻譯研究the place of man and machine in translation1.2.2 機(jī)器輔助翻譯(CAT)綜述1.3 本文研究工作的內(nèi)容1.3.1 定位(目標(biāo))隨著我國(guó)科研水平的提高以及國(guó)際合作與交流的加強(qiáng),中文學(xué)術(shù)專著的“出口”需求日益增大。面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯將為這類工作量極大、質(zhì)量要求極高的翻譯任務(wù)提供一種實(shí)用的、人機(jī)交互式的解決方案。該方案?jìng)?cè)重于:1)從計(jì)算的角度深入地考察專著的語(yǔ)言特點(diǎn);2)用計(jì)算的方法有效地輔助專著的翻譯。本課題將為現(xiàn)有的自然語(yǔ)言處理技術(shù)提供一個(gè)很好的應(yīng)用場(chǎng)景;同時(shí),機(jī)器輔助翻譯研究也是邁向全自動(dòng)高質(zhì)量機(jī)器翻譯這一最終目標(biāo)的必經(jīng)之路。從實(shí)際情況(學(xué)術(shù)專著翻譯通常采用的模式,本研究考察的模式)著手,本文將研究的場(chǎng)景限定為:1) 翻譯的對(duì)象為中文學(xué)術(shù)專著2) 翻譯過(guò)程涉及兩種語(yǔ)言:中文(原文),英文(譯文)3) 參與翻譯過(guò)程的人員包括:a) 原文作者:熟悉原文內(nèi)容和專業(yè)知識(shí);中文水平較高;英文水平一般,但熟悉專業(yè)英語(yǔ);b) 譯者:熟悉原文內(nèi)容和專業(yè)知識(shí);中文水平較高;英文水平較高c) 出版社審編1.3.2 工作基礎(chǔ)本文選題過(guò)程中對(duì)專著翻譯人員及專著翻譯過(guò)程進(jìn)行了調(diào)查,作為建模的依據(jù)。北大計(jì)算語(yǔ)言所在自然語(yǔ)言處理、尤其是中文信息處理方面的積累將為面向?qū)V臋C(jī)器輔助翻譯系統(tǒng)的開(kāi)發(fā)工作提供良好的技術(shù)支持和資源支持。目前已有的語(yǔ)言資源和軟件基礎(chǔ)包括:1) 漢英平行語(yǔ)料15萬(wàn)句對(duì);2) 待整理的雙語(yǔ)詞典資源,預(yù)計(jì)將提供約10萬(wàn)漢英對(duì)照詞條;3) 漢語(yǔ)切分標(biāo)注軟件;4) 雙語(yǔ)語(yǔ)料處理工具集,支持語(yǔ)料預(yù)處理、標(biāo)記、自動(dòng)對(duì)齊、輔助校對(duì)、格式轉(zhuǎn)換等功能;5) 雙語(yǔ)相關(guān)集列工具,支持漢英兩種語(yǔ)言的簡(jiǎn)單檢索、復(fù)雜檢索、模糊檢索、按位排序、搭配統(tǒng)計(jì)、詞頻統(tǒng)計(jì)等功能;6) TM模糊匹配算法,基于動(dòng)態(tài)規(guī)劃的模糊匹配算法;7) 翻譯等價(jià)對(duì)提取工具。1.4 本文的結(jié)構(gòu)安排第二章 學(xué)術(shù)專著及其翻譯過(guò)程的特點(diǎn)2.1 學(xué)術(shù)專著的特點(diǎn)2.1.1 術(shù)語(yǔ)及其相關(guān)問(wèn)題2.1.2 語(yǔ)句的重復(fù)使用? 就語(yǔ)句的長(zhǎng)度而言,專著與一般論文有無(wú)區(qū)別?? 就長(zhǎng)句的數(shù)量而言,專著與一般論文有無(wú)區(qū)別?2.2 學(xué)術(shù)專著翻譯過(guò)程的特點(diǎn)專著翻譯過(guò)程模型(圖)(過(guò)程建模)翻譯過(guò)程中所需的幫助專業(yè)性和創(chuàng)新性是學(xué)術(shù)專著的突出特點(diǎn),因此,學(xué)術(shù)專著的翻譯應(yīng)該要求翻譯人員具有相同或相近的學(xué)科背景,以保證譯文的質(zhì)量。第三章 計(jì)算機(jī)輔助環(huán)境 (緊扣第二章的需求)3.1各種NLP技術(shù)的應(yīng)用與改進(jìn)為現(xiàn)有的自然語(yǔ)言處理技術(shù)提供一個(gè)很好的應(yīng)用場(chǎng)景,同時(shí)充分考慮人和機(jī)器優(yōu)勢(shì)與劣勢(shì)。以下內(nèi)容均針對(duì)專著及其翻譯過(guò)程的特點(diǎn)。3.1.1 術(shù)語(yǔ)的識(shí)別3.1.2 切分標(biāo)注的改進(jìn)3.1.3 語(yǔ)料庫(kù)相關(guān)內(nèi)容(語(yǔ)料收集,語(yǔ)料的利用concordance)3.1.4 相似度計(jì)算的改進(jìn)本文工作對(duì)相似度計(jì)算的改進(jìn):能做什么、不能做什么注意!泛化會(huì)不會(huì)對(duì)翻譯造成負(fù)面影響??jī)煞N用法:1)online;2)pre-translation自然語(yǔ)言處理技術(shù)中語(yǔ)言資源和語(yǔ)言知識(shí)有著至關(guān)重要的作用。(規(guī)則和統(tǒng)計(jì)的協(xié)作)自然語(yǔ)言處理技術(shù)就基礎(chǔ)理論、技術(shù)算法來(lái)講可以是通用的、普遍的。但將其放入具體應(yīng)用中,就應(yīng)該具體問(wèn)題、具體分析。這中間有一個(gè)適應(yīng)(adaptation)的過(guò)程,即根據(jù)具體應(yīng)用的要求來(lái)改進(jìn)或利用現(xiàn)有的基礎(chǔ)理論、技術(shù)算法。附:規(guī)范專著的寫作,便利計(jì)算機(jī)處理計(jì)算方法:基于字和基于詞的加權(quán)可以滿足需求方法簡(jiǎn)單,效率高,可擴(kuò)充性強(qiáng)(主要指語(yǔ)言知識(shí)的擴(kuò)充)不考慮詞序:因?yàn)槭禽o助翻譯,TM是給出參考,而并非自動(dòng)翻譯結(jié)果。同時(shí),學(xué)術(shù)專著中詞匯歧義較少,因詞序不同引起的語(yǔ)義變化情況少。不考慮語(yǔ)義:專著中術(shù)語(yǔ)較多,根據(jù)術(shù)語(yǔ)建立的語(yǔ)義資源not available。但目前考慮到的語(yǔ)義知識(shí)足以對(duì)翻譯起到很好的輔助效果(如術(shù)語(yǔ)及其并列結(jié)構(gòu),括號(hào)、引號(hào)等)。與原來(lái)的按字節(jié)算法的對(duì)比。(數(shù)據(jù))泛化的目的:幫助翻譯記憶的相似度計(jì)算模塊更有效地利用記憶庫(kù)中句子級(jí)對(duì)齊單位(句對(duì))。自動(dòng)泛化(綜述):brown,張建用知識(shí)庫(kù)支持泛化(根據(jù)token) 對(duì)語(yǔ)言知識(shí)的利用,對(duì)專著特點(diǎn)的利用通常意義上的EBMT泛化是為了減少實(shí)例的數(shù)量(或者說(shuō)控制/減小實(shí)例庫(kù)的規(guī)模);我們的研究是為了更好地利用已有的實(shí)例。兩者的目的實(shí)質(zhì)上是相同的。泛化的實(shí)質(zhì):模糊匹配(or partial exact matching)partial match: lexical equivalence class equivalence (equivalent class)泛化的定義:Brown:/*l 張建:泛化是指通過(guò)對(duì)實(shí)際例句中的部分詞語(yǔ)或片段進(jìn)行一定的概括、歸納,使結(jié)果能夠適用于更多的情況,是提高EBMT的性能的有效方法。l 張建的做法:通過(guò)對(duì)句子一級(jí)對(duì)齊的雙語(yǔ)語(yǔ)料庫(kù)學(xué)習(xí)來(lái)抽取翻譯模板;對(duì)獲得的翻譯模板進(jìn)行訓(xùn)練;然后利用所獲得的翻譯模板進(jìn)行翻譯。(借鑒前人的三個(gè)系統(tǒng))l 張建:以基于范例的推理(Case-Based Reasoning)的方法作比;*從翻譯學(xué)的角度?l 根據(jù)前面的比較和分析,我們可以得知EBMT具有如下幾個(gè)優(yōu)點(diǎn):產(chǎn)生的譯文精確,翻譯速度快,不需要人工收集和編輯翻譯知識(shí);但是也存在諸如匹配率比較低,需要大規(guī)模的例句庫(kù)的支持等缺點(diǎn)。事實(shí)上,傳統(tǒng)的EBMT系統(tǒng)的匹配率和其翻譯質(zhì)量是一對(duì)矛盾,當(dāng)匹配率的限制嚴(yán)格的時(shí)候,一旦匹配成功則得到的譯文質(zhì)量非常高;反之,如果匹配率限制的不是很嚴(yán)格,則匹配成功時(shí)可能得到的譯文質(zhì)量一般。 l 泛化的EBMT的基本思想是通過(guò)對(duì)自然語(yǔ)句中的詞語(yǔ)或者片段進(jìn)行抽象和概括來(lái)降低輸入維數(shù),從而提高語(yǔ)句的匹配率。一方面,該方法減少了對(duì)語(yǔ)料庫(kù)規(guī)模的依賴;另一方面,由于被抽象和概括的詞語(yǔ)或者是片段具有普遍性,一般該部分的變化不會(huì)影響翻譯的結(jié)構(gòu)和框架,這樣可以保證翻譯譯文的質(zhì)量同泛化之前相當(dāng)。l 我們采用翻譯模板的方法來(lái)自于這樣一個(gè)啟發(fā):當(dāng)我們學(xué)習(xí)語(yǔ)言的時(shí)候首先學(xué)習(xí)一些簡(jiǎn)單的語(yǔ)句,然后通過(guò)句式的變換和詞語(yǔ)的替換,詞匯量的增加來(lái)逐步的掌握語(yǔ)言的。類比學(xué)習(xí)是人類學(xué)習(xí)中的一個(gè)很重要的方法,人們?cè)趯W(xué)習(xí)過(guò)程中總是有意或無(wú)意地比較事物的相同點(diǎn)和不同點(diǎn)從而達(dá)到學(xué)習(xí)的目的。根據(jù)這樣一種思路,我們提出了從語(yǔ)料庫(kù)中提取翻譯模板以及利用這些獲得的翻譯模板來(lái)指導(dǎo)翻譯的方法。l 框架的作用 槽的作用 匹配的對(duì)象l 優(yōu)點(diǎn)(p.36)l 一個(gè)完整的翻譯模板由下面幾個(gè)部分組成:源語(yǔ)言模板,目標(biāo)語(yǔ)言模板,兩種語(yǔ)言模板的槽的對(duì)應(yīng)關(guān)系,翻譯模板的ID、匹配率和翻譯正確率等。 */槽對(duì)應(yīng)中包含約束條件,由該槽允許的詞性序列來(lái)表示。這種約束條件通過(guò)人機(jī)交互式的訓(xùn)練來(lái)獲得。張建:/*獲得一個(gè)語(yǔ)句片段的“語(yǔ)義類”將其也作為翻譯模板槽的一個(gè)約束條件,對(duì)語(yǔ)句的泛化效果會(huì)更好,但這種“語(yǔ)義類”信息需要對(duì)語(yǔ)句做深層次的分析才能得到。*/我們的泛化規(guī)則可以突顯出槽的語(yǔ)義約束。(如:術(shù)語(yǔ)、注釋等)張建:/*不同種類的詞語(yǔ)在決定整個(gè)語(yǔ)句的翻譯結(jié)果的分量也是不同的,即應(yīng)該對(duì)不同類型的詞語(yǔ)區(qū)別對(duì)待,如動(dòng)詞和介詞、虛詞的地位應(yīng)該比名詞重要。*/在CAT中泛化的工作相對(duì)簡(jiǎn)單,不需要建立目標(biāo)語(yǔ)言模板,更不需要在兩種語(yǔ)言的模板間建立槽的對(duì)應(yīng)關(guān)系。這可以說(shuō)是泛化方法在CAT中應(yīng)用的一個(gè)優(yōu)勢(shì),繞開(kāi)了目前尚不成熟的一些NLP技術(shù)(見(jiàn)張建論文),但也對(duì)泛化技術(shù)進(jìn)行了封裝,為今后技術(shù)的進(jìn)步保留了一個(gè)插入點(diǎn)。此外,人(譯者)的作用的能夠發(fā)揮出來(lái)。 在現(xiàn)有技術(shù)水平前提下人機(jī)優(yōu)勢(shì)的有效結(jié)合。(知識(shí)的自動(dòng)獲取是一個(gè)趨勢(shì),但現(xiàn)階段技術(shù)還不成熟。)本研究中TM的自學(xué)習(xí)能力:專著翻譯的過(guò)程也是雙語(yǔ)平行語(yǔ)料庫(kù)實(shí)時(shí)更新的過(guò)程(并且是句對(duì)齊的)統(tǒng)計(jì)一下并列結(jié)構(gòu)在專著中的平均長(zhǎng)度。translation by analogy相似度計(jì)算模塊的性能評(píng)測(cè):1)coverage; 2)match length; 3) how much text is required to reach a certain coverage of unrestricted textsCAT TM EBMT 之間的關(guān)系A(chǔ) restricted form of example-based translation is available commercially , known as a translation memory.More advanced translation memory systems will also return close but inexact matches on the assumption that editing the translation of the close match will take less time than generating a translation from scratch.The biggest problem with the EBMT system described on the previous page is that it needs huge amounts of pre-translated text to make a reasonable general-purpose translator - several million words. What is needed is a way to get more bang for the buck from each pre-translated example, so that fewer examples suffice. To make the examples more effective, we can generalize them.specialized entries in its knowledge base相似度計(jì)算的基本公式:S = 2n / (m+n)加權(quán)平均:按字計(jì)算的相似度值 S字 按詞計(jì)算的相似度值 S 詞 xxxxxx語(yǔ)句相似度 S = aS字 + bS 詞 其中a + b = 1流程:(1) 輸入專著原文;(2) 若有術(shù)語(yǔ)表(包含專有名詞),將術(shù)語(yǔ)表加入切分標(biāo)注模塊的詞典中,轉(zhuǎn)(6);否則,轉(zhuǎn)(3);(3) 無(wú)術(shù)語(yǔ)表支持的切分標(biāo)注;(4) 術(shù)語(yǔ)自動(dòng)抽取,得到候選術(shù)語(yǔ)集;(5) 對(duì)候選術(shù)語(yǔ)集進(jìn)行人工校對(duì)和補(bǔ)充,得到專著術(shù)語(yǔ)表(及其譯文);(6) 有術(shù)語(yǔ)表支持的切分標(biāo)注;(7) 斷句處理:斷句符號(hào)包括句號(hào)、問(wèn)號(hào)、嘆號(hào)、分號(hào)、冒號(hào);括號(hào)、引號(hào)、書名號(hào)優(yōu)先;(8) 泛化處理:泛化對(duì)象包括a)引號(hào)、括號(hào)、書名號(hào)及其所標(biāo)內(nèi)容;b)術(shù)語(yǔ)(含專名)及其并列結(jié)構(gòu);c)用戶自定義的對(duì)象;(9) 讀入語(yǔ)句;(10) 搜索原文和雙語(yǔ)語(yǔ)料庫(kù),進(jìn)行整句匹配,若找到相似度高于閾值X的語(yǔ)句,輸出其譯文,若找到多句,則按相似度從高到低選擇前n句 用戶可以自定義輸出模式:有多句超過(guò)閾值時(shí),可根據(jù)相似度的分值調(diào)整輸出的句數(shù),如,多句相似度分值同為95,輸出其中一句;多句相似度分值分別為98、93、90時(shí),輸出三句。的譯文輸出,讀入下一句,轉(zhuǎn)(10),若無(wú)下一句,轉(zhuǎn)(14);否則,轉(zhuǎn)(11);(11) 搜索原文和雙語(yǔ)語(yǔ)料庫(kù),進(jìn)行分句匹配,分句以逗號(hào)結(jié)束,若找到相似度高于閾值Y的語(yǔ)句,輸出其譯文,若找到多句,則按相似度從高到低選擇前n句的譯文輸出,轉(zhuǎn)(9),若無(wú)下一句,轉(zhuǎn)(14);否則,轉(zhuǎn)(12);(12) 搜索原文和雙語(yǔ)語(yǔ)料庫(kù),進(jìn)行關(guān)鍵匹配 用戶可以自定義關(guān)鍵匹配點(diǎn)。,缺省的關(guān)鍵匹配點(diǎn)包括a)高頻動(dòng)詞、名詞、形容詞;b)特殊句式“進(jìn)行”、“加以”和被動(dòng)語(yǔ)態(tài),若找到相似度高于閾值Z的語(yǔ)句,輸出

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論