面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.docVIP

上傳人：s*** IP屬地：四川上傳時(shí)間：2019-04-05 格式：DOC 頁(yè)數(shù)：10 大小：71.50KB 積分：15 舉報(bào) 版權(quán)申訴

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第1頁(yè)

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第2頁(yè)

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第3頁(yè)

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第4頁(yè)

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.doc_第5頁(yè)

已閱讀5頁(yè)，還剩5頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究第一章引言1.1 課題的提出日本英文版的科技論著已占相當(dāng)大的比重。可以說(shuō)日本的科學(xué)技術(shù)發(fā)展較快，與出版界注意信息的國(guó)際性和利用英文出版物把日本的科學(xué)界直接推向了國(guó)際大舞臺(tái)不無(wú)關(guān)系。我國(guó)有著一批世界級(jí)的優(yōu)秀科學(xué)家，在許多科學(xué)領(lǐng)域在國(guó)際上有一定的地位，甚至是領(lǐng)先地位。我們多出一些優(yōu)質(zhì)的英文版專著，可以將中國(guó)的科學(xué)技術(shù)事業(yè)推向世界。同時(shí)英文版專著的增加乃至普及則可能使我國(guó)的科技人員進(jìn)一步提高英語(yǔ)水平，全面進(jìn)入世界科技信息前沿，充分吸收借鑒國(guó)際上先進(jìn)的科技成果，從而促進(jìn)我國(guó)的科學(xué)技術(shù)進(jìn)步。同時(shí)又形成良性循環(huán)，進(jìn)一步促進(jìn)我國(guó)科技專著的英語(yǔ)化和走向國(guó)際市場(chǎng)，全面促進(jìn)提高全民族的文化素質(zhì)，使我們真正在科學(xué)上樹(shù)立起我國(guó)應(yīng)該有的國(guó)際威信。從一個(gè)較小的視角，探索機(jī)器輔助翻譯的發(fā)展方向及相關(guān)研究工作的任務(wù)。本研究同時(shí)也是一個(gè)實(shí)例：在自然語(yǔ)言處理領(lǐng)域，把現(xiàn)實(shí)的需求和現(xiàn)有的技術(shù)有效的結(jié)合起來(lái)。專著的情況（期刊網(wǎng)專著），專著翻譯的情況專著版本更新面向人的翻譯過(guò)程是怎樣的（相關(guān)研究）機(jī)器輔助的翻譯過(guò)程又是怎樣的（為什么有這個(gè)必要？）哪些東西是可以利用的？現(xiàn)有的技術(shù)；翻譯策略限制領(lǐng)域 + 人機(jī)協(xié)作針對(duì)一個(gè)小范圍的用戶，但開(kāi)發(fā)方法可以在較短時(shí)間內(nèi)適應(yīng)到一個(gè)新的應(yīng)用范圍。專著（Monograph），是指著作者針對(duì)某一問(wèn)題進(jìn)行深入研究后撰寫的、具有較高學(xué)術(shù)水平和一定創(chuàng)造性的專門著作。本文的主要目標(biāo)是針對(duì)中文科技專著的機(jī)器輔助翻譯（Computer Aided Translation）這一過(guò)程，系統(tǒng)地研究其中的要素（即做什么和由誰(shuí)來(lái)做）和行為（即按什么順序做和怎么做），為其建立一個(gè)模型，從而使翻譯人員和計(jì)算機(jī)的勞動(dòng)在該過(guò)程中實(shí)現(xiàn)最優(yōu)的結(jié)合，合理地安排翻譯過(guò)程的每個(gè)環(huán)節(jié)，有效地利用各項(xiàng)翻譯資源，以機(jī)助人譯的方式提高翻譯人員的工作效率和工作質(zhì)量。圍繞機(jī)器輔助翻譯和科技專著的語(yǔ)言特點(diǎn)，本文的漢英對(duì)比研究擬從兩種語(yǔ)言在被動(dòng)表述問(wèn)題上的差異著手，為機(jī)器輔助翻譯系統(tǒng)中的翻譯記憶模塊提供支持。本文需要關(guān)注的要點(diǎn)分別是機(jī)器輔助翻譯、科技專著、漢英對(duì)比。選題的定位主要出于以下考慮：一，隨著我國(guó)科研水平的提高以及國(guó)際合作與交流的加強(qiáng)，中文專著的“出口”需求日益增大。這種工作量極大、質(zhì)量要求又相當(dāng)高的翻譯任務(wù)亟需一種有效的解決方案。二，全自動(dòng)高質(zhì)量的機(jī)器翻譯在可預(yù)見(jiàn)的將來(lái)尚不能實(shí)現(xiàn)，這已成為一個(gè)不爭(zhēng)的事實(shí)。然而，自然語(yǔ)言處理技術(shù)仍在不斷地向前發(fā)展，新成果層出不窮，對(duì)已有研究成果的合理利用是我們邁向全自動(dòng)高質(zhì)量機(jī)器翻譯這一最終目標(biāo)的必經(jīng)之路。機(jī)器輔助翻譯為現(xiàn)有的技術(shù)提供了一個(gè)很好的應(yīng)用場(chǎng)景，它既能保證翻譯質(zhì)量又能提高工作效率。三，不同領(lǐng)域的專著在寫作風(fēng)格上的差異會(huì)對(duì)其翻譯任務(wù)提出不同的要求。科技文獻(xiàn)中，語(yǔ)言的語(yǔ)法結(jié)構(gòu)較為固定、詞匯歧義較少，相對(duì)于文學(xué)專著而言，科技專著的翻譯更適于計(jì)算機(jī)處理。因此，作為面向?qū)Ｖ臋C(jī)器輔助翻譯的一次初探，本文的研究將“專著”的范圍限定為科學(xué)技術(shù)領(lǐng)域的著作。四，翻譯記憶（Translation Memory）是機(jī)器輔助翻譯系統(tǒng)的一項(xiàng)關(guān)鍵技術(shù)，其常用的算法在句子一級(jí)匹配的成功率較低。面向?qū)Ｖ臐h英對(duì)比研究將為翻譯記憶提供語(yǔ)言學(xué)知識(shí)，從而使機(jī)器輔助翻譯系統(tǒng)的翻譯記憶機(jī)制更為實(shí)用。本文的研究將以北大俞士汶教授等編著的現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典詳解一書的導(dǎo)引部分（后簡(jiǎn)稱詳解）作為專著的藍(lán)本，以該書的漢英翻譯過(guò)程作為建模工作的參考實(shí)例，同時(shí)配合研究工作開(kāi)發(fā)一個(gè)演示系統(tǒng)，作為面向?qū)Ｖ臋C(jī)器輔助翻譯模型中的軟件環(huán)境。1.2 語(yǔ)言翻譯中人和機(jī)器的協(xié)作人們把一種勞動(dòng)稱為“機(jī)械性的”是因?yàn)橐呀?jīng)掌握了其中的運(yùn)作規(guī)律，而把另一種勞動(dòng)稱為“創(chuàng)造性的”是因?yàn)檫€無(wú)法把握其中的端倪。翻譯被稱為一門精細(xì)的藝術(shù)，一種創(chuàng)造性的勞動(dòng)，因此很多人否定全自動(dòng)高質(zhì)量的機(jī)器翻譯（FAHQT）。然而，科學(xué)研究仍在這方面做著不懈的努力，讓計(jì)算機(jī)通過(guò)不同的途徑去嘗試這項(xiàng)尚無(wú)規(guī)律可循的任務(wù)。每一次失敗都會(huì)指出我們的一個(gè)“無(wú)知”之處，每一次失敗都是在向最終發(fā)現(xiàn)規(guī)律邁進(jìn)。今天，當(dāng)人們?cè)谡f(shuō)“翻譯中也有機(jī)械、重復(fù)的勞動(dòng)”的時(shí)候，機(jī)器輔助翻譯系統(tǒng)就開(kāi)始進(jìn)入了我們的視線。1.2.1 前人的研究相關(guān)的翻譯研究the place of man and machine in translation1.2.2 機(jī)器輔助翻譯（CAT）綜述1.3 本文研究工作的內(nèi)容1.3.1 定位（目標(biāo)）隨著我國(guó)科研水平的提高以及國(guó)際合作與交流的加強(qiáng)，中文學(xué)術(shù)專著的“出口”需求日益增大。面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯將為這類工作量極大、質(zhì)量要求極高的翻譯任務(wù)提供一種實(shí)用的、人機(jī)交互式的解決方案。該方案?jìng)?cè)重于：1）從計(jì)算的角度深入地考察專著的語(yǔ)言特點(diǎn)；2）用計(jì)算的方法有效地輔助專著的翻譯。本課題將為現(xiàn)有的自然語(yǔ)言處理技術(shù)提供一個(gè)很好的應(yīng)用場(chǎng)景；同時(shí)，機(jī)器輔助翻譯研究也是邁向全自動(dòng)高質(zhì)量機(jī)器翻譯這一最終目標(biāo)的必經(jīng)之路。從實(shí)際情況（學(xué)術(shù)專著翻譯通常采用的模式，本研究考察的模式）著手，本文將研究的場(chǎng)景限定為：1）翻譯的對(duì)象為中文學(xué)術(shù)專著2）翻譯過(guò)程涉及兩種語(yǔ)言：中文（原文），英文（譯文）3）參與翻譯過(guò)程的人員包括：a) 原文作者：熟悉原文內(nèi)容和專業(yè)知識(shí)；中文水平較高；英文水平一般，但熟悉專業(yè)英語(yǔ)；b) 譯者：熟悉原文內(nèi)容和專業(yè)知識(shí)；中文水平較高；英文水平較高c) 出版社審編1.3.2 工作基礎(chǔ)本文選題過(guò)程中對(duì)專著翻譯人員及專著翻譯過(guò)程進(jìn)行了調(diào)查，作為建模的依據(jù)。北大計(jì)算語(yǔ)言所在自然語(yǔ)言處理、尤其是中文信息處理方面的積累將為面向?qū)Ｖ臋C(jī)器輔助翻譯系統(tǒng)的開(kāi)發(fā)工作提供良好的技術(shù)支持和資源支持。目前已有的語(yǔ)言資源和軟件基礎(chǔ)包括：1）漢英平行語(yǔ)料15萬(wàn)句對(duì)；2）待整理的雙語(yǔ)詞典資源，預(yù)計(jì)將提供約10萬(wàn)漢英對(duì)照詞條；3）漢語(yǔ)切分標(biāo)注軟件；4）雙語(yǔ)語(yǔ)料處理工具集，支持語(yǔ)料預(yù)處理、標(biāo)記、自動(dòng)對(duì)齊、輔助校對(duì)、格式轉(zhuǎn)換等功能；5）雙語(yǔ)相關(guān)集列工具，支持漢英兩種語(yǔ)言的簡(jiǎn)單檢索、復(fù)雜檢索、模糊檢索、按位排序、搭配統(tǒng)計(jì)、詞頻統(tǒng)計(jì)等功能；6） TM模糊匹配算法，基于動(dòng)態(tài)規(guī)劃的模糊匹配算法；7）翻譯等價(jià)對(duì)提取工具。1.4 本文的結(jié)構(gòu)安排第二章學(xué)術(shù)專著及其翻譯過(guò)程的特點(diǎn)2.1 學(xué)術(shù)專著的特點(diǎn)2.1.1 術(shù)語(yǔ)及其相關(guān)問(wèn)題2.1.2 語(yǔ)句的重復(fù)使用? 就語(yǔ)句的長(zhǎng)度而言，專著與一般論文有無(wú)區(qū)別？? 就長(zhǎng)句的數(shù)量而言，專著與一般論文有無(wú)區(qū)別？2.2 學(xué)術(shù)專著翻譯過(guò)程的特點(diǎn)專著翻譯過(guò)程模型（圖）（過(guò)程建模）翻譯過(guò)程中所需的幫助專業(yè)性和創(chuàng)新性是學(xué)術(shù)專著的突出特點(diǎn)，因此，學(xué)術(shù)專著的翻譯應(yīng)該要求翻譯人員具有相同或相近的學(xué)科背景，以保證譯文的質(zhì)量。第三章計(jì)算機(jī)輔助環(huán)境（緊扣第二章的需求）3.1各種NLP技術(shù)的應(yīng)用與改進(jìn)為現(xiàn)有的自然語(yǔ)言處理技術(shù)提供一個(gè)很好的應(yīng)用場(chǎng)景，同時(shí)充分考慮人和機(jī)器優(yōu)勢(shì)與劣勢(shì)。以下內(nèi)容均針對(duì)專著及其翻譯過(guò)程的特點(diǎn)。3.1.1 術(shù)語(yǔ)的識(shí)別3.1.2 切分標(biāo)注的改進(jìn)3.1.3 語(yǔ)料庫(kù)相關(guān)內(nèi)容（語(yǔ)料收集，語(yǔ)料的利用concordance）3.1.4 相似度計(jì)算的改進(jìn)本文工作對(duì)相似度計(jì)算的改進(jìn)：能做什么、不能做什么注意！泛化會(huì)不會(huì)對(duì)翻譯造成負(fù)面影響？?jī)煞N用法：1）online；2）pre-translation自然語(yǔ)言處理技術(shù)中語(yǔ)言資源和語(yǔ)言知識(shí)有著至關(guān)重要的作用。（規(guī)則和統(tǒng)計(jì)的協(xié)作）自然語(yǔ)言處理技術(shù)就基礎(chǔ)理論、技術(shù)算法來(lái)講可以是通用的、普遍的。但將其放入具體應(yīng)用中，就應(yīng)該具體問(wèn)題、具體分析。這中間有一個(gè)適應(yīng)（adaptation）的過(guò)程，即根據(jù)具體應(yīng)用的要求來(lái)改進(jìn)或利用現(xiàn)有的基礎(chǔ)理論、技術(shù)算法。附：規(guī)范專著的寫作，便利計(jì)算機(jī)處理計(jì)算方法：基于字和基于詞的加權(quán)可以滿足需求方法簡(jiǎn)單，效率高，可擴(kuò)充性強(qiáng)（主要指語(yǔ)言知識(shí)的擴(kuò)充）不考慮詞序：因?yàn)槭禽o助翻譯，TM是給出參考，而并非自動(dòng)翻譯結(jié)果。同時(shí)，學(xué)術(shù)專著中詞匯歧義較少，因詞序不同引起的語(yǔ)義變化情況少。不考慮語(yǔ)義：專著中術(shù)語(yǔ)較多，根據(jù)術(shù)語(yǔ)建立的語(yǔ)義資源not available。但目前考慮到的語(yǔ)義知識(shí)足以對(duì)翻譯起到很好的輔助效果（如術(shù)語(yǔ)及其并列結(jié)構(gòu)，括號(hào)、引號(hào)等）。與原來(lái)的按字節(jié)算法的對(duì)比。（數(shù)據(jù)）泛化的目的：幫助翻譯記憶的相似度計(jì)算模塊更有效地利用記憶庫(kù)中句子級(jí)對(duì)齊單位（句對(duì)）。自動(dòng)泛化（綜述）：brown，張建用知識(shí)庫(kù)支持泛化（根據(jù)token）對(duì)語(yǔ)言知識(shí)的利用，對(duì)專著特點(diǎn)的利用通常意義上的EBMT泛化是為了減少實(shí)例的數(shù)量（或者說(shuō)控制/減小實(shí)例庫(kù)的規(guī)模）；我們的研究是為了更好地利用已有的實(shí)例。兩者的目的實(shí)質(zhì)上是相同的。泛化的實(shí)質(zhì)：模糊匹配（or partial exact matching）partial match: lexical equivalence class equivalence (equivalent class)泛化的定義：Brown：/*l 張建：泛化是指通過(guò)對(duì)實(shí)際例句中的部分詞語(yǔ)或片段進(jìn)行一定的概括、歸納，使結(jié)果能夠適用于更多的情況，是提高EBMT的性能的有效方法。l 張建的做法：通過(guò)對(duì)句子一級(jí)對(duì)齊的雙語(yǔ)語(yǔ)料庫(kù)學(xué)習(xí)來(lái)抽取翻譯模板；對(duì)獲得的翻譯模板進(jìn)行訓(xùn)練；然后利用所獲得的翻譯模板進(jìn)行翻譯。（借鑒前人的三個(gè)系統(tǒng)）l 張建：以基于范例的推理（Case-Based Reasoning）的方法作比；*從翻譯學(xué)的角度？l 根據(jù)前面的比較和分析，我們可以得知EBMT具有如下幾個(gè)優(yōu)點(diǎn)：產(chǎn)生的譯文精確，翻譯速度快，不需要人工收集和編輯翻譯知識(shí)；但是也存在諸如匹配率比較低，需要大規(guī)模的例句庫(kù)的支持等缺點(diǎn)。事實(shí)上，傳統(tǒng)的EBMT系統(tǒng)的匹配率和其翻譯質(zhì)量是一對(duì)矛盾，當(dāng)匹配率的限制嚴(yán)格的時(shí)候，一旦匹配成功則得到的譯文質(zhì)量非常高；反之，如果匹配率限制的不是很嚴(yán)格，則匹配成功時(shí)可能得到的譯文質(zhì)量一般。 l 泛化的EBMT的基本思想是通過(guò)對(duì)自然語(yǔ)句中的詞語(yǔ)或者片段進(jìn)行抽象和概括來(lái)降低輸入維數(shù)，從而提高語(yǔ)句的匹配率。一方面，該方法減少了對(duì)語(yǔ)料庫(kù)規(guī)模的依賴；另一方面，由于被抽象和概括的詞語(yǔ)或者是片段具有普遍性，一般該部分的變化不會(huì)影響翻譯的結(jié)構(gòu)和框架，這樣可以保證翻譯譯文的質(zhì)量同泛化之前相當(dāng)。l 我們采用翻譯模板的方法來(lái)自于這樣一個(gè)啟發(fā)：當(dāng)我們學(xué)習(xí)語(yǔ)言的時(shí)候首先學(xué)習(xí)一些簡(jiǎn)單的語(yǔ)句，然后通過(guò)句式的變換和詞語(yǔ)的替換，詞匯量的增加來(lái)逐步的掌握語(yǔ)言的。類比學(xué)習(xí)是人類學(xué)習(xí)中的一個(gè)很重要的方法，人們?cè)趯W(xué)習(xí)過(guò)程中總是有意或無(wú)意地比較事物的相同點(diǎn)和不同點(diǎn)從而達(dá)到學(xué)習(xí)的目的。根據(jù)這樣一種思路，我們提出了從語(yǔ)料庫(kù)中提取翻譯模板以及利用這些獲得的翻譯模板來(lái)指導(dǎo)翻譯的方法。l 框架的作用槽的作用匹配的對(duì)象l 優(yōu)點(diǎn)（p.36）l 一個(gè)完整的翻譯模板由下面幾個(gè)部分組成：源語(yǔ)言模板，目標(biāo)語(yǔ)言模板，兩種語(yǔ)言模板的槽的對(duì)應(yīng)關(guān)系，翻譯模板的ID、匹配率和翻譯正確率等。 */槽對(duì)應(yīng)中包含約束條件，由該槽允許的詞性序列來(lái)表示。這種約束條件通過(guò)人機(jī)交互式的訓(xùn)練來(lái)獲得。張建：/*獲得一個(gè)語(yǔ)句片段的“語(yǔ)義類”將其也作為翻譯模板槽的一個(gè)約束條件，對(duì)語(yǔ)句的泛化效果會(huì)更好，但這種“語(yǔ)義類”信息需要對(duì)語(yǔ)句做深層次的分析才能得到。*/我們的泛化規(guī)則可以突顯出槽的語(yǔ)義約束。（如：術(shù)語(yǔ)、注釋等）張建：/*不同種類的詞語(yǔ)在決定整個(gè)語(yǔ)句的翻譯結(jié)果的分量也是不同的，即應(yīng)該對(duì)不同類型的詞語(yǔ)區(qū)別對(duì)待，如動(dòng)詞和介詞、虛詞的地位應(yīng)該比名詞重要。*/在CAT中泛化的工作相對(duì)簡(jiǎn)單，不需要建立目標(biāo)語(yǔ)言模板，更不需要在兩種語(yǔ)言的模板間建立槽的對(duì)應(yīng)關(guān)系。這可以說(shuō)是泛化方法在CAT中應(yīng)用的一個(gè)優(yōu)勢(shì)，繞開(kāi)了目前尚不成熟的一些NLP技術(shù)（見(jiàn)張建論文），但也對(duì)泛化技術(shù)進(jìn)行了封裝，為今后技術(shù)的進(jìn)步保留了一個(gè)插入點(diǎn)。此外，人（譯者）的作用的能夠發(fā)揮出來(lái)。在現(xiàn)有技術(shù)水平前提下人機(jī)優(yōu)勢(shì)的有效結(jié)合。（知識(shí)的自動(dòng)獲取是一個(gè)趨勢(shì)，但現(xiàn)階段技術(shù)還不成熟。）本研究中TM的自學(xué)習(xí)能力：專著翻譯的過(guò)程也是雙語(yǔ)平行語(yǔ)料庫(kù)實(shí)時(shí)更新的過(guò)程（并且是句對(duì)齊的）統(tǒng)計(jì)一下并列結(jié)構(gòu)在專著中的平均長(zhǎng)度。translation by analogy相似度計(jì)算模塊的性能評(píng)測(cè)：1）coverage; 2）match length; 3) how much text is required to reach a certain coverage of unrestricted textsCAT TM EBMT 之間的關(guān)系A(chǔ) restricted form of example-based translation is available commercially , known as a translation memory.More advanced translation memory systems will also return close but inexact matches on the assumption that editing the translation of the close match will take less time than generating a translation from scratch.The biggest problem with the EBMT system described on the previous page is that it needs huge amounts of pre-translated text to make a reasonable general-purpose translator - several million words. What is needed is a way to get more bang for the buck from each pre-translated example, so that fewer examples suffice. To make the examples more effective, we can generalize them.specialized entries in its knowledge base相似度計(jì)算的基本公式：S = 2n / (m+n)加權(quán)平均：按字計(jì)算的相似度值 S字按詞計(jì)算的相似度值 S 詞 xxxxxx語(yǔ)句相似度 S = aS字 + bS 詞其中a + b = 1流程：(1) 輸入專著原文；(2) 若有術(shù)語(yǔ)表（包含專有名詞），將術(shù)語(yǔ)表加入切分標(biāo)注模塊的詞典中，轉(zhuǎn)（6）；否則，轉(zhuǎn)（3）；(3) 無(wú)術(shù)語(yǔ)表支持的切分標(biāo)注；(4) 術(shù)語(yǔ)自動(dòng)抽取，得到候選術(shù)語(yǔ)集；(5) 對(duì)候選術(shù)語(yǔ)集進(jìn)行人工校對(duì)和補(bǔ)充，得到專著術(shù)語(yǔ)表（及其譯文）；(6) 有術(shù)語(yǔ)表支持的切分標(biāo)注；(7) 斷句處理：斷句符號(hào)包括句號(hào)、問(wèn)號(hào)、嘆號(hào)、分號(hào)、冒號(hào)；括號(hào)、引號(hào)、書名號(hào)優(yōu)先；(8) 泛化處理：泛化對(duì)象包括a）引號(hào)、括號(hào)、書名號(hào)及其所標(biāo)內(nèi)容；b）術(shù)語(yǔ)（含專名）及其并列結(jié)構(gòu)；c）用戶自定義的對(duì)象；(9) 讀入語(yǔ)句；(10) 搜索原文和雙語(yǔ)語(yǔ)料庫(kù)，進(jìn)行整句匹配，若找到相似度高于閾值X的語(yǔ)句，輸出其譯文，若找到多句，則按相似度從高到低選擇前n句用戶可以自定義輸出模式：有多句超過(guò)閾值時(shí)，可根據(jù)相似度的分值調(diào)整輸出的句數(shù)，如，多句相似度分值同為95，輸出其中一句；多句相似度分值分別為98、93、90時(shí)，輸出三句。的譯文輸出，讀入下一句，轉(zhuǎn)（10），若無(wú)下一句，轉(zhuǎn)（14）；否則，轉(zhuǎn)（11）；(11) 搜索原文和雙語(yǔ)語(yǔ)料庫(kù)，進(jìn)行分句匹配，分句以逗號(hào)結(jié)束，若找到相似度高于閾值Y的語(yǔ)句，輸出其譯文，若找到多句，則按相似度從高到低選擇前n句的譯文輸出，轉(zhuǎn)（9），若無(wú)下一句，轉(zhuǎn)（14）；否則，轉(zhuǎn)（12）；(12) 搜索原文和雙語(yǔ)語(yǔ)料庫(kù)，進(jìn)行關(guān)鍵匹配用戶可以自定義關(guān)鍵匹配點(diǎn)。，缺省的關(guān)鍵匹配點(diǎn)包括a）高頻動(dòng)詞、名詞、形容詞；b）特殊句式“進(jìn)行”、“加以”和被動(dòng)語(yǔ)態(tài)，若找到相似度高于閾值Z的語(yǔ)句，輸出

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 事務(wù)文書

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.docVIP

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

面向中文學(xué)術(shù)專著的機(jī)器輔助翻譯研究.docVIP

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔