計算機本科畢業論文-漢-英輔助翻譯系統的設計與實現_第1頁
計算機本科畢業論文-漢-英輔助翻譯系統的設計與實現_第2頁
計算機本科畢業論文-漢-英輔助翻譯系統的設計與實現_第3頁
計算機本科畢業論文-漢-英輔助翻譯系統的設計與實現_第4頁
計算機本科畢業論文-漢-英輔助翻譯系統的設計與實現_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

。例如:心寬體胖。機器翻譯:laughandfat.人工翻譯:laughandgrowfat.舉例展示的機器翻譯缺少了對體胖的準確解釋。機器翻譯只能使用基于目標語言和源語言之間的形式和文字含義或淺層含義的文字翻譯,這使得無法復現源語言文本中成語的語用含義。機器翻譯還有一個避無可避的難點,那就是多義詞的選擇,中文有一些詞匯是具有一詞多義的,例如文字“聽”,既有作為動作傾聽的意思,也有作為量詞,一聽啤酒的意思。機器人翻譯理論認為,在機器人翻譯中,人類的語言可以作為“地基”。對齊語料是實現機器翻譯的關鍵。之所以能夠順利地完成這一任務,主要有以下幾個方面:基于對齊語料庫,計算機對漢英漢英語料進行了全面的研究。同時,在英漢兩種語言對齊的人工譯文中,也會影響到機器翻譯的品質。對一種原語的全面了解,是一切高品質翻譯的前提,因為它不具備與人一樣的文化和邏輯思維的力量,人類的思維也理所當然不被機器所理解,這也正是機器翻譯難以出現高質量譯文的原因。這時,必須要有人類的幫助。后期潤色和編輯是人類介入機器翻譯的主要形式。翻譯后編輯僅意味著編輯和處理由機器翻譯生成的翻譯,從而使不符合目標語言規范的文本變得更真實,“更干凈”,更流暢,更美觀,并且方便人類理解和接受。正是由于以上種種原因,漢英輔助翻譯系統才有研究意義,通過機器翻譯和人工翻譯的互補來促進翻譯的發展。國內外研究現狀根據機器人翻譯中所蘊含的哲學理念,可以將其歸納成理性與實證兩大類型。兩大學說各自發展出了各自的機器人翻譯理論,即以規則為基礎的機器人翻譯與以語料庫為基礎的機器人翻譯。從人工翻譯的觀點來看,基于規則的方法提倡用電腦程序編寫譯文,并采用電腦程序來完成。因為過于依靠人的體驗和認知,所以它的普適性并不高,只適用于特定的專業。根據能否直接使用的數據,可以將基于語料庫的方式劃分為EBMT和以計算機為基礎的計算機翻譯(SBMT)。第一個概念是1984年口本研究者長尾真提出來的,它的中心理念是通過使用匹配事例進行檢索和參考,因而受語料庫的龐大程度的制約,IBM的Brown等人于1990年推出的,它的設計理念是通過語料庫來直接提取,并且還可以從語料庫中提取出一些沒有的譯文,這樣就可以幫助統計模型進行推理和融會貫通。計算機統計是一種比較完善的翻譯方式,包括詞匯的翻譯模式、短語的翻譯模式、層級的短語和句法的翻譯模式。統計機器翻譯具有良好的一般功能,同時也解決了傳統的檢索過程中遇到的困難,曾一度成為谷歌、百度等企業的網絡翻譯的關鍵技術。本文的主要研究內容該系統設計過程中利用Python,MySql,Qtdesigner等主要軟件開發技術對漢英輔助翻譯系統進行設計,實現對文本的在線翻譯。漢英輔助翻譯系統的設計漢英輔助翻譯系統的需求分析漢英輔助翻譯系統要求能做到能夠判斷輸入文本的語言種類,并且能夠翻譯常見文本,無論是單行文本,還是批量文本,都能做到基本表達到原文本的完整內容。詞庫管理,漢英輔助翻譯系統要求有3張表,一張生詞表,用于管理生詞,這段要求有單詞,單詞的含義與備注。一張短語表,字段要求有短語,短語的含義,與備注。一張喜歡的句子表格。字段要求有句子,含義,備注。各張表關系圖如圖2-1,圖2-2,圖2-3所示。圖2-1生詞表E-R圖圖2-2短語表E-R圖圖2-3句子表E-R圖與此同時,漢譯英輔助翻譯系統要求盡量做到輕量級,界面簡單。學習使用成本低,運行配置簡單,低配電腦也能流暢運行。漢英輔助翻譯系統的設計漢英輔助翻譯系統分為兩部分設計。第1部分是翻譯功能模塊。第2部分是詞庫管理功能模塊。翻譯部分,為了輕量便捷的考慮,這一部分的功能需求,決定使用API實現。文本輸入和結果輸出都采用槽函數實現。詞庫管理模塊選擇MySQL數據庫,在數據庫中創建3張表,并通過數據庫可視化軟件Navicat來實現對數據庫中各種表格的操作,實現連接。漢英輔助翻譯系統的界面設計由QTdesigner來設計,并為每個控件設置槽函數來實現對按鈕的功能。漢英輔助系統的活動圖如圖2-4所示。圖2-4漢英翻譯輔助系統活動圖漢英輔助翻譯系統將設計兩個類,一個為UI界面設計,另一個為界面按鈕槽函數的功能實現,UML類圖如圖2-5所示。圖2-5漢英翻譯輔助系統類圖漢英輔助翻譯系統程序的總體流程圖如圖2-6所示。圖2-6漢英翻譯輔助系統流程圖漢英輔助翻譯系統各功能模塊漢英輔助翻譯系統的翻譯功能API選擇:翻譯模塊的實現由API實現功能,再設置輸入文本和輸出結果顯示,如今機器翻譯十分發達,在API上的選擇有很多,谷歌翻譯作為國內外享譽最盛的翻譯軟件,是第一選擇,根據查詢的文獻,經過仔細研究,我發現谷歌翻譯的翻譯規則是基于語法規則。它的工作本質是通過結合統計再結合多于語種行語料庫的平行語料庫,創建大數據分析,去解析各種語言之間的內在規律。由訓練好的模型來決定翻譯的結果。因特網技術發展迅速。這讓谷歌在網絡上的數據越來越多,它的特點也越來越突出:海量數據庫,不但海量,還包括文字、圖片和語音。雖然谷歌翻譯的技術已經十分發達。但也面臨著許多問題。統計機器翻譯都有的不足:翻譯的結果不確定。一些文檔翻譯的結果恰到好處。但有一些參與的結果卻不盡人不同題材的文本翻譯效果同樣不確定。例如政治新聞比體育新聞更好翻譯。這些問題。全球的翻譯技術都沒能很好的解決。由于以上原因,不能僅僅因為谷歌翻譯名氣大便選擇它,更需要詳盡數據的支撐。由第二章2.4小節常見app翻譯對比分析和圖2.11到圖2.29可得出結論,騰訊翻譯君的翻譯結果最符合期待,只有騰訊翻譯君的翻譯結果做到了基本語意的正確翻譯,例如活著感到快樂世界就屬于你這句話的漢英互譯都做到了完整的對應,且在多義詞的選擇上符合最優選擇,例如四海依舊清平中清平的含義最接近clam,其他翻譯軟件的選擇多是clean和clear,這兩個單詞的意思更接近于干凈,清澈,清晰,而且其他軟件還沒有將依舊翻譯過來。根據在騰訊云官方網站查詢得知,在此基礎上,基于大量的雙語語料庫的自動學習,使其能夠完成從原始語篇到目的語篇的自動化轉換。經過仔細且慎重的考慮,最終選用了騰訊云機器翻譯的API。漢英輔助翻譯系統詞庫管理模塊UI界面設計為一個Tabwidget,其內包含三個展示頁面,每個頁面由tablewidger和四個按鈕組成。每個頁面的按鈕都有對應的槽函數。生詞表對應的四個按鈕函數btn_nwod_show,該函數用于查詢生詞表并將生詞表中數據展示在TableWidget_nword之中;btn_nword_add,該函數用于添加數據到TableWidget_nword,btn_nwod_del,用于從TableWidget_nword中刪除數據,btn_nword_modiefy,用于修改數據,UI框架圖如圖2-7所示。圖2-7詞庫管理UI框架圖數據庫設計MySql數據庫名字是test,其中設置了三張表如圖2-8所示。圖2-8數據庫結構生詞表結構如表2-1所示。短語表結構如表2-2所示。喜歡的句子表結構如表2-3所示。表2-1生詞表結構名類型長度是否非空WordVachar255是MeaningVachar255是RemarksVachar255否表2-2短語表結構名類型長度是否非空PhraseVachar255是MeaningVachar255是RemarksVachar255否表2-3喜歡的句子表結構名類型長度是否非空SentenceVachar255是MeaningVachar255是RemarksVachar255否漢英輔助翻譯系統的實現UI界面的實現UI界面如圖3-1所示。圖3-1漢英輔助翻譯系統UI界面實現主要功能描述:設置主界面的UI,兩個標簽,兩個文本輸入輸出框,一個TabWidget中設置三個頁面,在每個頁面設置了四個按鈕,一個TableWidget。翻譯功能的實現漢譯英效果如圖3-2示。英譯漢翻譯效果如圖3-3示。圖3-2漢英輔助翻譯系統漢譯英實現圖3-3漢英輔助翻譯系統英譯漢實現主要功能描述:進行語種識別,返回信息。(2)代碼二:主要功能描述:得到語種識別的結果,設置漢英互譯的參數,根據輸出結果來確定調用機器翻譯的參數,最后將得到的結果返回第二個文本框。詞庫管理功能的實現查詢數據庫生詞表的效果實現如圖3-4所示。增加數據庫生詞表數據的效果實現如圖3-5示。刪除數據庫生詞表數據的效果實現如圖3-6所示。修改數據庫生詞表數據的效果實現如圖3-7所示。圖3-4查詢生詞表實現主要特點:設定sql聲明,運行,并在TableWidget中循環輸出。圖3-5增加數據生詞表實現主要功能描述:獲取已經選中行,將其中的數據添加到數據庫。圖3-6刪除數據生詞表實現主要功能描述:獲取選中行第一列數據,依靠該數據作為MySql執行語句的參數,從數據庫中刪除數據并在列表中刷新顯示。圖3-7修改數據生詞表實現主要功能描述:獲取選中行行數,然后從表格中獲取第一列數據,將其作為參數來執行MySql執行語句,同步修改數據庫中數據。系統測試系統功能測試目前軟件工程中測試分為3種:單元測試、白盒測試和黑盒測試。白盒測試是測試程序里的代碼,通過輸入數據,讓程序走不同的分支流程,看是否達到想要的結果數據,進而加以修正,而不使用用戶界面進行程序流程測試;黑盒測試不必通過檢查程序的源代碼或者很清楚地了解該軟件的源代碼程序具體是怎樣設計的,只需要測試程序界面的流程功能。本章就列舉兩個白盒測試的例子,第一個是平臺的驗證綁定郵箱功能,描述本平臺的測試過程,打開在線輔助翻譯平臺首頁,點擊登錄按鈕,進入登錄頁面,點擊我的頭像,我的賬號。根據輸入不同數據,來看是否測試用例能否滿足需求,如表4-1所示:以下是對捆綁消息的測試案例的說明:1.在“綁定郵箱”上單擊該選項;請輸入信箱號碼,驗證代碼單擊“確認”鍵;輸入一個相同的信箱號碼,并按下確認密碼;請鍵入非信箱的格式,并按下確認密碼。如表格4-1所描述的那樣,捆綁信箱測試:表4-1驗證綁定郵箱用例測試用例編號測試內容測試步驟預期結果T001界面完整性測試打開在線輔助翻譯平臺首頁,點擊登錄按鈕,進入登錄頁面,點擊我的頭像,我的賬號頁面元素完整,各功能按鈕處于可操作狀態T002正確性輸入驗證輸入正確郵箱的郵箱號,驗證碼點擊“確認'按鈕彈框提示綁定成功T003重復郵箱驗證輸入重復的郵箱號,點擊獲取驗證碼提示郵箱已被使用T004非郵箱驗證輸入非郵箱格式,點擊獲取驗證碼提示請點擊登錄按鈕T005判空驗證沒用輸入任何數據,直接點擊驗證按鈕系統提示用戶請輸入郵箱信息特性模塊二,即時登記,確認伺服器端即時登記的能力。首先,開啟聯機助手在第一個翻譯的頁面上,單擊“免費”的登記鍵,馬上就可以登記了。請輸入一個合法的信箱/移動電話號碼、口令、驗證代碼,選擇必需選項,然后單擊“注冊”鍵;請單擊「取得驗證密碼」鍵;輸入一個正確和有效的驗證代碼,然后單擊“確定”。使用表格4-2來顯示即時登記的測試。表4-2立即注冊測試用例測試用例編號測試內容測試步驟預期結果rooi界面完整性測試輸入正確合法的郵箱/手機號,密碼,驗證碼,勾選必選框,點擊“注冊”按鈕。頁面跳轉,郵箱/手機號驗證roo2功能性輸入驗證點擊“獲取驗證碼”按鈕。手機會有短信提示roo3功能性測試輸入正確且有效的驗證碼,點擊“確定”按鈕。彈框提示綁定成功測試結果其中,每個模塊的功能都是大同小異的,我們選擇了一個具有典型意義的模塊,對其進行了功能和性能的檢測。服務程序使用了CentorOS操作系統、tomcatweb服務器、mysql數據庫存儲器、elasticsearch群集搜索引擎、客戶機應用Win7操作系統,FirexfoxFirexfox,用戶可以在電訊中使用TCP/IP協議進行連接,所有的功能組件運行良好,數據傳輸準確率高。

結束語對漢英輔助翻譯系統的設計,讓我充分的感受到了機器翻譯的魅力。基本實現了對翻譯本文的漢譯英和英譯漢,能夠對輸入文本的語種進行識別。詞庫管理在設計UI界面的時候也遇到了一些問題,選擇實現詞庫管理的時候,有考慮到做多界面還是但界面跳轉頁面的問題,但處于系統輕量級且便捷性要求的考慮,最終選擇了單界面多頁面的選擇,使用了TableWidget。而MySql數據庫和程序的連接也十分成功,對數據庫的操作基本的增刪查改通過槽函數鏈接按鈕也實現了。通過對漢英輔助翻譯系統的測試,實現了人工翻譯和機器翻譯的互補,人工翻譯可以為機器翻譯潤色和修改,機器翻譯又為人工翻譯節省了大量的工作量,而且由于機器翻譯的工作原理是基于語料庫,人工翻譯又反過來為機器翻譯做出了貢獻,達到了為其潤色的效果。

致謝在本次論文設計過程中,老師對該論文從選題,構思到最后定稿的各個環節給予細心指引與教導,使我得以最終完成畢業論文設計。在學習中,老師嚴謹的治學態度、豐富淵博的知識、敏銳的學術思維、精益求精的工作態度以及侮人不倦的師者風范是我終生學習的楷模,導師們的高深精湛的造詣與嚴謹求實的治學精神,將永遠激勵著我。其次,還要感謝我的父母,他們給予我無微不至的關懷與支持,給予我充分的物質保障和精神鼓勵,支持我完成學業,增強面對生活和挫折的勇氣與信心。最后,還要感謝我的同學,衷心感謝他們給予我工作和學習中的支持、信任與幫助,我將永遠銘記于心。

參考文獻[1]李毓麗,黃澤楷.基于Fields-Mapping的教師檔案管理系統設計[J].電腦知識與技[1]張菊玲.基于特征提取算法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論