《自然語言處理課程設計》課程教學大綱_第1頁
《自然語言處理課程設計》課程教學大綱_第2頁
《自然語言處理課程設計》課程教學大綱_第3頁
《自然語言處理課程設計》課程教學大綱_第4頁
《自然語言處理課程設計》課程教學大綱_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《自然語言處理課程設計》教學大綱課程名稱:自然語言處理課程設計課程編號:4441英文名稱:CurriculumDesignNaturalLanguageProcessing學時:2周(32學時) 學分:2學分開課學期:第6學期適用專業:數據科學與大數據技術專業課程類別:集中實踐教學課程性質:專業方向與拓展先修課程:Python程序設計高等數學,線性代數,概率論與數理統計,數據結構,算法設計與分析,機器學習自然語言處理一、課程的性質及任務《自然語言處理課程設計》課程是數據科學與大數據技術專業學生的專業方向與拓展課,通過本課程設計加深對自然語言處理理解基礎理論的認識和了解,鍛煉和提高分析問題、解決問題的能力。通過對具體項目的任務分析、技術調研、數據準備、算法設計和編碼實現以及系統調試等幾個環節的練習,基本掌握實現一個自然語言處理系統的基本過程。依據河北工程大學數據科學與大數據技術專業培養計劃,本課程需要培養學生的能力是:能夠基于數據科學與大數據技術原理,通過文獻研究或相關方法,調研和分析大數據應用領域復雜工程問題的解決方案(畢業要求指標4-1)能夠針對智能信息系統設計、大數據技術應用等大數據應用領域的復雜工程問題設計實驗方案、構建實驗系統和測試平臺、獲得實驗結果(畢業要求指標4-2)能熟練運用文獻檢索工具獲取大數據應用領域理論與技術的最新進展以及資源(畢業要求指標5-2)二、課程目標與要求2.1課程目標逐步培養學生主動探索、勇于發現的科學精神,創新意識、創新精神,以及踏實細致、嚴謹科學的學習習慣,激發學生科技報國和對國家、社會發展的責任擔當意識。能夠綜合運用所學的自然語言處理算法和實踐技能進行問題分析、模型選擇與優化,并設計具體方案解決實際問題,對方案進行測試評估。掌握自然語言處理常見任務的相關理論方法和編程技術,包括中文分詞算法,關鍵詞提取算法,詞向量技術,文本分類算法,文本信息抽取算法,機器閱讀理解算法,文本生成和摘要算法。了解對話系統和當前的相關方法。

測控電路課程教學大綱PAGE16PAGE4622.2課程目標與畢業要求對應關系課程目標畢業要求二級指標畢業要求123●●●4-1能夠基于數據科學與大數據技術原理,通過文獻研究或相關方法,調研和分析大數據應用領域復雜工程問題的解決方案4.工程技術研究能力:能夠基于數據科學與大數據技術原理并采用科學方法對大數據應用領域的復雜工程問題進行研究,包括設計實驗、分析與解釋數據、并通過信息綜合得到合理有效的結論。●●4-2能夠針對智能信息系統設計、大數據技術應用等大數據應用領域的復雜工程問題設計實驗方案、構建實驗系統和測試平臺、獲得實驗結果●●5-2能熟練運用文獻檢索工具獲取大數據應用領域理論與技術的最新進展以及資源5.使用現代工具能力:能夠針對大數據應用領域的復雜工程問題,開發、選擇與使用恰當的技術、資源、現代信息技術工具,包括對大數據應用領域的復雜工程問題的預測與仿真,并能夠理解其局限性。2.3課程目標與培養環節對應矩陣序號課程目標理論教學課內實驗課后作業1逐步培養學生主動探索、勇于發現的科學精神,創新意識、創新精神,以及踏實細致、嚴謹科學的學習習慣,激發學生科技報國和對國家、社會發展的責任擔當意識。HML2能夠綜合運用所學的自然語言處理算法和實踐技能進行問題分析、模型選擇與優化,并設計具體方案解決實際問題,對方案進行測試評估。HMM3掌握自然語言處理常見任務的相關理論方法和編程技術,包括中文分詞算法,關鍵詞提取算法,詞向量技術,文本分類算法,文本信息抽取算法,機器閱讀理解算法,文本生成和摘要算法。了解對話系統和當前的相關方法。HMM注:H表示該能力的在此環節重點培養;M表示該能力在此環節有應用要求;L表示該能力在此環節有所涉及。測控電路課程教學大綱PAGE2PAGE4652.4目標達成度的評價課程目標1主要通過理論教學環節進行培養,課內實驗中有應用要求,在課后作業中有所涉及。主要通過設計過程表現、算法設計調試與測試結果和分析及課程設計報告進行考核。目標達成綜合以上內容進行評價。課程目標2、3主要通過理論教學環節進行培養,在課內實驗和課后作業中有應用要求。主要通過設計過程表現、算法設計調試與測試結果和分析及課程設計報告進行考核。目標達成綜合以上內容進行評價。三、課程設計基本要求任何一個設計題目,都不限定采用的方法,可以采用基于規則的分析方法,也可以采用基于語料庫的統計方法,還可以是幾種方法的結合,鼓勵方法創新,但必須有理論根據或實驗數據依據;設計題目比較困難,如果不能找到合作的同學共同完成,可以選做上述某一題目中的部分工作,但請說明所做的部分與整個項目其它部分的關系;完成一份技術報告,報告內容包括:項目目標、國內外相關工作、自己在本項目中承擔工作的不同點、實現系統(或模塊)的核心思想和算法描述、系統主要模塊流程、實驗結果及分析;提交系統源代碼和可執行程序,以保證實驗系統可以正常編譯和運行。如果是多人合作完成的,應提交最終集成的系統。鼓勵充分使用網絡資源和其它一切可以利用的資源(包括數據、語料、軟件工具和論文資料等),但嚴禁侵害他人知識產權,技術報告中必須明確說明所用資源的真實來源。鼓勵相互交流、相互合作,但嚴禁抄襲他人工作,嚴禁偽造結果。四、課程設計內容及安排(一)主要內容課程設計題目可選擇下列任何一個,也可根據自身興趣愛好自定題目。每組同學應設計完成一個自然語言處理系統,完成問題分析、系統構建、系統測試和結果驗證等環節。選題如下:1.實現一個漢語命名實體自動識別系統(Namedentityidentification)命名實體一般指如下幾類專有名詞:中國人名、外國人譯名、地名、組織機構名、數字、日期和貨幣數量。可實現其中一種類型命名實體的識別。2.實現一個漢語自動分詞與詞性自動標注系統(Chinesewordsegmentation

andPOStagging)如果在本項目中不考慮命名實體識別問題,歧義消解是漢語自動分詞和詞性標注中的關鍵問題。3.實現一個(漢語/英語)詞義自動消歧系統(Wordsensedisambiguation)很多詞匯具有一詞多義的特點,但一個詞在特定的上下文語境中其含義卻是確定的。本項目要求實現系統能夠自動根據不同上下文判斷某一詞的特定含義。4.實現一個(漢語/英語)名詞短語自動識別系統(Nounphraserecognition)請設計并實現漢語句子的名詞短語自動識別系統。5.實現一個漢語句子謂語自動識別系統(Chinesepredicaterecognition)謂語是句子的中心。請設計并實現一個漢語句子謂語自動識別系統。6.實現一個漢語句子自動改寫系統(Chinesesentenceparaphrasing)請設計并實現一個漢語句子自動改寫系統。7.實現一個漢英詞語自動對齊系統(Chinese-Englishwordalignment)利用漢英雙語句子對齊語料,設計并實現漢英詞語自動對齊算法。8.實現一個漢語-英語人名自動翻譯系統(Chinese-Englishpersonname

translation)該系統可以將漢語人名(包括中國人名和外國人譯名)翻譯成英語。9.實現一個英文單詞拼寫錯誤自動檢查系統(Englishtextproofreading)請設計并實現英文文本中單詞拼寫錯誤自動檢查系統。可以限定詞匯量。10.實現一個文本自動分類系統(Textcategorization)依據某種文本分類標準,設計并實現一個分類自動分類系統。漢語文本或英語文本任選一種。(二)課程設計安排1.選題和查閱資料;2.分析問題;3.算法或模型選擇;3.問題實現和系統構建;4.系統測試和結果分析;5.撰寫分析與設計報告。五.指導方式集體輔導與個體輔導相結合,平時輔導與上機輔導相結合。課程設計考核方法及成績評定考核方式:考察成績評定:總分100分。其中,設計過程表現:20%;系統設計、程序調試與結果測試:30%;分析及課程設計報

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論