開題報告(數據挖掘)_第1頁
開題報告(數據挖掘)_第2頁
開題報告(數據挖掘)_第3頁
開題報告(數據挖掘)_第4頁
開題報告(數據挖掘)_第5頁
已閱讀5頁,還剩9頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、附表三:高校教師在職攻讀碩士學位研究生論文選題計劃表研究生姓名:指導教師:專業:計算機應用技術所屬院(所):計算機科學與技術學院2010 年 4 月 2 日研究生姓名專業計算機應用技術導師姓名研究方向數據挖掘畢業論文題目數據挖掘在高職教學中的應用論文類型理論研究應用研究用于生產其它選題目的和意義:由于我國大眾化高等教育的普及,高校學生數量的激增,給高校教學工作帶來了 諸多新的問題。尤其是高職學生,他們的主體是普通高中應屆畢業生高考最后一批錄 取的學生。這些學生在學習意識、學習方法、學習能力及學習動力上比較欠缺,并可 能有較多常見的心理問題。大部分學生沒有養成良好的學習習慣。他們中的大部分學 習

2、基礎比較差.自制力也比較弱,學習目標不夠明確,缺之刻苦鉆研精神。很多學生 就讀離職并不是因為自身渴望學習。而是無可奈何或出于應付家長的要求。他們對所 學的專業并沒有太多了解,因此學習目標不夠明確冋時,他們還對社會對其的容納有 一種懷疑,這種懷疑直接導致了自信心的不足,由此也影響到學生學習的動力。此外, 由于這批學生普遍沒有養成良好的學習習慣,叉影響了良好學習氛圍的營造,不良的 學習氛圍又反過束影響學生的學習動力。教師迫切地需要科學地研究高職教學各個環 節中的大量的數據信息。從中獲取知識,繼而科學地指導教學。二十世紀,數據庫技術取得了決定性的成果并且得到廣泛應用.大量信息在給人 們帶來方便的冋時

3、也帶來了一大堆難題;第一是信息過量,難以消化;第二是信息真 假難以辨識:第三是信息安全難以保證;第四是信息形式不一致,難以統一處理。人 們開始提出一個新的口號:“要學會拋棄信息”,并開始考慮:“如何才能不被信息淹沒,而是從中及時發現有用的知識、提高信息利用率?”如何從含有海量信息的數據庫中提取潛在、有價值的信息來輔助決策,預測未來成為信息處理的更新更咼的要求, 知識發現和數據挖掘技術應運而生,共顯示出強大的生命力。數據挖掘使數據庫技術 進入了一個更高級的發展階段。80年數據挖掘技術(Data Mining)被稱為未來信息處理的骨干技術之一,是一個多學科 交叉研究領域,融合了數據庫,人工智能、機

4、器學習,統計學,知識工程、面向對象 方法、信息檢索,高性能計算以及數據可視化等多項最新技術數據挖掘技術從 代末開始出現。短短二十多年它的發展速度很快。目前數據挖掘技術在零售業的購物 籃分析、金融風險預測、產品質量分析、通訊及醫療服務、基因工程研究等許多領域 得到了成功的應用很多專題會議也把數據挖掘和知識發現列為議題之一。把數據挖 掘技術應用于高等學校的教學與管理中,是數據挖掘技術在又一個領域的應用高等 學校多年來的教學和管理工作積累了大量的數據,目前,鑒于社會對高等學校發展的 需求和高校數據管理的現狀,利用這些數據理性的分析學校各方面工作的成效以及教 師發展狀況,對高校教學管理決策支持系統的影

5、響變得十分重要。數據挖掘技術能從 大量數據中發現有用的知識,這些知識對高等學校教學管理的決策支持是十分有意義 的。利用數據挖掘技術從數據倉庫中獲取高質量的信息,可以檢驗教學效果,調節課 程設置。合理安持師資,正確評價教師的年度工作,及輔助調整招生計劃、分析預測 就業趨勢等等。雖然目前數據挖掘技術主要在商業領域中得到廣泛發展,但它面向應 用的本質決定了在任何需要的領域都會發揮它的價值在高校教育教學及管理中有大量直接或間接的數據,關系到教師評價、人才管理及學生選課指導、學生成績分析等 內容。這些數據具有復雜性、多因素性和模糊性等特點,是一類帶有大量不確定因素 的半結構化問題或非結構化問題而大量的數

6、據主要是以各級管理部門提供的統計報表 和簡單信息查詢方式存在,對這些數據所隱含的價值沒有充分挖掘利用。通過數據挖 掘技術,找出有價值的信息,客觀、科學、全面地供教學管理部門參考。以學生成績為例,教師對學生成績的分析處理一般僅僅是統計成績處在優、一般、 差級別的人數,對于學生取得這些成績的原因往往無法了解。如果教師能夠找到有關 影響學生學習成績的因素,必然對教學質量的提高起到積極的作用。2國內外研究動態:自1989年第11屆國際聯合人工智能學術會議上首次提出KDD這一概念以來,數據挖掘日益受到人們的關注。并已經成為當前計算機領域的一大熱點,其研究的重點 也逐漸從發現方法轉移到系統應用,并且注重多

7、種發現策略和技術的集成,以及多學 科之間的相互滲透。從總體上,國外在數據挖掘領域中的研究內容十分廣泛,從挖掘知識的種類看, 己經取得了明顯的成果。1、關聯規則的研究。近幾年對關聯規則的研究內容較多?,F在,關聯規則的挖掘 已經從單一概念層次關聯規則的發現發展到多概念層次關聯規則的發現,并把研究的 重點放在提高算法的效率和規??墒湛s性上。目前,人們對于定量關聯規則以及其他 種類的關聯規則的發現研究較為深入,提出了關聯規則的興趣性的概念。與此同時,在提高挖掘過程的效率方面也作了不少的研究。比較著名的算法有Apfiori , Charm,FP-Growth , Mag num OPUSS Gen Ma

8、x2、數據分類技術研究。 基于決策樹的分類方法在大規模數據庫條件下的應用研究;在較高的抽象層次分類中,M Mehte .等人針對大型數據庫提出了種快速分類算法,稱為QUEST中的超級學習算法,SLIQ :分類與回歸的管狀領域研究、最近鄰分類方法的改進等等。3、 聚類規則研究。近年,聚類開始在大型數據庫中得到研究,R. Ng和1. Han基于隨機搜索以及統計學中的兩個聚類算法PAM和CLARA給出了一個適用于大型應用的聚類算法:CLARANSM. Este等人針對 CLARANS算法的缺點,提出了改進技術。T. Zhang 等人則提出了另一種聚類算法:BIRCH。4、泛化、簡約和特征提取研究。利

9、用數據可視化大大擴展了數據的表達和理解能 力,這是數據簡約的一種非常重要的技術,它正受到廣泛的重視。與國外相比,國內對數據挖掘與知識發現(MDKD)的研究稍晚,1993年國家自然科學基金首次支持對該領域的研究項目。目前,清華大學、中科院計算技術研究所、空 軍第三研究所、海軍裝備論證中心等競相開展數據挖掘的基本理論及其應用研究。其 中,北京系統工程研究所對模糊方法在知識發現中的應用進行了較深入的研究,北京大學也在開展對數據立方體代數的研究;華中理工大學、復旦大學、浙江大學、中國 科技大學、中科院數學研究所、吉林大學等單位開展了對關聯規則開采算法的優化和 改造:南京大學、四川聯合大學山東師范大學碩

10、士學位論文上海交通大學等單位探討, 研究了非結構化數據的知識發現以及Web數據挖掘?,F在盡管與國際上的進展相差并不遠,一些研究成果例如:總參六十一所李德毅教授在云模型方面的研究、復旦大學 的施伯樂教授在關系數據庫中知發現方面取得很大的成果,南京大學開發的 KNIGHT系統等但在實際應用方面卻鮮有所聞,成功的例子很少,沒有形成整體力量。總的說 來國內在數據挖掘方面的開發還停留在實驗的階段,沒有能夠真正的投入到實際生 產應用中去。數據挖掘最先應用于金融和商業領域,在教育層面上還只能算是新生事物,處于發 展的初級階段。國內高校目前在校園信息網中開展數據挖掘的研究并不廣泛。浙江大 學使用關聯規則發現技

11、術對高校的人事信息庫進行挖掘,試圖找到影響學科發展的因 素,發現如何評價一個學科,以及影響學科發展的各個要素之間的關系。另外。曲阜 師范大學體育系與上海市體委就體育人才的選拔探討了數據挖掘的可行性。在每年對 中小學生的體質調查中,積累了大量的數據,利用數據挖掘技術,他們試圖從數據中 深入尋找各種因素的相互聯系,發現一些隨機因素動態變化而產生的新的指導學校體 育科研和教學訓練的規律,進而發現運動人才。數據挖掘在教育層面上的研究還只能 算是新生事物,處于發展的初級階段。在教育信息化的大趨勢下,將數據挖掘技術應 用于教育領域內的學生招募、市場細分、學生來源分析、課程相關性、學習評價度量、 學生生涯規

12、劃、遠程開放教育的個性化服務等方面,必然有十分廣闊的前景。數據挖掘是一種技術,和其他技術一樣,數據挖掘也需要時間和精力來研究、開發 和逐步成熟,最終被人們接受。目前己經有很多通用的數據挖掘系統,但是還不能達 到期望的智能系統那樣。在近來的數據挖掘研究和開發中,一些挑戰也已受到一定程 度的關注,并考慮到了各種需求,而另一些處于研究階段。然而,這些問題將繼續刺 激進一步的研究和改進。我們相信,隨著數據挖掘任務和方法的發展,一定能帶給我 們更多的利益,可以節約我們的時間和金錢,并發現新的知識。主要內容:高等學校多年來的教學和管理工作積累了大量的數據,目前這些數據還未能得到有效利用,只是一個待開發的“

13、寶藏”。鑒于社會對高等學校發展的需求和目前高校數據管理現狀,利用這些數據理性地分析學校各方面工作的成效以及學生培養過程中的得 失變得十分重要。本文主要研究在高校擴招、師生比過大的教學條件下,教師如何利用豐富的信息資 源,采用數據挖掘技術,獲得輔助決策知識,指導教學,從而進一步提高教學質量。數據挖掘技術主要介紹數據挖掘的基本知識,包括數掘挖掘的過程、數據挖掘的任 務、數掘挖掘的分類以及數據挖掘的常用技術和方法。探索數據挖掘技術在高校教學 中的應用,提出數據挖掘技術在高校教學應用中的實施方案。實驗設計方案:第一步,確定挖掘對象、目標。清晰地定義出問題,認清數據挖掘的目的是數據挖 掘的重要一步。挖掘

14、的最后結果是不可預測的,但要探索的問題應是有預見的。第二步,數據采集。這是一個工作量較大,占據時問較多的一個階段。教師需要在 以往的教學實踐中,注意收集數據信息,有些數據的產生可以直接獲得,有些數據需 要對學生進行調查獲得。第三步,數據轉換。這一步是將教師收集到的不同的數據信息集成并轉換為一個分 析數據模型,這一數掘模型是針對算法而準備的不同的算法可能需要不同的分析數 據模型。第四步,數據分類挖掘。分類挖掘的目的是為了建立一個分類模型。首先要選擇合 適的挖掘算法,并使用合適的程序設計軟件實現這一算法:接著對所得到的經過轉換 的數據進行挖掘。第五步,分類規則結果分析。這一步主要解釋和評估分類結果

15、。第六步。知識的應用。這一步是將分析所得到的知識集成到教師的教學環節中去, 教師可利用所得知識改進教學策略指導進一步教學。準備工作情況和主要工作措施:利用學院的教務管理系統,獲得學生的成績信息。設計學生信息調查表,由學生填寫,內容包括學生對計算機公共基礎課程的感興趣程度、課堂學習效果、對本課程的認識和教師的教學方法等。利用數據挖掘算法對數據進行處理,建立決策樹,得出推動計算機課程教學的規則。論文進度安排及預期達到研究結果:201042010.9資料查詢、確定論文主題2010.9-2010.10數據挖掘的理論研究2010.10-2010.11數據挖掘常用技術研究2010.11-2010.12數據挖掘的應用研究2010.12-2011.1數據挖掘的新技術研究2011.1-2011.2數據挖掘的發展方向2011.2-2011.4撰寫論文2011.4-2011.5論文修改6文獻綜述:(4000字以上,參考文獻30篇以上,其中至少10篇外文參考文獻)7考核小組對報告人查閱專業技術文獻情況的評價1 查閱與本專業相關的專業技術文獻數量是否達到30篇(其中外文10篇)?2查閱的文獻是否全面,是否反映本學科專

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論