




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
廈門大學林子雨編著《大數據技術原理與應用》教材配套機房上機實驗指南實驗3第四章熟悉常用的HBase操作(版本號:2016年5月14日版本)主講教師:林子雨廈門大學數據庫實驗室二零一六年五月目錄
目錄1 實驗目的 12 實驗平臺 13 實驗內容和要求 14 實驗報告 1附錄1:任課教師介紹 2附錄2:課程教材介紹 2附錄3:中國高校大數據課程公共服務平臺介紹 3廈門大學林子雨編著《大數據技術原理與應用》教材配套機房上機實驗指南實驗3第四章熟悉常用的HBase操作 主講教師:林子雨/linziyu第1頁
廈門大學林子雨編著《大數據技術原理與應用》教材配套機房上機實驗指南實驗3第四章熟悉常用的HBase操作主講教師:林子雨E-mail:ziyulin@個人主頁:/linziyu實驗目的1. 理解HBase在Hadoop體系結構中的角色;2. 熟練使用HBase操作常用的Shell命令;3. 熟悉HBase操作常用的JavaAPI。實驗平臺操作系統:LinuxHadoop版本:2.6.0或以上版本HBase版本:1.1.2或以上版本JDK版本:1.6或以上版本JavaIDE:Eclipse實驗內容和要求編程實現以下指定功能,并用Hadoop提供的HBaseShell命令完成相同任務:列出HBase所有的表的相關信息,例如表名;在終端打印出指定的表的所有記錄數據;向已經創建好的表添加和刪除指定的列族或列;清空指定的表的所有記錄數據;統計表的行數。現有以下關系型數據庫中的表和數據,要求將其轉換為適合于HBase存儲的表并插入數據:學生表(Student)學號(S_No)姓名(S_Name)性別(S_Sex)年齡(S_Age)2015001Zhangsanmale232015003Maryfemale222015003Lisimale24課程表(Course)課程號(C_No)課程名(C_Name)學分(C_Credit)123001Math2.0123002ComputerScience5.0123003English3.0選課表(SC)學號(SC_Sno)課程號(SC_Cno)成績(SC_Score)201500112300186201500112300369201500212300277201500212300399201500312300198201500312300295同時,請編程完成以下指定功能:(1)createTable(StringtableName,String[]fields) 創建表,參數tableName為表的名稱,字符串數組fields為存儲記錄各個域名稱的數組。要求當HBase已經存在名為tableName的表的時候,先刪除原有的表,然后再創建新的表。 (2)addRecord(StringtableName,Stringrow,String[]fields,String[]values) 向表tableName、行row(用S_Name表示)和字符串數組files指定的單元格中添加對應的數據values。其中fields中每個元素如果對應的列族下還有相應的列限定符的話,用“columnFamily:column”表示。例如,同時向“Math”、“ComputerScience”、“English”三列添加成績時,字符串數組fields為{“Score:Math”,”Score;ComputerScience”,”Score:English”},數組values存儲這三門課的成績。 (3)scanColumn(StringtableName,Stringcolumn) 瀏覽表tableName某一列的數據,如果某一行記錄中該列數據不存在,則返回null。要求當參數column為某一列族名稱時,如果底下有若干個列限定符,則要列出每個列限定符代表的列的數據;當參數column為某一列具體名稱(例如“Score:Math”)時,只需要列出該列的數據。 (4)modifyData(StringtableName,Stringrow,Stringcolumn) 修改表tableName,行row(可以用學生姓名S_Name表示),列column指定的單元格的數據。(5)deleteRow(StringtableName,Stringrow) 刪除表tableName中row指定的行的記錄。利用HBase和MapReduce完成如下任務:假設HBase有2張表,表的邏輯視圖及部分數據如下所示:表邏輯視圖及部分數據書名(bookName)價格(price)DatabaseSystemConcept30$ThinkinginJava60$DataMining25$要求:從HBase讀出上述兩張表的數據,對“price”的排序,并將結果存儲到HBase中。實驗報告《大數據技術原理與應用》課程機房上機實驗報告題目:姓名日期實驗環境:實驗內容與完成情況:出現的問題:解決方案(列出遇到的問題和解決辦法,列出沒有解決的問題):附錄1:任課教師介紹林子雨(1978-),男,博士,廈門大學計算機科學系助理教授,主要研究領域為數據庫,實時主動數據倉庫,數據挖掘.主講課程:《大數據技術基礎》辦公地點:廈門大學海韻園科研2號樓E-mail:ziyulin@個人主頁:/linziyu數據庫實驗室網站:附錄2:課程教材介紹《大數據技術原理與應用——概念、存儲、處理、分析與應用》,由廈門大學計算機科學系教師林子雨博士編著,是中國高校第一本系統介紹大數據知識的專業教材。本書定位為大數據技術入門教材,為讀者搭建起通向“大數據知識空間”的橋梁和紐帶,以“構建知識體系、闡明基本原理、引導初級實踐、了解相關應用”為原則,為讀者在大數據領域“深耕細作”奠定基礎、指明方向。全書共有13章,系統地論述了大數據的基本概念、大數據處理架構Hadoop、分布式文件系統HDFS、分布式數據庫HBase、NoSQL數據庫、云數據庫、分布式并行編程模型MapReduce、流計算、圖計算、數據可視化以及大數據在互聯網、生物醫學和物流等各個領域的應用。在Hadoop、HDFS、HBase和MapReduce等重要章節,安排了入門級的實踐操作,讓讀者更好地學習和掌握大數據關鍵技術。本書可以作為高等院校計算機專業、信息管理等相關專業的大數據課程教材,也可供相關技術人員參考、學習、培訓之用。歡迎訪問《大數據技術原理與應用——概念、存儲、處理、分析與應用》教材官方網站:/post/bigdata掃一掃訪問教材官網附錄3:中國高校大數據課程公共服務平臺介紹中國高校大數據課程公共服務平臺,由中國高校首個“數字教師”的提出者和建設者——林子雨老師發起,由廈門大學數據庫實驗室全力打造,由廈門大學云計算與大數據研究中心、海峽云計算與大數據應用研究中心攜手共建。這是國內第一個服務于高校大數據課程建設的公共服務平臺,旨在促進國內高校大數據課程體系建設,提高大數據課程教學水平,降低大數據課程學習門檻,提升學生課程學習效果。平臺服務對象涵蓋高校、教師和學生。平臺為高校開設大數據課程提供全流程輔助,為教師開展教學工作提供一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 行政法學實踐中的應用與試題及答案
- 歷史人物對現代管理的啟發試題及答案
- 行政管理專業文化概論試題及答案
- 護理職業發展策略試題及答案
- 突破行政法學考試的困境試題及答案
- 2025年藥師藥品使用技巧試題及答案
- 2025年執業藥師案例分析試題及答案
- 2025年藥師考試常見藥物知識試題及答案
- 2025年語文考試復習手冊試題及答案
- 2025年衛生資格考試快速復習技巧試題及答案
- 初二地理考試試題及答案
- 2024第41屆全國中學生物理競賽預賽試題(含答案)
- 2024年阿壩州黑水縣招聘社區工作者考試真題
- 內鏡洗消相關試題及答案
- 2024年中國鐵路國際有限公司招聘真題
- 石油化工閥門檢修及維護措施
- 2024年廣西物流職業技術學院招聘教職人員筆試真題
- 2024-2025湘科版小學科學四年級下冊期末考試卷及答案(三套)
- 大型海上發電用雙燃料燃氣輪機企業數字化轉型與智慧升級戰略研究報告
- 工程承包再轉讓合同協議
- (廣東二模)2025年廣東省高三高考模擬測試(二)歷史試卷(含答案)
評論
0/150
提交評論