




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
信息檢索全部檢索策略都包含三個要素,以下選項中不屬于三要素的一項為哪一項〔〕A、匹配函數B、排序函數C、文檔表示D、查詢表示答案:B在向量模型中,不行以通過〔〕來衡量文檔和查詢之間的相像度。A、向量間距離B、向量內積C、向量間夾角大小D、向量間正切值答案:DT1、T2、T3表示特征項,D1、D2、D3、D4為文檔向量,Q為查詢向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4=T2+3T3,Q=T1+0T2+2T3 。Q最大可能相關的是〔〕A、D1B、D2C、D3D、D4答案:A以下選項中屬于概率模型的優點的是〔〕A、模型具有內在的相關反響機制,將文檔依據相關概率按遞減挨次排列B、模型最初將文檔分成相關的集合和不相關的集合C、模型中全部的權值都是二值的D、模型假設標引詞相互獨立答案:A信息檢索模型中,神經網絡模型屬于〔〕A、布爾模型B、向量模型C、概率模型D、構造化模型答案:B以下關于網絡爬蟲的描述中,錯誤的一項為哪一項〔〕A、在爬蟲開頭的時候,需要給爬蟲輸送一個URL列表,作為爬蟲的起始位置B、依據某種抓取策略爬行覺察的URL,如此重復下去C、爬蟲程序會抓取全部網頁,以保證搜尋正確性D、對于商業搜尋引擎來說,分布式爬蟲是必需承受的技術答案:C在實際的搜尋引擎系統中,通過存儲〔〕來存儲文檔信息A、文檔地址B、文檔簡化序號C、文檔編號D、文檔編號差值答案:D下面方法中,不是建立索引的方法的是〔〕A、兩邊文檔遍歷法B、排序法C、歸并法D、HITS答案:DRank標準算法與簡化算法正確的選項是〔〕A、Rank簡化算法對G中的每一個節點n1/nB、Rank簡化算法可以保證迭代過程中的Rank值之和為1C、Rank標準算法不考慮沒有超鏈接網頁的狀況D、在實際運算過程中,由于節點數n的值巨大,因此通常承受適用于稀疏矩陣運算的Rank標準算法來對運算過程進展改善答案:AHITS算法描述正確的選項是〔C〕A、算法最終輸出的是依據內容權威度排序的結果列表B、假設在原有的擴展網頁集合內添加刪除個別網頁或者轉變少數鏈接關系,HITS算法的排名結果不會有格外大的轉變C、HITS算法核心思想是對網頁兩個方面的權威程度進展評價,一個是內容權威度,另一個是鏈接權威度,兩者具有相互增加的關系D、HITS是與查詢相關的算法,計算效率較高答案:C網頁重定向屬于以下哪種作弊方式〔C〕A、內容作弊B、鏈接作弊C、隱蔽作弊D、Web2.0作弊答案:C對網頁進展兩次抓取,第一次是正常的搜尋引擎爬蟲抓取,其次次以模擬人工訪問頁面的方式抓取,假設兩次抓取到的內容差異較大,則認為是作弊頁面,這屬于〔〕A、識別網頁重定向B、識別頁面隱蔽C、反內容作弊D、鏈接反作弊答案:B以下不是搜尋引擎的主要功能模塊的一項為哪一項〔〕A、網絡爬蟲B、搜尋引擎索引C、RankD、搜尋排序答案:C以下選項中描述不正確的選項是〔〕A、爬蟲的作用是為搜尋引擎抓取大量的數據,抓取的對象是整個互聯網上的網頁B、依據具體應用的不同,可以將爬蟲分為兩種類型,即增量型爬蟲和垂直型爬蟲C之后,才能獵取相關數據D位置信息答案:B以下選項中描述正確的選項是〔〕A2個關鍵的索引構造:倒排索引、臨時索引B程度的度量。C、中文分詞技術承受了基于符號的方法來識別D、機器學習的四個步驟中,文檔特征抽取是指利用抽取算法抽取查詢詞TF/IDF信息、文檔長度、網頁Rank值、網頁入鏈出鏈數量等答案:D以下關于推舉系統和搜尋引擎的說法中,錯誤的選項是〔〕A、推舉系統和搜尋引擎都是為了解決信息過載的問題B、搜尋引擎需要用戶供給明確的需求C、推舉系統是由用戶主導的D、搜尋引擎留意結果之間的排序答案:C以下關于推舉系統評測中在線試驗的說法,錯誤的選項是〔〕A、可以公正獲得不同算法實際在線時的性能指標B、本錢較低,簡潔部署C、可以獲得商業上關注的指標,如轉化率、點擊率等D、周期較長,需要進展長期的試驗才能得到牢靠的結果答案:B為了掩蓋用戶的不同興趣領域,我們需要提高推舉結果的〔〕A、驚喜度B、滿足度C、多樣性D、準確率答案:C以下各項中為工業界更關注的評測指標的是〔〕A、點擊率B、驚喜度C、穎性D、準確率答案:A從商家角度看,推舉系統受歡送的緣由有〔〕A、拓寬了用戶獵取學問的方式B、可以增加用戶信任度和粘性,增加營收C、可以幫助用戶覺察寵愛的事物D、可以增加用戶體驗答案:B以下選項中是顯性反響數據的是〔〕A、用戶觀看了某個視頻B、用戶對某個視頻的評分C、用戶觀看視頻的日志D、用戶在某個視頻的停留時長答案:B以下關于基于用戶的協同過濾算法的說法中,錯誤的選項是〔〕A、隨著網站的用戶數目越來越大,計算用戶興趣相像度矩陣將越來越困難B己的興趣傳承C、基于用戶的協同過濾算法可以使用余弦相像度來評測兩個用戶之間的聯系D答案:B以下關于推舉算法的說法中,錯誤的選項是〔〕A、隱語義模型很難實現實時推舉B、基于物品的協同過濾算法著重于維護用戶的歷史興趣C接將其舍棄D、基于用戶的協同過濾算法更社會化,著重于反映和用戶興趣相像的小群體的熱點答案:C針對用戶冷啟動問題,以下選項中做法錯誤的選項是〔〕A、利用用戶的人口統計學信息B、推舉熱門商品C、引導用戶勾選感興趣的標簽D、利用用戶手機中其它應用的日志文件分析用戶的興趣點答案:D以下選項中不是冷啟動問題解決方案的是〔〕A、推舉熱門商品給用戶B、請專家對商品進展標注C、推舉冷門物品給用戶D、雇傭少量用戶試用商品并給出評分答案:C數據挖掘以下哪項不屬于學問覺察的過程?()A、數據清理B、數據挖掘C、學問可視化表達D、數據測試答案:D以下哪些不屬于數據挖掘的內容?〔〕A、分類B、聚類C、離群點檢測D、遞歸分析答案:D以下哪個不是常見的屬性類型?〔〕A、A.標稱屬性B、數值屬性C、高維屬性D、序數屬性答案:C以下哪個度量屬于數據散度的描述?〔〕A、均值B、中位數C、標準差D、眾數答案:C以下哪個度量不屬于數據中心趨勢度描述?〔D〕、A.均值B、中位數C、眾數D、四分位數答案:D對數據進展數據清理、集成、變換、規約是數據挖掘哪個步驟的任務?()A、頻繁模式挖掘B、分類和推測C、數據預處理D、噪聲檢測答案:C聚類分析是數據挖掘的一種重要技術,以下哪個算法不屬于聚類算法?()A、K-MeansB、DBSCANC、SVMD、EM答案:C建立一個模型,通過這個模型依據的變量值來推測其他某個變量值屬于數據挖掘的哪一類任務?()A、依據內容檢索B、建模描述C、推測建模D、查找模式和規章答案:C當不知道數據所帶標簽時.可以使用哪種技術促使帶同類標簽的數據與帶其他標簽的數據相分別?()A、分類B、聚類C、關聯分析D、隱馬爾可夫鏈答案:B在構造決策樹時,以下哪種不是選擇屬性的度量的方法?()A、信息增益B、信息增益率C、基尼指數D、距離答案:D學問覺察流程最核心的步驟是什么?()A、數據挖掘B、數據預處理C、模式評估D、學問表示答案:A將原始數據進展集成、變換、維度規約、數值規約是在以下哪個步驟的任務?()A、頻繁模式挖掘B、分類和推測C、數據預處理D、數據流挖掘答案:C以下哪個度量屬于數據中心性的描述?〔〕A、均值B、極差C、眾數D、標準差答案:A類分析是數據挖掘的一種重要技術,以下哪個算法不屬于聚類算法?()A、K-MeansB、DBSCANC、KNND、EM答案:C某超市爭論銷售紀錄數據后覺察,買啤酒的人很或許率也會購置尿布,這種屬于數據挖掘()A、關聯規章覺察B、聚類C、分類D、自然語言處理答案:A以下哪些算法是分類算法?()A、DBSCANB、C4.5C、K-MeanD、EM答案:BK-means算法的缺點不包括?()A、K必需是事先給定的B、選擇初始聚類中心C、對于“噪聲”和孤立點數據是敏感的D、可伸縮、高效答案:D機器學習中,下面哪些方法不行以避開分類中的過擬合問題?〔〕A、增加樣本數量B、增加模型簡單度C、去除噪聲D、正則化答案:B下面那個不屬于學問覺察過程。〔〕A、數據清理與集成B、數據統計C、數據挖掘D、模式評估和學問表示答案:B在構造決策樹時,以下那個不屬于選擇屬性的度量?()A、信息增益B、信息增益率C、基尼指數D、信息熵答案:D關于頻繁模式,下面哪一個陳述是正確的?()A、K項集頻繁則K-1項則必定不頻繁B、K項集頻繁則K-1項則必定頻繁C、K項集不頻繁則K-1項則必定頻繁D、以上都不正確答案:BDBSCAN 算法最大的挑戰是?()A、確定聚類個數B、確定聚類外形C、確定半徑及MI
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年元宇宙社交平臺用戶需求預測與發展瓶頸分析報告
- 2025年醫院信息化建設電子病歷系統優化與醫療信息化應用場景研究報告
- 藝術品數字化交易平臺投資價值與風險評估報告
- 2025年醫院信息化建設電子病歷系統功能優化深度分析報告
- 2025年醫院電子病歷系統在醫院信息化建設中的數據挖掘技術應用報告
- 2025年汽車輕量化材料在汽車輕量化車身制造工藝中的應用趨勢報告
- 2025年Z世代消費行為分析:新消費品牌產品創新與品牌定位報告
- 農村金融服務創新與綠色金融:2025年可持續發展報告
- 文化與科技融合在數字藝術展覽中的創新應用與發展趨勢報告
- 爆破員考試題及答案
- 【MOOC】人像攝影-中國傳媒大學 中國大學慕課MOOC答案
- 【MOOC】計算機組成原理-電子科技大學 中國大學慕課MOOC答案
- 【MOOC】電路分析AⅡ-西南交通大學 中國大學慕課MOOC答案
- 燃氣管道防火防爆安全方案
- 裝飾裝修施工人員安全知識培訓考試試卷及答案
- 小學生數學邏輯推理題100道及答案解析
- 2023年上海市普通高中學業水平合格性考試地理試題及答案
- 基本氣象要素
- 食品安全規章制度模板打印
- 2024版小學一年級下冊綜合實踐活動模擬試卷
- 2024年永平縣小升初全真數學模擬預測卷含解析
評論
0/150
提交評論