人工智能訓練師職業技能競賽題庫及答案(1-250判斷題)_第1頁
人工智能訓練師職業技能競賽題庫及答案(1-250判斷題)_第2頁
人工智能訓練師職業技能競賽題庫及答案(1-250判斷題)_第3頁
人工智能訓練師職業技能競賽題庫及答案(1-250判斷題)_第4頁
人工智能訓練師職業技能競賽題庫及答案(1-250判斷題)_第5頁
已閱讀5頁,還剩157頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人工智能訓練師職業技能競賽題庫及答案(1-250判斷題)1、產品自有數據就是自身產品銷售過程中產生的數據2、調查問卷是以問題的形式系統的記載調查內容的一種印件。3、互聯網數據分布在網頁的不同位置,我們很難采集下來。4、Excel是按照數據結構來組織,存儲和管理數據的倉庫。5、商務數據指用戶在電子商務網站購買商品的過程中,網站記錄用戶行為的大量數據。6、采集交易數據主要是為了通過數據分析評估客戶價值,將潛在客戶變為價值客戶。7、評價數據主要以圖片的形式出現。B、錯誤8、商務數據可以監控競爭對手的動態。B、錯誤9、商務數據不同幫助企業和個人共享客戶信息。10、020數據主要有020電商平臺數據和展銷平臺組成。11、數據采集又稱數據獲取,是利用設備或技術手段從現實環境及網絡獲取數據并放入系統內部進行使用。12、大多數互聯網頁編寫都是用HTML語言。13、常見的采集方法包括web爬蟲采集和API接口采集。14、Web爬蟲主要分為通用網絡爬蟲和聚焦網絡爬蟲。15、調用網站白身提供的應用程序編程接口,可以實現網絡數據采集。16、數據采集工具分為編程類和可視化采集工具兩類。17、數據采集工具可以針對某個主題從微博爬取相關信息。18、數據采集工具不能爬取學術信息。19、Python是一款服務器端解釋性開源非編譯腳本語言。20、數據采集器是進行數據采集的機器或者工具。21、數據采集器建立的任務也稱之為規則。22、數據采集器采集不同字段時,建立一種規則就可以了。23、簡易采集模式是利用系統內置模板進行數據采集的模式。24、簡易采集可根據不同的參數進行不同程度的白定義采集。A、正確27、表格數據采集要先選中表格中的一行數據。28、單網頁采集主要是采集一個網頁中的數據。29、列表詳情頁數據采集比單網頁數據采集復雜。30、列表詳情頁需要從每個商品的標題進入到商品的詳情頁。31、采集列表詳情頁數據不需要循環步驟。32、URL循環是通過使用多個URL地址進行數據采集。33、分頁循環采集是指把一頁數據分成多頁進行采集。34、網址中有多個頁面需要采集叫分頁循環采集。35、點擊頁面上的“下一頁”按鈕翻頁,是最常見的翻頁方式。A、正確38、Cookie登錄的方式不需要輸入賬號和密碼,直接打開網頁B、錯誤39、Cookie登錄中Cookie長期存在,所以是登錄采集中,最方40、ajax可以通過在后臺與服務器進行少量數據交換,可以重新加載整個網頁。41、使用ajax技術的網頁,點擊網頁中某個按鈕或下拉頁面,網址一般不發生改變,網址欄不出現加載狀態,但網頁局部有新的數據加載出來,有所變化。42、Ajax點擊可以對一個按鈕進行多次點擊。43、如果設置了ajax技術的網頁,在采集設置加載,則不能進行采集。44、XPath語言是網頁內容定位語言,它可以幫助采集工具查找網頁內容在網頁中的位置。45、XPath語言,也稱為HTML路徑語言。46、節點關系是指節點與節點之間的關系,通過包含與被包含關系區分。47、XPath中,Text()函數,主要功能為選中指定文本內容的元素。(參數1,參數2),主要功能為選中參數1中包含參數2中內容的元素。49、XPath中,last(),主要功能為選中同胞元素中最后一位的元素。50、XPath中,position(),主要功能為描述元素在同胞元素中的位置。51、使用采集器采集需要大量的專業知識。52、在公安經偵領域通過對網絡敏感信息監控比對管理,幫助公安經濟偵查工作的開展和提供數據層面的支持。53、商務數據采集多用于采購分析、市場分析、項目運行和論文54、準確性是指數據是否正確的,數據存儲在數據庫中的值是否對應于真實世界的值。55、數據質量完整性是指信息具有一個實體描述的所有必需的部B、錯誤56、空值是指缺失或不知道具體的值,可能是一條記錄中的某個屬性缺失,也可能是整條記錄都丟失。57、數據質量的數據一致性是指在數據庫中,不同表中存儲和使用的同一數據應當是等價的,表示數據有相等的值和相同的。58、數據質量的數據相關性是指數據與特定的應用和領域有關。59、數據質量的時效性是指有些數據會隨時間而變化的。60、數據質量的可信性由三個因素決定:數據來源的權威性、數據的規范性、數據產生的時間。61、數據質量的可解釋性,也稱為可讀性,是指數據被人理解的62、由于操作員重復錄入,并發處理等不規范的操作,導致產生63、數據的缺失值是指現有數據集中某個或某些屬性的值時不完64、處理空缺值的基本方法有6種,包括忽略元組、人工填寫空缺值、使用全局常量替換空缺值、使用屬性的中心度量填充空缺值、使用與給定元組屬同一類的所有樣本的平均值來填充空缺值、使用最可能的值填充空缺值。65、若一條記錄中有多個屬性值被遺漏了,則可將該記錄排除在數據挖掘之外。66、噪聲數據是指一個測量變量中的隨機錯誤或偏差。67、噪聲數據也可以用于數據挖掘進行分析。68、孤立點的是不符合數據模型的數據。69、孤立點并不真實存在,是人們無意中弄出的偏差比較大的數70、數據集成是指將互相關聯的分布式異構數據源集成到一起,使用戶能夠以透明的方式訪問這些數據源。71、數據倉庫是數據集成最常用的方法。A、正確72、實體識別,它所解決的問題是如何匹配多個信息源在現實世界中的實體事物。73、數據規約就是為了壓縮數據量,幫助從原有龐大數據集中獲得一個精簡的數據集合,并使這一精簡數據集保持原有數據集的完整A、正確74、主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。75、文本標注需要按照自然語言處理的要求進行標注,其中自然語言處理的英簡稱是NPL。76、情感語音方面的研究理論與方法尚不成熟,而人類情感具有復雜性和個性化的特點,給其研究帶來諸多困難。77、語音轉換可以理解為如下語音處理過程:先通過語音識別將輸入語音轉換為文字,對文字進行轉換,再將轉換之后的文字通過語音合成技術輸出新的語音。78、人工智能項目中,標注環節沒必要重視。耐心、責任心、較強的專注力、團隊協作、良好的溝通表達能力等。80、人工智能算法的訓練一般需要訓練集、測試集和驗證集。81、計算機具有從圖像中識別物體的能力,但是圖像噪音較大時識別率不高。82、自然語言是人類創造,是一種為某些特定目的而83、尺寸標注表示的是機件的真實大小,應以圖樣上所注的尺寸數值為依據,與圖形的大小及繪圖準確度無關。84、線性尺寸的數字一般注寫在尺寸線的下方或中斷處。86、計算機視覺的任務還包括人眼不擅長的工作,例如圖像中涉及場景、人物的三維重建。與很多學科都有密切關系,例如數字圖像處理、模式識別、機器學習、計算機圖形學等。87、為提升效率,大多數AI框架的核心功能模塊都是C++實現88、機器人一般由執行機構、驅動裝置、檢測裝置、控制系統和復雜機械等組成,涉及到控制論、機械電子、計算機、材料、仿生等89、強人工智能觀點認為可能創造出真正推理和解決問題的智能90、機器的優勢在于善于處理復雜的確定問題。91、人工智能讀片的方法之一是利用目標檢測。B、錯誤92、智能家居應該自動感知周圍的環境,可以不需要人的操控。93、智能音箱本質上是音箱、智能語音交互系統、互聯網、內容94、根據發展趨勢定義,人工智能就是會不斷自我學習的計算機程序。95、人工智能學習玩FlappyBird過程中,只需要人類告訴AI不能碰到水管即可,不需要提供其他信息。96、醫療健康領域,人工智能在醫學影像方面的應用被認為最不可能率先實現商業化。97、只有符合社會倫理規范和公共政策的解決方案,才能設計出可信賴的人工智能。98、重復性強,要求弱社交能力的工作是最容易被AI取代的工99、強人工智能觀點認為可能創造出真正推理和解決問題的智能100、尺寸界線用細實線繪制,并應由圖形的輪廓線、軸線或對稱中心線處引出,不可直接以這些線作為尺寸界線。101、依據《人工智能訓練師國家職業技能標準》命題,學生組對應那個技能等級技師。B、錯誤102、自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統,特別是其中的軟件系統,但它并不屬于計算機科學的一部分。A、正確B、錯誤104、Python中的集合數據類型中的元素是有序的。105、Python是一種跨平臺、開源、免費的高級動態編程語言。106、Python中的集合數據類型中的元素是有序的。107、Python中的變量在使用前必須先定義。108、已知x=3,那么賦值語句x='abcedfg'是無法正常執行的。109、3+4j不是合法的Python表達式。110、9999**9999這樣的命令在Python中無法運行。111、Python代碼的注釋只有一種方式,那就是使用#符號。A、正確==list(reversed(x))的值一定是Tr115、生成器推導式比列表推導式具有更高的效率,推薦使用。116、Python列表、元組、字符串都屬于有序序列。117、在Python3.x中語句print(*[1,2,3])不能正確執行。118、列表對象的append()方法屬于原地操作,用于在列表尾部追加一個元素。119、在UTF-8編碼中一個漢字需要占用3個字節。B、錯誤121、機器學習的學習方式是通過獲得經驗或歷史數據不斷改進提高做某項任務的表現。122、機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。cap=cv2.VideoCapture(‘video.mp4’回值ret是布爾型,正確讀取則返回True,讀取失敗或讀取視頻結尾則會返回False。frame為最后一幀的圖像。124、python中如果導入cv2,使用cap=cv2.VideoCapture表示打開筆記本的內置攝像頭。125、計算機視覺(ComputerVision)是指利用攝像機和電腦代替人眼,使得計算機擁有類似于人類的那種對目標進行分割、分類、識別、跟蹤、判別決策的功能。126、cd到你的python解釋器下的scripts中,可以使用pipinstall+(庫的名稱)安裝庫。127、使用pip命令安裝庫的時候,為了提高效率,有時會使用國內鏡像安裝庫,命令格式是pipinstall+庫名+-m+鏡像地址。128、fromAimportB是從模塊庫B中導入A模塊。B、錯誤130、所有的機器學習分類算法都屬于有監督方法。131、監督學習的數據必須要帶標簽等人為標注信息。132、pytorch通常需要用戶編寫自定義訓練循環,訓練循環的代碼風格因人而異。有3類典型的訓練循環代碼風格:腳本形式訓練循環,函數形式訓練循環,類形式訓練循環。133、對抗神經網絡可以通過兩個神經網絡的博弈,達到更好的學習效果。正確。134、監督學習需要有大量標注好的數據集來對模型進行訓練。135、傳統的機器學習方法的表現主要算法,目前的機器學習主要是強化學習,具有自學習能力。136、算法做出的價格往往比人做出的市場價格要合理。137、人工智能算法是嚴格按照規則進行股市交易的。138、RNN循環神經網絡是用來處理文本、視頻、音頻等序列數139、DNN是卷積神經網絡。141、監督學習是從標記的訓練數據來推斷一個功能的機器學習任務。142、根據類別未知(沒有被標記)的訓練樣本解決模式識別中的各種問題,稱之為監督學習。143、根據類別未知(沒有被標記)的訓練樣本解決模式識別中的各種問題,稱之為無監督學習。144、啟發式算法與AlphaBeta剪枝類似,是從葉節點自底向上145、仿生算法是一類模擬自然生物進化或者群體社會行為的隨機搜索方法的統稱。B、錯誤146、在解決函數優化問題時,基因遺傳算法的全局性不好,容易陷入局部最優值。147、自然界中生物變異的概率是不確定的,但是基因遺傳算法的變異概率可以人為調節。148、神經網絡中各個隱藏層能提取出和人類看到的一樣的特征。fromPILimportImageimportmatplotlib.pyplon(os.path.join('images','2007_000648'+'.jpg'))plt(figsize=(10,5))#設置窗口大小plt.suptitle('Multi_Image')(img)如上代碼中plt.subplot(2,3,1)的意思是在同一畫面創建3行2列個圖形位置,當前圖片現在在第1個位置。111、Python代碼的注釋只有一種方式,那就是使用#符號。112、Python支持使用字典的"鍵"作為下標來訪問字典中的值。==list(reversed(x))的值一定是Tr115、生成器推導式比列表推導式具有更高的效率,推薦使用。116、Python列表、元組、字符串都屬于有序序列。B、錯誤117、在Python3.x中語句print(*[1,2,3])不能正確執行。A、正確118、列表對象的append()方法屬于原地操作,用于在列表尾部追加一個元素。119、在UTF-8編碼中一個漢字需要占用3個字節。120、如果僅僅是用于控制循環次數,那么使用foriinrange(20)和foriinrange(20,40)的作用是等價的。121、機器學習的學習方式是通過獲得經驗或歷史數據不斷改進提高做某項任務的表現。122、機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。cap=cv2.VideoCapture(‘video.mp4’)ret,frame=cap.read()返回值ret是布爾型,正確讀取則返回True,讀取失敗或讀取視頻結尾則會返回False。frame為最后一幀的圖像。124、python中如果導入cv2,使用cap=cv2.VideoCapture(0)表示打開筆記本的內置攝像頭。125、計算機視覺(ComputerVision)是指利用攝像機和電腦代替人眼,使得計算機擁有類似于人類的那種對目標進行分割、分類、識別、跟蹤、判別決策的功能。126、cd到你的python解釋器下的scripts中,可以使用pipinstall+(庫的名稱)安裝庫。127、使用pip命令安裝庫的時候,為了提高效率,有時會使用國內鏡像安裝庫,命令格式是pipinstall+庫名+-m+鏡像地址。128、fromAimportB是從模塊庫B中導入A模塊。130、所有的機器學習分類算法都屬于有監督方法。131、監督學習的數據必須要帶標簽等人為標注信息。代碼風格因人而異。有3類典型的訓練循環代碼風格:腳本形式訓練循環,函數形式訓練循環,類形式訓練循環。133、對抗神經網絡可以通過兩個神經網絡的博弈,達到更好的學習效果。正確。134、監督學習需要有大量標注好的數據集來對模型進行訓練。B、錯誤135、傳統的機器學習方法的表現主要算法,目前的機器學習主要是強化學習,具有自學習能力。B、錯誤136、算法做出的價格往往比人做出的市場價格要合理。A、正確137、人工智能算法是嚴格按照規則進行股市交易的。138、RNN循環神經網絡是用來處理文本、視頻、音頻等序列數B、錯誤139、DNN是卷積神經網絡。B、錯誤141、監督學習是從標記的訓練數據來推斷一個功能的機器學習B、錯誤142、根據類別未知(沒有被標記)的訓練樣本解決模式識別中的各種問題,稱之為監督學習。B、錯誤143、根據類別未知(沒有被標記)的訓練樣本解決模式識別中的各種問題,稱之為無監督學習。B、錯誤144、啟發式算法與AlphaBeta剪枝類似,是從葉節點自底向上計算估值。A、正確145、仿生算法是一類模擬自然生物進化或者群體社會行為的隨機搜索方法的統稱。146、在解決函數優化問題時,基因遺傳算法的全局性不好,容易陷入局部最優值。B、錯誤147、自然界中生物變異的概率是不確定的,但是基因遺傳算法的變異概率可以人為調節。A、正確148、神經網絡中各個隱藏層能提取出和人類看到的一樣的特征。fromPILimportImageimportmatplotlib.pypn(os.path.join('images','2007_000648'+'.jpg'))plt(figsize=(10,5))#設置窗口大小plt.suptitle('Multi_Image')(img)如上代碼中plt.subplot(2,3,1)的意思是在同一畫面創建3行2列個圖形位置,當前圖片現在在第1個位置。150、梯度下降算法是最常用也是最有效的神經網絡的優化辦法,完全可以滿足不同類型的需求。151、Tensorflow是等下最流行的深度學習框架之一。152、Tensorflow是一個用于機器學習和深度學習的端到端開源153、樸素貝葉算法不需要樣本特征之間的獨立同分布。154、循環神經網絡所使用的訓練法則叫做時序反向傳播,簡稱('images','2007_000648'+'.jpg'))gray=img.convert('1')最后一句代碼是將圖片轉化為二值圖像。156、機器學習的含義是指機器面對自行為的修正或性能的改善和機器對客觀規律和發展。157、深度學習在人工智能領域表現并不突出。159、相對于人工神經元網絡和深度學習,類腦人工智能對人類大腦的神經回路具用更深入的理解。160、類腦人工智能是指模擬人類大腦的人工智能。161、類腦人工智能及人工神經網絡只是智能的一種形式。162、python做矩陣操作一般要先引入相應的庫,例如乘,如果np是導入的numpy庫,使用的語句是np.dot(x,y)。164、機器學習算法訓練完成后,在訓練集準確率很高,但驗證集準確率很低,說明已經過擬合。165、專家系統模擬人類專家的知識和經驗解決特定領域的問題,實現了人工智能從理論研究走向實際應用。167、可以結合人工分詞來加快文本數據標注的進度。168、語料標注涵蓋在自然語言處理任務的建模和標注兩個步驟中,語料標注過程盡量嚴格按照標注規范可以確保一次性建立完美的標注模型。169、對專業度要求比較高的標注,最好請制定標注標準的人參170、區域標注指是指將圖像分成各具特性的區域并提取出感興趣部分的過程。171、“回歸問題和分類問題都有可能發生過擬合”,這句話是否172、對于回歸問題和分類問題,最常用的指標都是準確率和召173、CNN的全稱是卷積神經網絡,是否正確?()。174、RNN的全稱是卷積神經網絡,是否正確?()。175、MLP的全稱是指卷積神經網絡,是否正確?()。176、GAN的全稱是指卷積神經網絡,是否正確?()。177、給定n個數據點,如果其中一半用于訓練,另一半用于測試,則訓練誤差和測試誤差之間的差別會隨著n的增加而減少,請問這句話是否正確()。183、語音增強的主要任務就是消除環境噪聲對語音的影響。184、語音識別中,最簡單的是特定人、小詞匯量、孤立詞的語185、有更多隱層神經網絡模型,我們稱之為深度學習。186、神經元受到足夠強度的刺激,才會響應釋放出刺激其他神經元的遞質,刺激不足不會有輸出。187、有更多隱層神經網絡模型,我們稱之為深度學習。188、在圖像處理中,采樣越細,像素越小,越能精確的表現圖191、一個實體指向它的屬性值。不同屬性類型對應于不同類型192、常見的非結構化數據主要是文本類的文章,即自然語言數193、學習率越大,訓練速度越快,最優解越精確。194、國家、民族、書籍、電腦等都是由實體組成的集合,即語義類(概念)。195、不同于基于關鍵詞搜索的傳統搜索引擎,知識圖譜可用來更好地查詢復雜的關聯信息,從語義層面理解用戶意圖,改進搜索質量。()。搜狗“知立方”等。199、語音識別技術中最復雜最難解決的是,特定人、大詞匯量、連續語音識別。200、聚類需要從沒有標簽的一組輸入向量中尋找數據的模型和規律。201、監督學習的學習數據既有特征(feature),也有標簽(label)。202、學習率越小,訓練速度越慢,最優解越精確。B、錯誤203、計算機視覺利用二維投影圖像來重構三維物體的可視部分。204、人耳的精妙結構決定了我們對不同頻率的聲音有著不同的205、在梯度分別為正負的兩個點之間,一定存在一個梯度為0B、錯誤210、決策樹學習是一種逼近離散值目標函數的方法,學習到的函數被表示為一棵決策樹。B、錯誤211、梯度下降,就是沿著函數的梯度(導數)方向更新白變量,使得函數的取值越來越小,直至達到全局最小或者局部最小。212、學習率越大,訓練速度越快,最優解越精確。213、線性回歸是一種有監督機器學習算法,它使用真實的標簽217、列表、元組和字符串都支持雙向索引,有效索引的范圍為[-L,L],L為列表、元組或字符串的長度。218、列表、元組和字符串

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論