




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
項目1
人工智能數據服務基礎《人工智能數據服務》學習引導任務11認識人工智能數據服務項目導入人工智能數據服務作為支持人工智能(AI)技術發展的關鍵環節,正在推動社會各個領域的深刻變革。人工智能數據服務不僅是推動AI技術進步的“燃料”,更是驅動社會數字化轉型的引擎。數據服務的質量直接影響AI模型的性能和適應性,從而對智能交互、無人駕駛、醫療健康等領域的成功應用產生深遠影響。任務1認識人工智能數據服務1任務描
述任務導入知
識
準
備任務小
結任務實
施本次任務將認識人工智能數據服務的相關概念和應用場景,并了解數據服務的行業發展。通過對人工智能數據服務的學習,我們不僅要掌握專業知識,更要深刻理解數據在國家科技自立自強中的重要性。任務
導
入任
務
描
述知
識
準
備任務小
結任務實
施任務名稱任務內容任務1-1認識人工智能數據服務認識人工智能數據服務的定義、組成部分和應用價值,熟悉人工智能數據服務的具體應用場景。了解人工智能數據服務的行業發展,包括行業發展歷程、發展現狀、未來發展趨勢及機遇。掌握人工智能數據服務任務環境安裝,包含Anaconda、Pycharm的安裝,以及在Pycharm中配置Conda環境。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.人工智能數據服務的定義1.1.1人工智能數據服務概念人工智能數據服務是指為AI算法的訓練、驗證和優化提供高質量、結構化數據的專業服務。在人工智能如火如荼的今天,算法、算力和數據是驅動這一技術革命的三駕馬車。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念數據清洗特征工程模型評估與部署數據安全與隱私保護數據服務持續改進010203040506070809數據采集數據標注模型訓練與優化數據可視化與解釋性任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念01數據采集
數據采集的主要任務是從各種渠道獲取與特定任務相關的數據,這些渠道包括互聯網爬蟲、傳感器、數據庫、日志文件、用戶反饋信息、API接口以及人工輸入等。
數據采集不僅需要考慮數據的數量,還要確保數據的多樣性和代表性,以避免模型訓練中出現偏差。
數據采集的合法性和合規性也至關重要,特別是在涉及個人信息的情況下,需要嚴格遵守相關法律法規。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念02數據清洗
原始數據往往包含噪聲、缺失值、重復值和異常值,這些問題會嚴重影響模型的性能。
常見的數據清洗操作包括去重、填補缺失值、修正異常值、統一數據格式和標準化數據等。
清洗后的數據更為準確、整潔,能夠為后續的數據標注、特征工程和模型訓練提供堅實的基礎。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念03數據標注
數據標注是將無標簽的原始數據轉換為有標簽數據的過程,它直接決定了模型的訓練效果。
數據標注可以涉及多種形式,如圖像中的目標框選、文本中的情感分類、語音中的語義識別等。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念04特征工程特征工程是從原始數據中提取出對模型訓練有用的信息的過程。特征工程包括特征選擇、特征轉換和特征構造等步驟。特征選擇是挑選出最具代表性和最相關的特征特征轉換是將特征數據轉換為更適合模型使用的形式(如歸一化、標準化等)特征構造是通過組合已有特征或創建新的特征來增強模型的學習能力。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念05模型訓練與優化
模型訓練是利用標注數據對AI模型進行參數調整,使其能夠從數據中學習并執行特定任務的過程。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念06模型評估與部署
模型評估是檢驗模型在實際任務中的表現的關鍵步驟。
通過測試集或交叉驗證,評估模型的準確性、召回率、精確率和F1值等指標。
模型評估不僅關注模型在訓練數據上的表現,更重視其在未見數據上的泛化能力。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念07數據可視化與解釋性
數據可視化是將復雜的數據和模型結果通過圖表的形式呈現給用戶或決策者,使其能夠直觀理解數據的分布、模型的表現和預測結果。數據可視化不僅是數據分析的工具,還可以用于解釋AI模型的決策過程,幫助識別潛在的偏差和問題。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念08數據安全與隱私保護數據安全涉及防止數據泄露、篡改和未經授權的訪問,常見措施包括數據加密、訪問控制和日志審計等。隱私保護則主要針對涉及個人信息的數據,必須遵循數據保護法規(如GDPR,通用數據保護條例),并采用諸如數據匿名化、差分隱私等技術,確保在提供數據服務時不侵犯用戶隱私。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.人工智能數據服務的組成部分1.1.1人工智能數據服務概念09數據服務持續改進人工智能數據服務并非一次性的工作,而是一個持續改進的過程。隨著AI模型的應用和反饋的積累,數據服務團隊需要不斷優化數據采集和處理流程,更新數據標注標準,改進特征工程方法,并根據實際業務需求調整模型訓練和評估策略。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施3.人工智能數據服務的價值1.1.1人工智能數據服務概念降低開發成本3通過提供優質的數據服務,可大幅減少AI模型在開發階段的反復調試與修改工作。1提升AI模型的精準度精確、完整且多樣性豐富的數據輸入,可提升AI模型訓預測能力、降低模型的誤差率、提高其穩定性。縮短AI模型的開發周期2經過精細處理和高質量標注的數據,可提升模型訓練的效率,減少數據準備階段的時間投入。4增強市場競爭力擁有豐富、精準數據的企業,可洞察市場趨勢,響應客戶需求變化,在產品研發、服務優化等方面搶占先機。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景人工智能數據服務應用場景通用大模型教育行業安防行業交通行業金融行業醫療行業任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景1.通用大模型中的應用多模態數據的應用(如圖像、視頻、語音等)可以使模型在處理復雜任務時更加高效和準確數據的多模態融合數據服務供應商通過提供高質量、有代表性的數據,幫助模型開發者定向優化,使模型能夠更好地適應特定場景的需求。模型能力的定向優化大模型的評測離不開高質量的數據服務。通過定期評測和數據更新,模型可以不斷迭代優化,提升其在實際應用中的表現。模型評測與迭代任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景2.安防行業中的應用多模態數據的應用(如圖像、視頻、語音等)可以使模型在處理復雜任務時更加高效和準確大模型的評測離不開高質量的數據服務。通過定期評測和數據更新,模型可以不斷迭代優化,提升其在實際應用中的表現。圖像識別
自動識別并追蹤目標人物、車輛檢測異常行為,如入侵、打架、火災等行為分析視頻數據分析人群的行為模式,識別潛在的危險行為身份驗證人臉識別技術在安防領域應用廣泛,如門禁系統、銀行的身份驗證等任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景3.金融行業中的應用智能風控
通過分析大量歷史交易數據和用戶行為數據,識別潛在的風險客戶,預防欺詐行為的發生自動化交易自動化交易系統依賴于大量的歷史交易數據,以確保能夠實時預測市場走勢并作出最佳交易決策客戶服務用于金融機構的客戶服務,如智能客服系統。智能客服系統需要大量的語音和文本數據任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景4.醫療行業中的應用醫學影像分析
AI可以通過分析醫學影像數據,如X光片、CT掃描、MRI圖像等,協助醫生進行疾病診斷疾病診斷AI技術可以通過分析患者的電子健康記錄(EHR)、基因數據等,輔助疾病診斷和治療方案的制定藥物研發通過分析大量的化合物數據和臨床試驗數據,AI可以加速藥物研發的進程任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景5.交通行業中的應用智能交通管理AI可以通過分析交通數據,優化交通流量,減少擁堵,提高交通效率。無人駕駛依賴于計算機視覺和傳感器融合技術,需要大量的圖像數據和傳感器數據。物流管理AI技術在物流管理中的應用主要體現在路線優化、倉儲管理、自動化配送等方面。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.2人工智能數據服務的應用場景6.教育行業中的應用智能輔導系統可以用于開發智能輔導系統,通過分析學生的學習數據,提供個性化的學習建議和輔導方案。在線教育平臺在線教育平臺借助AI技術可以提供智能化的教學服務,如自動作業批改、知識點推薦等。個性化學習開發個性化學習系統,根據學生的學習風格和進度,制定個性化的學習路徑。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.3人工智能數據服務行業發展歷程技術落地與行業格局形成行業萌芽與資本熱潮技術革新與行業競爭壁壘構建早期階段2016年-2018年01中期階段2019年-2022年02后期階段2023年至今任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.3人工智能數據服務行業發展歷程1.早期階段(2016年-2018年):行業萌芽與資本熱潮數據服務行業以數據采集和標注為核心業務數據采集通常包括圖片、文本、音頻等各種形式的原始數據的收集數據標注是對這些數據進行分類、標記或注釋,以便為機器學習模型提供標準化的訓練樣本這一時期的AI技術主要集中在計算機視覺和自然語言處理領域,圖像和文本數據的標注需求尤為強烈數據在AI技術,尤其是深度學習中有重要作用。隨著AI公司在算法研究方面的不斷深入,數據的需求量也呈爆發式增長。2016年谷歌的阿爾法圍棋(AlphaGo)成功擊敗了圍棋世界冠軍李世石任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.3人工智能數據服務行業發展歷程2.中期階段(2019年-2022年):技術落地與行業格局形成
2019年后,人工智能技術逐漸從實驗室研究轉向實際應用
汽車、醫療、金融等領域成為人工智能技術落地的重要場景
到2022年,超過75%的AI企業集中在A輪融資階段,表明行業已逐漸成熟并進入規范化發展時期數據服務的種類和形式更加多樣化,除了基礎的數據采集和標注服務外,行業開始出現更加復雜和定制化的數據解決方案。百度在2019年推出了“阿波羅自動駕駛技術”“百度數據眾包”平臺任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.3人工智能數據服務行業發展歷程3.后期階段(2023年至今):技術革新與行業競爭壁壘構建行業競爭促使數據服務商尋求差異化優勢通過垂直化服務能力的提升,數據服務商可以針對不同行業提供更加專業和定制化的解決方案越來越多企業開始提供數據清洗、數據增強、數據隱私保護等增值服務2024年起,數據治理和數據產品化趨勢繼續加強,數據服務商將更加注重數據的發現性、可用性和合規性隨著AI技術的進一步成熟,傳統的數據標注方式已無法滿足日益增長的數據處理需求。AI預標注技術應運而生,成為數據服務行業的關鍵技術。百度智能云:自動駕駛數據采集
標注、自動化質檢任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.4人工智能數據服務行業發展現狀1.人工智能數據服務行業市場規模2023年,中國AI數據服務市場規模達45億元;預計2028年,市場規模將達到170億元,復合增長率將高達30.4%
2022-2028年中國AI數據服務市場規模(數據來源:艾瑞咨詢研究院)供給側數據源獲取更加便捷數據工程技術、數據標準規范、標注方法日益成熟人才生態不斷完善服務軟件平臺自動化、流程化需求側小模型到大模型轉變,通用泛化能力的大模型正逐漸成為主大量高質量、多模態的數據需求AI技術應用成果帶來良好的商業回報,進一步刺激了需求側對基礎數據的投入任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.4人工智能數據服務行業發展現狀2.人工智能數據服務行業產業鏈上游主要由數據生產者及產能資源構成生產者包括各種數據生成源,如互聯網平臺、物聯網設備、社交媒體等,通過各種渠道提供原始數據產能資源特別是人力資源扮演著關鍵角色。數據標注員和審核員是這個環節中的核心中國人工智能數據服務行業產業圖譜(數據來源:艾瑞咨詢研究院)任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.4人工智能數據服務行業發展現狀2.人工智能數據服務行業產業鏈中國人工智能數據服務行業產業圖譜(數據來源:艾瑞咨詢研究院)中游環節是行業的核心,即數據標注及其他數據服務供應商供應商根據下游需求方的要求,對上游提供的數據進行加工、標注,并提供相應的服務,幫助AI模型的訓練和優化任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.4人工智能數據服務行業發展現狀2.人工智能數據服務行業產業鏈中國人工智能數據服務行業產業圖譜(數據來源:艾瑞咨詢研究院)下游是AI數據服務的需求發起者,包括科技公司、行業企業、AI公司、科研單位等科技公司和AI企業通過數據服務,不斷優化其AI模型,以應對復雜的場景和需求行業企業和科研單位借助AI技術,實現技術革新和科研突破任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.4人工智能數據服務行業發展現狀3.人工智能數據服務行業市場結構需求方自建團隊大型科技企業和云服務廠商更傾向于通過自建團隊來滿足其內部數據服務需求自建團隊不僅能夠更好地控制數據的質量與安全,還能更快速地響應內部的算法迭代需求品牌數據服務商品牌服務商往往具備更強的技術能力和更豐富的數據資源,能夠為AI開發企業提供更專業和全面的數據服務這些數據服務往往由其云服務業務線、算法研發團隊,以及外部的品牌數據服務商來共同完成中小數據服務商由于市場競爭的加劇以及大規模數據標注項目對服務能力要求的提升,市場份額大幅下滑2023年中國AI數據服務供給方的市場結構(數據來源:艾瑞咨詢研究院)任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.5人工智能數據服務行業未來趨勢及機遇人工智能數據服務行業發展趨勢與機遇需求向垂直化方向過渡人機協作發展趨勢向自然語言類需求滲透任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.5人工智能數據服務行業未來趨勢及機遇1.人工智數據服務需求將向垂直化方向過渡研發初期訓練階段應用階段對數據量有較大需求,而對數據質量要求相對較低,更注重模型的構建和初步驗證,數據的多樣性和廣泛性更重要對于已標注數據的需求顯著增加。同時,隨著訓練要求的提升,對數據采集和標注的精確度也有了更高的要求AI技術已經趨于成熟,需要的數據服務也更為專業和細致。所需的數據需要更加貼近具體的業務場景,以提供更具針對性的垂直化數據服務任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.5人工智能數據服務行業未來趨勢及機遇2.數據服務需求逐步向自然語言類需求滲透圖像類數據需求在國內市場占據主導地位相對成熟的美國市場,自然語言處理(NLP)需求已成為主導隨著國內AI技術的不斷進步,AI基礎數據服務需求也將逐步向自然語言類需求滲透。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.1.5人工智能數據服務行業未來趨勢及機遇3.人機協作為行業發展趨勢正式采標階段采標員需要對圖像數據中的目標元素進行精準標注。通過AI技術,圖像數據可以進行自動的場景分割、物體識別和人臉識別,語音數據則可以借助語音識別和自然語言處理技術進行初步處理,完成自動標注后再由人工進行二次校對。數據質檢環節人工抽檢通常因準確率、成本控制和時效性存在不足。AI技術通過計算機視覺和語音識別,對采集到的數據進行初步識別,能夠在短時間內實現高達90%以上的校驗正確率。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施1.安裝Anaconda2.安裝PyCharm3.在PyCharm中配置Conda環境1.1.6環境安裝項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一安裝Anaconda(1)訪問Anaconda官方網站,定位至免費下載頁面。若頁面提示郵箱注冊,可選擇“SkipRegistration”快速跳過注冊流程。隨后,根據您的操作系統選擇合適的Anaconda版本安裝包進行下載。如果下載速度緩慢,推薦使用國內高速鏡像源,即清華大學開源軟件鏡像:/anaconda/archive/在此頁面選擇合適的版本,例如Anaconda3-2024.06-1-Windows-x86_64.exe。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一安裝Anaconda(2)
雙擊下載的Anaconda安裝包(例如Anaconda3-2024.06-1-Windows-x86_64.exe),運行安裝程序,在安裝向導首頁,點擊“Next”按鈕繼續安裝流程。(3)在彈出的LicenseAgreement對話框中,單擊“IAgree”以繼續安裝。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一安裝Anaconda(4)在彈出的SelectInstallationType對話框中,可默認選擇“JustMe”,單擊“Next”按鈕。(5)在彈出的ChooseinstallLocation對話框中,可默認選擇安裝路徑“DestinationFolder”(建議使用默認安裝路徑),確保安裝空間,單擊“Next”按鈕。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一安裝Anaconda(6)在彈出的AdvancedinstallationOptions對話框中,勾選第二個和第三個復選框,設置環境變量及默認的Python啟動程序,單擊“Install”按鈕,等待安裝成功。(7)在彈出的對話框中,等待安裝過程,安裝進度完成后單擊“Next”按鈕。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一安裝Anaconda(8)在彈出的完成設置對話窗口中,取消勾選第一個和第二個復選框,單擊“Finish”按鈕,結束安裝(9)安裝結束后,在開始菜單中,找到已經安裝好的Anaconda,會有如下幾個工具,說明安裝成功項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二安裝PyCharm(1)訪問JetBrains公司的官方網站,導航至PyCharm的下載頁面
/pycharm/download/,滾動頁面找到“PyCharmCommunityEdition”這一社區免費版本,隨后點擊“Download”按鈕進行下載。(2)下載完成后,安裝包如圖所示。(3)雙擊安裝程序,如果有驗證信息選擇“是”,彈出安裝向導,點擊“下一步(N)”。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二安裝PyCharm(4)選擇安裝位置。可選擇默認目錄;也可自選安裝目錄。點擊“下一步(N)”繼續。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二安裝PyCharm(5)配置安裝選項。勾選“創建桌面快捷方式”和“更新PATH變量”,點擊“下一步(N)”繼續。(6)在“選擇開始菜單目錄”直接點擊“安裝”按鈕。安裝完成,點擊“完成”按鈕,退出安裝向導。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟三在PyCharm中配置Conda環境(1)在“開始菜單”中查找并打開“AnacondaPrompt”終端。隨后,在終端界面中輸入指令“condacreate--nameDataSerpython=3.8”,使用conda創建一個名為“DataSer”的新環境。(2)進入安裝包確認流程,鍵盤上鍵入“y”并按回車鍵,表示同意并開始安裝環境。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟三在PyCharm中配置Conda環境(3)當終端顯示“done”時,表示環境已成功安裝,此時,系統會提示激活環境指令。(4)關閉當前終端,并重新打開一個新的終端。然后,輸入指令condaactivateDataSer來激活名為“DataSer”的環境。成功激活后,命令行首部將變為“(DataSer)”,這表示已成功進入“DataSer”環境。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟三在PyCharm中配置Conda環境(5)打開Pycharm進行環境配置。點擊“NewProject”以創建一個新項目。(6)進入項目創建及環境配置頁面,首先指定項目名稱(例如“test”)和項目位置(例如“D:\人工智能數據服務”)。然后,將編譯器類型設置為“Customenvironment”,并從“SelectExisting”中選擇“Conda”作為環境類型。在環境下拉列表中找到并選中之前創建的“DataSer”環境。最后,點擊“Create”按鈕以創建新項目項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟三在PyCharm中配置Conda環境(7)創建Python文件并運行測試代碼。將鼠標移動到項目名稱上,右鍵單擊,在出現的菜單中選擇“New”下的“PythonFile”選項。隨后,為新文件命名(例如“test”)。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟三在PyCharm中配置Conda環境(8)進入“test.py”文件后,輸入以下代碼:print("歡迎學習人工智能數據服務課程!")點擊“
”運行代碼(9)運行結果如下圖所示,表明環境配置成功且項目代碼已正確運行。項
目
導
入任
務
描
述任務小
結知
識
準
備本節主要介紹了人工智能數據服務的概念、廣泛應用場景及其發展歷程與未來趨勢。首先,深入闡述了人工智能數據服務的定義,即該服務為AI模型的開發、訓練、驗證和優化提供全方位的數據支持,覆蓋數據采集、標注、清洗到信息抽取等多個關鍵環節,是確保AI模型在各種任務中表現優異的基礎。通過學習其在自動駕駛、智能客服、醫療診斷等應用場景中的實踐案例,認識到數據服務在推動AI技術落地中的核心價值,為不同領域的AI應用提供了強大支持。其次,熟悉人工智能數據服務行業從萌芽、經歷資本熱潮,到技術落地、行業格局形成,再到持續發展與創新的發展歷程。最后,介紹本教材中主要用到的軟件安裝步驟,包括Anaconda和Pycharm的安裝,為后續的任務預備環境。任務實
施項目2
數據采集《人工智能數據服務》學習引導任務3數據存儲與加載1任務2端側數據采集1任務11網絡數據采集項目導入
隨著互聯網技術的飛速發展,我們生活在一個數據驅動的時代。數據采集作為信息處理的第一步,對于理解世界、指導決策具有至關重要的作用。設想一個城市交通管理中心,需要實時監控和分析交通流量,以優化交通信號燈的控制,減少擁堵,提高道路使用效率。通過在關鍵路口安裝傳感器和攝像頭,收集車輛流量、速度、事故等數據,管理中心能夠實時了解交通狀況,并做出相應的調整。項目導入數據采集不僅是一項技術活動,更是城市管理者服務社會、提高公共福祉的體現。然而,在智能交通系統的場景中,數據的準確性和公正性對于交通管理至關重要,這要求我們在數據采集和處理過程中保持誠信,對數據負責,確保信息的真實性和可靠性。項目導入通過本章節的學習,學生不僅能夠掌握數據采集的技術知識,更能夠在思想上得到提升,學會如何在數據采集的實踐中堅持社會主義核心價值觀,培養成為具有社會責任感和專業素養的新時代青年。通過實際應用場景的學習和討論,學生將更加深刻地理解數據采集在社會發展中的作用,以及作為數據采集者應承擔的社會責任。任務1網絡數據采集1任務描
述任務導入知
識
準
備任務小
結任務實
施在數字化浪潮中,網絡數據采集成為企業獲取關鍵信息、優化決策的重要工具。然而,網絡信息的復雜性和海量性使得數據采集工作變得異常艱巨。因此,實施高效、精準的網絡數據采集方案至關重要。通過采用先進的爬蟲技術,自動抓取多源數據,并經過清洗、整理和分析,為用戶提供結構化、可視化的數據支持。任務
導
入任
務
描
述知
識
準
備任務小
結任務實
施本任務將采用多種網絡爬蟲技術,爬取房屋租賃網站上4個頁面的房源信息數據,并將爬取到的數據保存到本地當中,其中房源信息包括房源封面照片、戶型、面積等任務導
入知
識
準
備任
務
描
述任務小
結任務實
施網絡爬蟲的基本原理:發送請求接收響應解析網頁存儲數據循環抓取與調度2.1.1網絡爬蟲的基本原理及基本庫的使用爬蟲類型具體內容通用網絡爬蟲該類爬蟲目標是整個互聯網,采用深度優先或廣度優先等策略遍歷網頁,構建搜索引擎的索引庫,如百度。聚焦網絡爬蟲專注于特定主題或領域的爬蟲,只爬取與主題相關的網頁,用于提高特定領域搜索的準確性和效率。增量式網絡爬蟲定期檢查并只爬取新產生或更新的網頁,減少重復工作量,節省資源,提供更實時的信息。深層網絡爬蟲模擬用戶填寫表單,獲取需要特定輸入才能訪問的網頁數據,用于深入分析和挖掘隱藏數據。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.基本庫的使用2.1.1網絡爬蟲的基本原理及基本庫的使用爬蟲庫或框架具體內容requests庫用于發送HTTP請求。requests庫提供了簡單易用的API,支持GET、POST、PUT、DELETE等多種請求方法,并且可以方便地設置請求頭、請求體等參數。BeautifulSoup庫用于解析HTML或XML文檔,提取出標簽、屬性、文本等信息。BeautifulSoup將復雜的HTML文檔轉換成一個嵌套的Python對象,使得信息提取變得簡單直觀。Scrapy框架一個高級的Python爬蟲框架,提供了完整的爬蟲開發流程,包括發送請求、解析網頁、存儲數據等。Scrapy還提供了豐富的擴展插件和中間件,支持異步IO、分布式爬取等功能。importrequestsurl=''#可修改為具體的網頁headers={'User-Agent':'My-Crawler'}#請求頭response=requests.get(url,headers=headers)ifresponse.status_code==200:print(response.text)簡單使用frombs4importBeautifulSouphtml_doc="""<html><head><title>TestPage</title></head><body><p>Thisisatestparagraph.</p></body></html>"""#網頁文本soup=BeautifulSoup(html_doc,'html.parser')#解析網頁title=soup.title.stringparagraph=soup.p.string項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施1.網頁的主要構成在數字化時代,網頁是信息傳遞與交互的重要載體。一個完整的網頁不僅僅是文字和圖片的堆砌,它由多個部分協同工作,共同構建出豐富、互動的用戶體驗。2.1.2網頁前端基礎構成具體內容內容網頁的核心,包括文字、圖片、視頻和音頻等,旨在傳遞有價值的信息和服務,決定網站的風格和定位結構網頁的框架,通過HTML標簽定義內容的排列和邏輯,如標題、段落等,影響用戶獲取信息的效率樣式網頁的視覺表現,利用CSS調整布局、顏色和字體,提升網頁的美觀度和吸引力行為網頁的交互性,通過JavaScript實現動態效果,如表單驗證和數據加載,增強用戶體驗元數據網頁的后臺信息,包括標題、描述和關鍵詞,對搜索引擎優化和網頁顯示至關重要項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施2.HTML語言基礎HTML,全稱超文本標記語言,是構建網頁的基石。HTML,作為構建網頁的基石,通過一系列標簽和元素定義網頁的結構和內容。2.1.2網頁前端基礎常用標簽如標題(h1-h6)、段落(p)、鏈接(a)、圖片(img)、列表(ul、ol、li)和表格(table、tr、td)等,用于構建網頁的不同部分。HTML標簽還支持屬性,如href、src、class和id,以提供額外信息或定義行為。此外,HTML語義化強調使用有明確含義的標簽,提升網頁可讀性、可訪問性和SEO優化。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施1.使用Requests發送HTTP請求requests庫是一個用于發送HTTP請求的Python庫,它簡化了HTTP請求的發送過程。2.1.3構建爬蟲requests.get(url,params=None,**kwargs):發送GET請求。url是請求的URL,params是一個字典,包含要添加到URL中的查詢參數。requests.post(url,data=None,json=None,**kwargs):發送POST請求。data是一個字典或字節串,包含要發送的表單數據;json是一個字典,將被序列化為JSON格式后發送。response.status_code:響應的狀態碼,如200表示成功,404表示未找到頁面。response.text:響應的文本內容,以字符串形式返回。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施2.使用BeautifulSoup解析HTMLBeautifulSoup是一個Python庫,用于解析HTML和XML文檔,創建解析樹,并提供方便的方法來遍歷和搜索這些樹。2.1.3構建爬蟲BeautifulSoup庫中的select函數是使用CSS選擇器從HTML文檔中選擇元素的主要方法。其基本語法是:result_set=soup.select(selector),其中soup是BeautifulSoup對象,selector是一個字符串,表示要選擇的元素的CSS選擇器。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施3.使用使用正則表達式提取信息正則表達式是一種強大的文本處理工具,通過定義模式來匹配、查找和替換文本中的特定內容。2.1.3構建爬蟲re.match(pattern,string,flags=0):從字符串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回None。re.search(pattern,string,flags=0):掃描整個字符串并返回第一個成功的匹配。re.findall(pattern,string,flags=0):在字符串中找到正則表達式所匹配的所有子串,并返回一個包含這些子串的列表。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施3.使用Lxml和XPath提取信息Lxml是一個用于處理XML和HTML文檔的Python庫,它結合了libxml2和libxslt的功能,為開發者提供了強大的解析和搜索能力。2.1.3構建爬蟲XPath使用路徑表達式來選取XML文檔中的節點或節點集。這些路徑表達式和我們在常規的計算機文件系統中看到的表達式非常相似。XPath通過元素名或屬性名來選擇節點,如div表示選擇所有<div>元素。同時,還可以使用/來選擇子節點,如div/p表示選擇所有<div>元素下的<p>子元素;使用//來選擇后代節點,不論層級,如//a表示選擇文檔中的所有<a>元素;使用@來選擇屬性,如a/@href表示選擇所有<a>元素的href屬性。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施1.爬蟲協議爬蟲協議,也稱為robots.txt協議,是網站通過robots.txt文件向爬蟲程序(如搜索引擎爬蟲)發出的訪問規則。這個文件告訴爬蟲哪些頁面可以訪問,哪些頁面不能訪問。2.1.4爬蟲的協議與道德、法律robots.txt文件的位置:通常位于網站的根目錄下,例如/robots.txt。robots.txt的內容:該文件使用簡單的文本格式,通過User-agent和Disallow指令來定義規則。User-agent指定了規則適用的爬蟲程序,Disallow則指定了禁止訪問的路徑。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施2.爬蟲道德爬蟲道德主要涉及對目標網站的尊重和保護,以及合理使用爬取的數據。2.1.4爬蟲的協議與道德、法律尊重網站權益:爬蟲應遵守網站的robots.txt協議,不爬取禁止訪問的頁面。同時,避免對網站造成過大的訪問壓力,影響網站的正常運行。保護用戶隱私:在爬取過程中,避免收集用戶的個人信息或敏感數據,尊重用戶的隱私權。合理使用數據:爬取的數據應僅用于合法、合規的目的,不得用于侵犯他人權益或進行非法活動。同時,對于爬取的數據,應注明來源,尊重原作者的版權。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施3.爬蟲法律爬蟲活動涉及的法律問題主要包括版權法、反不正當競爭法、計算機信息網絡國際聯網管理暫行規定等。2.1.4爬蟲的協議與道德、法律未經原作者授權,擅自使用或傳播這些數據可能構成侵權行為。利用爬蟲進行惡意競爭,如爬取競爭對手的數據用于不正當競爭行為,可能違反反不正當競爭法。爬蟲活動應遵守國家關于計算機信息網絡管理的相關規定,不得進行非法入侵、破壞網絡安全等行為。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備網絡數據采集的任務工單如下表:班級:組別:姓名:掌握程度:任務名稱租賃網站住房信息爬取任務目標將網絡上的住房信息爬取下來,并打印出來爬取數據住房封面圖片、住房價格、面積等工具清單Python、requests、BeautifulSoup、Lxml操作步驟1.
網絡數據采集環境搭建:利用Anconda3配置python的版本、安裝相關的數據爬取模塊。2.
構建住房信息爬蟲:利用配置好的數據采集環境,構建網絡爬蟲代碼。3.
將爬取到的住房信息數據打印或顯示出來考核標準1.實現與性能:
[協議支持,網頁抓取能力]2.穩定性和可靠性:
[長時間穩定運行]3.數據質量:[數據準確性,數據完整性,數據一致性]4.合規性與道德標準:[遵守robots.txt協議,保護用戶隱私,尊重版權]項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一網絡數據采集環境搭建pipinstallrequests-i/simplepipinstallbs4-i/simple項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一網絡數據采集環境搭建pipinstalllxml-i/simple項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建初始化虛擬環境切換后的虛擬環境
1.
打開Pycharm,切換虛擬環境打開Pycharm之后需要確認當前python解析器是否是上面創建的虛擬環境Web_crawler中的解析器,如果不是則需要進行切換項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建
2.爬蟲代碼構建利用requests和BeautifulSoup
編寫爬蟲代碼defget_links(url):#接收參數:每個房源列表頁的urli=0wb_data=requests.get(url,headers=headers)soup=BeautifulSoup(wb_data.text,'lxml')links=soup.select('div.list-main-header.clearfix>a')#獲取每個房源詳情頁的a標記,得到a標記列表,可以找到詳情頁的urlforlinkinlinks:href=link.get('href')#tag的get函數,獲取a標記href的屬性值,即可獲取詳情頁urlhref=''+hreftime.sleep(2)get_info(href)#調用get_info函數,參數為詳情頁url項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建
2.爬蟲代碼構建利用requests和BeautifulSoup
編寫爬蟲代碼具體流程如下:1)
導入需要的模塊:requests、BeautifulSoup和time。2)
設置請求頭信息,模擬瀏覽器進行網頁訪問。3)
定義了一個函數get_links(url)用于獲取每個房源列表頁的詳細鏈接地址,然后調用get_info(url)函數,獲取每個房源的詳細信息。4)
定義了一個函數get_info(url)用于獲取房源的詳細信息,包括房源名稱、戶型、價格、面積、經紀人電話和封面圖片。同時將封面圖片保存到本地。在__main__部分,構造了要爬取的房源列表頁的url,并依次調用get_links(url)函數來獲取房源詳細信息。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建
2.爬蟲代碼構建利用requests和正則表達式編寫爬蟲代碼#定義函數,用于獲取房源列表頁的詳細鏈接地址defget_link(url):linklist=[]##存儲房源鏈接地址列表
res=requests.get(url,headers=headers)##發送網絡請求獲取頁面內容
#print(res)ptn='<aclass=""href="(.*?)"'#匹配房源鏈接地址的正則表達式
links=re.findall(ptn,res.text,re.S)#使用正則表達式提取房源鏈接地址
print(links)forlinkinlinks:if(link!='<%=url%>'):linklist.append(link)#將有效鏈接地址添加到列表中
forlinkinlinklist:get_info(link)項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建
2.爬蟲代碼構建利用requests和正則表達式編寫爬蟲代碼下面是代碼的流程步驟描述:1)
導入需要使用的模塊:re(正則表達式模塊)、requests(網絡請求模塊)和time(時間模塊)。2)
設置請求頭信息headers,模擬瀏覽器訪問。3)
定義函數get_link(url),用于獲取房源列表頁的詳細鏈接地址:4)
定義函數get_info(url),用于獲取房源的詳細信息:5)
在主程序中,構造要爬取的多個頁面的URL列表。遍歷URL列表,依次調用get_link(url)函數,并在每次請求后暫停5秒(time.sleep(5))以避免請求過于頻繁被網站封鎖。項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建
2.爬蟲代碼構建利用requests和Lxml編寫爬蟲代碼'''獲取詳情頁超鏈接的地址'''defget_links(url):#接收參數:每個房源列表頁的urli=0wb_data=requests.get(url,headers=headers)selector=etree.HTML(wb_data.text)links=selector.xpath('//*[@id="cycleListings"]/ul/li/div[2]/div[1]/a')#獲取每個房源詳情頁的a標記,得到a標記列表,可以找到詳情頁的url//*[@id="cycleListings"]/ul/li[2]/div[2]/div[1]/aforlinkinlinks:href=link.get('href')#tag的get函數,獲取a標記href的屬性值,即可獲取詳情頁urlhref=''+hreftime.sleep(2)get_info(href)#調用get_info函數,參數為詳情頁url項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二網絡爬蟲構建
2.爬蟲代碼構建利用requests和Lxml編寫爬蟲代碼項
目
導
入任
務
描
述任務小
結知
識
準
備本任務深入講解了網絡爬蟲構建,涵蓋原理、流程(請求-響應-解析-存儲)及Python實現(requests,BeautifulSoup等)。通過實例,實踐了數據爬取與解析,并強調了道德與法律遵守。最后,以廣州Q房網二手房信息爬取為例,綜合展示了從環境配置到代碼編寫的全過程,既提供技術實操,也強調合法合規采集數據的重要性。任務實
施任務2端側數據采集2任務描
述任務導入知
識
準
備任務小
結任務實
施攝像頭數據采集作為端側數據采集的一個重要應用,不僅實現了對城市、校園及自然環境的實時視頻監視,還持續積累了寶貴的圖像數據資源。這些數據不僅是技術處理的基礎,更是洞察社會現象、推動社會進步的寶貴財富。在數據采集的過程中,學生不僅能學習到相關技術知識,還能增強社會責任感,思考如何利用科技服務于社會,從數據中發現并解決問題,共同推動社會向前發展。任務
導
入任
務
描
述知
識
準
備任務小
結任務實
施本任務旨在實現對指定區域的實時視頻監控和數據采集,通過攝像頭設備采集目標區域的視頻數據。同時,將采集到的視頻數據進行分幀處理,并將分幀的結果保存到以視頻名命名的文件夾當中。任務導
入知
識
準
備任
務
描
述任務小
結任務實
施OpenCV庫的基本概念和功能OpenCV庫的基本概念OpenCV庫的功能2.2.1了解OpenCV庫OpenCV是一個跨語言的開源計算機視覺和機器學習庫,提供超過2500個優化算法,支持圖像處理和多種計算機視覺功能,并隨著版本更新不斷引入新技術和優化,擁有龐大的開發者社區支持。OpenCV的版本更新帶來重大架構改進、新特性增加及問題修復,同時引入更高效的算法和機器學習技術,通過硬件加速和代碼優化提升性能,滿足復雜任務需求。①核心模塊②圖像處理模塊③特征檢測與描述模塊④目標檢測與跟蹤模塊⑤3D重建模塊⑥機器學習模塊任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.OpenCV-Python的安裝和基本調用方法2.1.1網絡爬蟲的基本原理及基本庫的使用特
點詳
解易用性Python的語法簡潔明了,易于上手,使得OpenCV的功能能夠更快速地被開發者所掌握和使用豐富的接口OpenCV-Python提供了大量的API接口,涵蓋了圖像處理、特征提取、目標檢測、機器學習等多個方面,滿足了開發者在計算機視覺領域的各種需求跨平臺性OpenCV-Python可以在多種操作系統上運行,包括Windows、Linux和macOS等,使得開發者可以在不同的環境下進行開發和部署主
要
功
能詳
解圖像處理包括圖像讀取、保存、轉換、濾波、直方圖均衡化等基本操作,幫助開發者對圖像進行預處理和增強特征提取與匹配支持多種特征提取算法,如SIFT、SURF、ORB等,以及特征匹配技術,用于圖像識別、目標跟蹤等任務目標檢測與識別通過級聯分類器、HOG+SVM、深度學習等方法實現人臉、物體等目標的檢測與識別視頻處理與分析支持視頻文件的讀取、播放、錄制,以及實時視頻流的處理,用于視頻監控、運動分析等領域機器學習集成了多種機器學習算法,如KNN、SVM、決策樹等,使得開發者能夠利用機器學習技術對圖像數據進行分類、聚類等操作應
用
場
景詳
解自動駕駛通過圖像處理技術識別道路標志、行人、車輛等目標,實現自動駕駛的導航與決策人臉識別與身份驗證利用特征提取與匹配技術實現人臉的識別與身份驗證,應用于安防、門禁等領域醫學影像分析對醫學影像進行預處理、分割、特征提取等操作,輔助醫生進行疾病診斷智能安防通過視頻處理與分析技術實現異常事件的檢測與報警,提高安防系統的智能化水平機器人視覺為機器人提供視覺感知能力,實現目標跟蹤、導航、避障等功能pipinstallopencv-python任務導
入知
識
準
備任
務
描
述任務小
結任務實
施2.OpenCV-Python的安裝和基本調用方法2.1.1網絡爬蟲的基本原理及基本庫的使用importcv2
#讀取圖片
img=cv2.imread('example.jpg')
#顯示圖片
cv2.imshow('image',img)
#等待按鍵按下,然后關閉窗口
cv2.waitKey(0)
cv2.destroyAllWindows()項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施1.OpenCV中與攝像頭相關的函數和類cv2.VideoCapture類:用于捕獲視頻流,從攝像頭或視頻文件中讀取幀。2.2.2攝像頭操作(1)cv2.VideoCapture(index,apiPreference=0):創建一個VideoCapture對象,用于捕獲視頻流。index是攝像頭的ID,通常為0(表示第一個攝像頭);apiPreference是一個可選參數,用于指定使用哪種后端API。(2)cap.read():從VideoCapture對象中讀取一幀。返回兩個值:一個布爾值(True/False,表示是否成功讀取幀)和一個數組(表示幀的圖像)。(3)cap.isOpened():檢查VideoCapture對象是否成功打開。(4)cap.release():釋放VideoCapture對象,關閉攝像頭或視頻文件。(5)cap.set(propId,value):設置攝像頭屬性。propId是屬性標識符(如cv2.CAP_PROP_FRAME_WIDTH表示幀寬度),value是要設置的值。(6)cap.get(propId):獲取攝像頭屬性。propId是屬性標識符,函數返回屬性的當前值。同時,OpenCV提供了cv2.CAP_PROP_*系列的常量,用于指定要獲取的攝像頭屬性。frame_width=cap.get(cv2.CAP_PROP_FRAME_WIDTH)項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施2.攝像頭的初始化和操作2.2.2攝像頭操作importcv2#初始化攝像頭cap=cv2.VideoCapture(0)#檢查是否成功打開攝像頭ifnotcap.isOpened():print("無法打開攝像頭")exit()#獲取攝像頭屬性frame_width=int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))frame_height=int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))fps=cap.get(cv2.CAP_PROP_FPS)print(f"攝像頭屬性:寬度={frame_width},高度={frame_height},FPS={fps}")#釋放攝像頭資源cap.release()首先初始化攝像頭并檢查是否成功打開;然后,使用cap.get()函數獲取攝像頭的屬性,并打印出來;最后,釋放攝像頭資源。在實際應用中,可能還需要處理其他情況,如攝像頭未連接或無法訪問的情況,以及可能出現的異常。項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施2.2.3圖像采集與顯示#創建一個VideoCapture對象,參數0表示默認攝像頭
cap=cv2.VideoCapture(0)
#檢查攝像頭是否成功打開
ifnotcap.isOpened():
print("Error:Couldnotopenvideodevice.")
exit()whileTrue:
#讀取一幀圖像
ret,frame=cap.read()
#檢查是否成功讀取幀
ifnotret:
print("Error:Couldnotreceiveframefromvideodevice.")
break
使用默認的攝像頭對象循環中不斷地從攝像頭中捕獲幀項
目
導
入知
識
準
備任
務
描
述任務小
結任務實
施2.2.3圖像采集與顯示frame_count=0whileTrue:#...(讀取幀的代碼)#保存每一幀為JPEG格式的本地文件cv2.imwrite(f"frame_{frame_count}.jpg",frame)frame_count+=1whileTrue:#...(讀取幀的代碼)#顯示幀cv2.imshow('CameraFeed',frame)#等待按鍵輸入,如果按下'q'鍵,則退出循環ifcv2.waitKey(1)&0xFF==ord('q'):break將捕獲的幀保存為本地文件使用OpenCV的imshow()函數來顯示采集到的視頻幀項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備端側數據采集的任務工單如下表:班級:組別:姓名:掌握程度:任務名稱基于攝像頭的端側數據采集任務目標利用USB攝像頭結合Python-OpenCV采集端側的視頻數據,并將視頻數據分幀處理,保存到與視頻同名的文件夾中采集數據視頻數據工具清單Python、USB攝像頭、OpenCV操作步驟1.配置視頻數據采集虛擬環境,安裝相關的Python模塊2.基于配置好的虛擬環境,結合USB攝像頭采集視頻數據。3.將采集到的視頻進行視頻分幀,存儲到對應的文件夾中考核標準1.實現與性能:[能否正常讀取攝像頭數據]2.穩定性和可靠性:[長時間穩定運行,異常處理能力]3.數據質量:[采集的視頻幀的清晰程度、分辨率的大小]項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟一端側數據采集環境搭建(1)參照任務2.1任務實施的步驟一,創建一個Python版本為3.8的虛擬環境。(2)配置端側數據采集所需模塊。激活虛擬環境:condaactivateclient_side,如圖2-2-2所示,圖中最左邊的狀態由(base)轉變為(client_side)。安裝調用攝像頭捕獲數據OpenCV模塊項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟二數據采集環境和攝像頭功能測試測試代碼importcv2cap=cv2.VideoCapture(0)while(cap.isOpened()):#判斷是否打開攝像頭
ret,img=cap.read()#獲取數據
ifret:
cv2.imshow('test',img)#顯示視頻幀
ifcv2.waitKey(25)&0xFF==ord('q'):#判斷是否停止
break
else:
breakcap.release()#釋放攝像頭cv2.destroyAllWindows()#關閉窗口項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟三采集視頻數據#創建VideoWriter對象,用于保存視頻output_file='output.mp4'out=cv2.VideoWriter(output_file,video_codec,frame_rate,(capture_width,capture_height))#將視頻設置參數存儲到JSON文件中video_settings={'capture_width':capture_width,'capture_height':capture_height,'frame_rate':frame_rate,'video_codec':'mp4v'}withopen('video_settings.json','w')assettings_file:json.dump(video_settings,settings_file)首先設置了視頻捕獲的分辨率和幀率,然后使用OpenCV的VideoCapture類來從默認攝像頭捕獲視頻。捕獲的每一幀都被寫入一個通過VideoWriter類創建的視頻文件中,同時,將視頻的設置參數保存到一個JSON文件中,以便后續使用項
目
導
入任
務
描
述任務小
結任務實
施知
識
準
備步驟四視頻分幀ifnotos.path.exists(output_dir):
os.makedirs(output_dir)
#初始化幀計數器
fra
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年部編版語文五年級下冊期末模擬題(含答案)
- 茶樓裝修工程進度管理與驗收合同
- 教育機構整棟租賃及設施共建合作協議
- 餐飲連鎖品牌區域代理權及店鋪轉讓合同
- 住宅小區車位產權轉移及管理服務合同
- 浙江省2024-2025學年高一語文上學期期中試題含答案
- 2025年公共文化服務與發展專業職稱評審考試試題及答案
- 生日派對活動策劃
- 高新技術產業園區廠房股權收購與人才引進合同
- 高管財務信息保護與競業禁止合同
- 2025年高中化學學業水平合格性考試模擬試卷試題(含答案)
- 第23課《“蛟龍”探海》課件-2024-2025學年統編版語文七年級下冊第六單元
- 2025年監理工程師考試《建設工程監理基本理論與相關法規》真題及答案
- 四川省綿陽市2023-2024學年八年級下學期6月期末數學試卷(含詳解)
- 2025-2030中國哈喹諾行業市場現狀供需分析及投資評估規劃分析研究報告
- 小學道德與法制教學中“責任擔當”核心素養的培養
- 建設工程監理研究預測報告-中國建設工程監理行業現狀與發展前景預測報告
- 東莞2025年東莞日報社公開招聘7人筆試歷年參考題庫附帶答案詳解
- 2025年山東省濰坊安丘市中考一模數學試題(含部分答案)
- 機械專業面試真題及答案
- TCPQSXF006-2023消防水帶產品維護更換及售后服務
評論
0/150
提交評論