譚光明:人工智能的發展現狀及其在環保中的應用_第1頁
譚光明:人工智能的發展現狀及其在環保中的應用_第2頁
譚光明:人工智能的發展現狀及其在環保中的應用_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、譚光明:人工智能的開展現狀及其在環保中的應用12月 9-10日,由全國工商聯環境商會主辦,以“學習 貫徹十九大精神:鍛造產業利劍 護衛美麗中國為主題的 “2022 中國環保上市公司峰會 在廣東肇慶召開。 中科院高 性能電腦研究中心主任、博導譚光明在峰會上表示,人工智 能成為經濟開展的新引擎,還給社會建設帶來新機遇。在技 術層面也是國際社會各個國家科研機構競爭的高端技術。中 科院高性能電腦研究中心主任、博導 譚光明 以下是演講實錄:最近在環保應用領域做了一點事情,霧霾 檢測方向做了一些應用,一些算法研究,跟大家分享一下, 后續還有很多事情需要往前推進。人工智能已經成為國家發 展戰略的一局部,美國

2、、歐洲、日本等也開展迅速。這些數 據能夠說明問題,像各領域人工智能公司的創立,如雨后春 筍般出現。人工智能成為經濟開展的新引擎,還有給社會建 設帶來新機遇。在技術層面也是國際社會各個國家科研機構 競爭的高端技術。 人工智能技術可以分類, 引用 UCLA 朱松 純的分類,歸納為六個:機器學習各種統計的建模、分 析工具和計算的方法電腦視覺暫且把模式識別,圖像 處理等問題歸入其中認知與推理包含各種物理和社會 常識機器人學機械、控制、設計、運動規劃、任務規 劃等,像近期波士頓動力公司做了機器人后空翻的演示。博弈與倫理多代理人 agents的交互、對抗與合作,機器 人與社會融合等議題。自然語言處理暫且把

3、語音識別、 合成歸入其中,包括對話 。把近幾年的大事件,包括自動 駕駛,把這些做一些分類,跟人工智能的深度學習技術,包 括知識圖譜、深度學習、增強學習,這些在行業應用中跟行 業技術配合使用。今天提到人工智能就是深度學習,其實這 只是人工智能大領域里面很小的一塊,事實上還有早期機器 學習相關算法的研究,開展到今天,深度學習的技術已經把 很多技術做了替代,變得更加前沿的一個方法。人工智能的 三次浪潮與深度學習算法有比擬好的契合。1958、 1982、 1986年分別是人工智能興起的時候。李國杰院士說過: “人工智 能已經炒過幾回了,經歷了幾個夏天和冬天,忽冷忽熱;現 在終于到了秋天了,是收獲的季節

4、了。 這次人工智能浪潮 的興起,毫無疑問得益于深度學習技術的開展和興起。深度 學習技術開展歷程坎坷。 20 年前, Hinton 提出了 Neural Network ,沒有得到熱門開展。 NN 逐漸冷落, SVM 和 Boosting 等不斷興起Hinton于2006年在?科學?上發表文章, 首次提出 DL 。熱點的興起也離不開背后技術的開展。一方 面得益于計算技術的開展和推動,還有就是大數據的開展, 兩者結合使 DL 深度學習方法能夠發揮更有效的作用。深度 學習的根本思想就是構建具有很多隱層的機器學習模型和 海量的訓練數據,來學習更有用的特征,從而最終提升分類 或預測的準確性。深度學習模型

5、,層次很多,通常有 5 層、 6 層,甚至 10 多層,上百層神經網絡,對于技術能力的需求 越來越大。在高度開展空間,深度學習類型有很多。針對不 同領域,圖像、文本、語音識別等等,在實際應用中常常都 混合著使用, 出現很多靈活的組合方式。 根據實際實用問題, 選擇適宜的網絡。 像很多寬帶一樣, google tensorflow ,Caffe 以及 MX.NET 等深度學習的框架。 很多大公司或創業公司都 基于這些框架開發自己的產品,做自己的研究。這些框架有 不同的優點和缺點。這些缺點和深度學習的模型是一樣的, 根據實際問題選擇更適宜的框架和模型。做個簡單總結, Caffe 是最早的深度學習框

6、架, 科研應用的綜合性能好, 但主 要局限于 CNN 。 MX Net 更加注重高效,文檔詳細,上手很 容易,運用也靈活。 Google 強力推出的 Tensor Flow ,很多 人跟隨這個框架使用,功能很齊全,能夠搭建的網絡種類更 豐富,但綜合性能比別的開源框架要差一些。但在某些階段 也不太注重性能。一個有效的解決途徑是針對具體應用設計 混合型學習框架。但是目前存在很多的問題,可以通過三個 方面來闡述。第一,產業鏈。產業鏈不完整,缺少從國產芯 片、平臺、應用軟件的完整產業鏈。 生態圈不豐富: 缺乏 CNN 、 RNN 等多種深度學習算法訓練庫。 第二, 平臺。缺少對國內 處理器、 DCU

7、及其他國產加速器的開源效勞平臺。 像跟曙光 合作的 DCU 、寒武紀, 都沒有一整套開源作為支撐。 缺乏覆 蓋科學研究、經濟民生等大規模深度學習訓練的數據資源。 現在很多信息不共享,比方醫院、政府資源,數據看不到, 平臺做的再好也沒有意義。第三,應用。頂級計算、國產處 理器與深度學習應用結合缺乏。深度學習應用開發和使用門 檻高、代價大、效率低、周期長。針對這些問題,希望能夠 結合以前在 HTC 做了一些技術,構建 AI 創新計算平臺,從 云計算、大數據、高性能計算這三個層面創造高效、靈活部 署的平臺,幫助用戶快速使用 AI 的平臺。我們希望構建一 個面向人工智能應用的開源平臺。 這個平臺是從頂

8、層到上 層,就是 SAAS 、 PAAS、 IAAS ,一直做到頂層應用產品。 高性能所更多是做底層根底平臺建設,最底層的 IAAS ,構 建一個統一的開發環境,幫助存儲分布式海量數據,以及跟 上層資源的調度、算法的聯系,還有一些訓練效勞的標注工 具,再上向,就是面向在線效勞的軟件開發效勞和標準接口, 再往上就是面向國內行業用戶,構建不同行業的應用場景, 包括圖像識別、視頻處理、語音識別等等。在每個層面都有 重點,底層的中科曙光 GPU ,中科院的寒武紀芯片,申威處 理器。在國產平臺上,構建整套人工智能軟件的生態環境, 推動平臺建設。有分析工具,模型、算法、調度、效勞框架, 未來陸續將開源平臺

9、在社區開放。 這是 GPU ,中科曙光首個 DCU 處理器面向高性能計算的總體架構, 我本人是在核心算 法庫、軟件站,以及框架運用開發層面,圍繞底層平臺構建 開發環境。有一個初步的工作成果,在網上作了開源,有興 趣的人可以看一下。我們借助這樣的工作根底,在全國布置 了 40 多個城市云、 10 多個先進計算中心,提供全國最大深 度學習GPU集群,有一萬以上的GPU。還有與應用方一起, 構建了全球最大視頻深度學習的在線系統,科學院有裝置, 提供深度學習、人工智能以及大數據支撐效勞。最后,簡單 介紹一下氣象環保大數據分析的工作。如果做氣象預報,如 何將各種來源數據做整合和訓練,預報氣象,包括預警和

10、分 析。最近做了霧霾相關的預測研究,針對空氣質量預測,現 在也有一些方法, 是基于一些模擬軟件, 計算指標值, 變量, 如 PM2.5、PM10、SO2、CO、O3 等,通過四個空氣污染模 式NAQP、CAMX、CMAQ、WRFC,再做擬合。但仍然 存在一些問題,比方與觀測值差異還較大。在現有模式結果 的根底上,如何利用統計、機器學習等方法,提升預報的準 確率。 OCF 算法基于兩個假設,得到兩條線,說明假設與實 際不符,我們要做的工作就是把這兩條線的預測能夠更準 確,最后能夠重合。目前還沒有應用更加復雜的方法,還是 結合 OCF 最優化算法, 包括算法模塊的替換, 預測效果還是 不錯的。這里有四個圖,在 90天的時間維度下和 120

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論