




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第17章其他另類數據的處理學習目標理解圖像數據在金融市場的應用了解如何使用神經網絡對圖片進行分析了解音頻信息在金融市場中的作用了解如何使用程序進行簡單的圖片數據分析處理另類數據的意義私有信息對獲得超額收益非常重要,但是往往存在合法合規問題公開信息往往已經被反映在資產價格中對已有的數據進行更精細的處理,以獲得其他投資者難以獲得的信息處理另類數據的意義雖然文本在金融市場中起了非常重要的作用,但是許多公司以及媒體都大量使用文字以外的方式來傳播有效的信息衛星圖像以及無人機影像都可以給我們提供重要的經濟表現的信息公司管理層接受采訪都會留下視頻以及聲音信息可以供我們進行分析有必要使用機器學習方法處理圖像、聲音等另類數據圖像數據及處理圖像可以傳遞多種信息例:庫存清點倉庫的圖像可以讓我們快速驗證庫存數據的準確性首先需要在照片中識別庫存物品的種類可以對每一個庫存商品進行拍照,并用機器學習的方法對庫存的品類進行識別。使用卷積神經網絡處理圖片使用機器學習方法識別圖片生成一個5×5的矩陣,矩陣中0代表白色而1代表黑色。我們可以用左圖所示的矩陣來代表字母??,而右圖則可以代表字母??。卷積神經網絡(CNN)最簡單的卷積神經網絡有三個主要的結構:卷積層、池化層、全連接層使用卷積神經網絡處理圖片卷積層有一個或多個卷積核(Kernel),每一個卷積核都是為了檢測圖中的一些特征卷積核實際上是一個小矩陣,這個矩陣中的的參數先由隨機生成,并通過訓練不斷更新這個矩陣中的參數卷積神經網絡(CNN)最簡單的卷積神經網絡有三個主要的結構:卷積層、池化層、全連接層使用卷積神經網絡處理圖片卷積層運算步驟將這個卷積核覆蓋的區域與卷積核進行點相乘將這個2×2的卷積核矩陣不斷的在輸入矩陣上移動,從左上角開始慢慢向右下方移動,每次覆蓋的區域都進行上述點相乘,然后再加上一個誤差項完成這一步驟后,我們會得到一個新的4×4的矩陣,即特征圖可以使用ReLU函數對特征圖進行進一步處理使用卷積神經網絡處理圖片每一個卷積核都是為了檢測圖中的一些特征比如說代表??的矩陣在2×2的空間中會展現出大量對角線的圖樣,而代表??的矩陣則會有更多垂直即平行的圖樣值得注意的是,卷積核以及池化窗口往往采用的長與寬都是奇數,此處為了解釋方便,使用了更小的2×2的窗口使用卷積神經網絡處理圖片用池化層(PoolingLayer)來處理特征圖中的數據定義一個小的范圍(例如2×2),稱為池化窗口,并將這個池化窗口放置于特征圖上,對這個窗口中的數據進行池化如圖17.4,我們在特征圖中生成了四個池化窗口,每個池化窗口覆蓋了1/4的特征圖。池化的過程主要是為了達到減少處理的運算量的效果使用卷積神經網絡處理圖片池化的方法有兩種:最大池化:即取這個2×2區域中的最大值平均池化:即取池化窗口的所有元素的平均值與卷積層不同,池化窗口不應該有任何重疊此處采用最大池化操作,得到一個2×2的矩陣,如圖17.5所示使用卷積神經網絡處理圖片將池化后的數據輸入一個全連接層全連接層可以是一個前饋神經網絡這個前饋神經網絡會輸出分類概率的預測將池化層輸出的這個4個元素作為全連接層神經網絡的特征,并要求該神經網絡輸出對于圖像分類的預測。CNN訓練方法:與前饋神經網絡相同,參數的訓練是用反向傳播來進行的將圖片轉化成矩陣,并將圖片分類作為標簽來訓練我們的模型。使用卷積神經網絡處理圖片色彩、復雜的物體、復雜的場景需要復雜的模型處理復雜的模型——AlexNetAlexNet是一個經典的基于卷積神經網絡的圖片識別模型,由Hinton教授和兩名博士生于2012年提出右側為AlexNet結構介紹使用卷積神經網絡處理圖片例:庫存清點需要取得每一件庫存的的圖片,并用圖片識別程序進行識別該做法的問題是需要拍攝大量的庫存照片,費時費力有沒有辦法對每個貨架進行拍攝,并讓程序對里面的所有物品進行識別呢?多物體識別R-CNN:進行多物品識別時,先找到圖片中的不同物體,并用一個矩形邊框來選擇物體。在第二步,我們使用算法來識別物體。YOLO模型:進行多物品識別時,將上述兩步合二為一,執行效率更高聲音信息及處理語音信息轉化為文字信息+文本分析/大語言模型文本轉錄,如OpenAI的Whisper模型希望從語音中的非語言信息得到一些情緒方面的信息對聲音情緒進行分析的算法,如LVA模型LSTM與CNN基于Transformer的模型知識拓展:用圖片來預測股市回報技術分析:從業人員試圖通過股市回報的圖表來對回報進行預測Lo,Mamaysky和Wang(2000)通過對股票圖形的研究發現確實有幾種可以獲得額外收益的技術分析方法Jegadeesh與Titman的動量信號,Han,Zhou,Zhu(2016)年的論文發現了趨勢信號可以預測回報參考文獻AndrewWLo,HarryMamaysky,andJiangWang.Foundationsoftechnicalanalysis:Computationalalgorithms,statisticalinference,andempiricalimplementation.TheJournalofFinance,55(4):1705–1765,2000.NarasimhanJegadeeshandSheridanTitman.Returnstobuyingwinnersandsellinglosers:Implicationsforstockmarketefficiency.TheJournalofFinance,48(1):65–91,1993.YufengHan,GuofuZhou,andYingziZhu.Atrendfactor:Anyeconomicgainsfromusinginformationoverinvestmenthorizons?JournalofFinancialEconomics,122(2):352–375,2016.知識拓展:用圖片來預測股市回報Jiangetal.(2023)直接使用股票圖表對未來股票回報進行預測使用卷積神經網絡對股票走勢圖片分析,通過圖片中發現的模式與未來股價漲跌之間的關系來訓練神經網絡發現該神經網絡能發現許多使用股價數據本身無法發現的預測未來回報的信號,并有助于獲得超額收益JingwenJiang,BryanKelly,andDachengXiu.(re-)imag(in)ingpricetrends.TheJournalofFinance,78(6):3193–3249,2023知識拓展:用圖片來預測股市回報程序:圖像識別導入庫程序:圖像識別創建字典,為字典添加類別和對應的名稱,這里的類別是數字編碼,名稱是對應的物體類別程序:圖像識別加載預訓練的FasterR-CNN模型(ResNet50),設置模型為評估模式,即不進行學習操作,僅進行預測操作定義圖像預處理的操作,將圖像轉換為張量形式程序:圖像識別使用PIL庫打開一張圖片,并轉換為PyTorch張量形式,保存在變量img中為圖像添加一個維度,使其符合模型輸入的形式(模型需要的是batch形式的輸入)設置模型執行模式為推理模式,即不進行反向傳播學習操作程序:圖像識別定義函數show_detections顯示輸入圖像及其預測的檢測結果創建一個新的圖形和軸顯示輸入的圖像遍歷預測結果的邊界框、分數和標簽將每個檢測到的元素邊界框繪制在圖像上在每個邊界框上方,將標簽和分數文本繪制在圖像上使用plt.show()顯示圖像程序:圖像識別打開名為“shelf1.jpg”的圖像文件,并將其作為輸入圖像傳遞給show_detections函數習題請思考哪些語音以及圖片數據有助于幫助投資者預測公司盈利請回答我們的程序需要從這些圖片或語音中提煉到哪些信息請在附近的電器超市中照一張照片,并用本章中的程序分析照
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Photoshop人像處理實戰試題及答案
- 漢語社交用語與文化背景的結合試題及答案
- 文學與哲學思想的碰撞2025年試題及答案
- 計算機Msoffice學習技巧試題及答案概述
- 文學圖景中的人物關系試題及答案
- 現代漢語語言風格體現試題及答案
- 把握2025年法學概論考試重點試題及答案
- 2025年邏輯考試的核心知識回顧試題及答案
- 2025年計算機一級Msoffice答題策略試題及答案
- 深入解析2025年軟件設計師考試試題及答案
- GB/T 18238.1-2024網絡安全技術雜湊函數第1部分:總則
- 11.4 歌曲 《木瓜恰恰恰》課件(16張)
- 古埃及文明學習通超星期末考試答案章節答案2024年
- BIM5D+智慧工地整體解決方案
- 2024年4月南京市鼓樓區九年級中考語文一模試卷附答案解析
- 退稅的住房合同
- 《猜數字算法設計》 教學設計教學設計教學設計
- 建筑工程合同管理與索賠論文2024年
- 載人航天器生命保障系統
- 雇工合同書(2024版)
- 四年級下冊英語教案-Unit 4 There are seven days in a week Lesson 22 |人教精通版
評論
0/150
提交評論