遷移學習中的領域自適應方法_第1頁
遷移學習中的領域自適應方法_第2頁
遷移學習中的領域自適應方法_第3頁
遷移學習中的領域自適應方法_第4頁
遷移學習中的領域自適應方法_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

遷移學習中的領域自適應方法目

錄CONTENTS最新研究成果遷移學習簡介領域自適應問題領域自適應方法參考資料12345n

智能大數據時代n

數據量,以及數據類型不斷增加n

對機器學習模型的要求:快速構建和強泛化能力n

雖然數據量多,但是大部分數據往往沒有標注n

收集標注數據,或者從頭開始構建每一個模型,代價高昂且費時n

對已有標簽的數據和模型進行重用成為了可能n

傳統機器學習方法通常假定這些數據服從相同分布,不再適用如何基于已有的不同分布數據,快速構建模型,實現數據標定,是一個重要問題1遷移學習的背景圖片及視頻音頻行為文本n

核心思想n

找到不同任務之間的相關性n

“舉一反三”、“照貓畫虎”,但不要“東施效顰”(負遷移)n

遷移學習n通過減小源域(輔助領域)到目標域的分布差異,進行知識遷移,從而實現數據標定。遷移學習是機器學習領域用于解決標記數據難獲取這一基礎問題的重要手段1遷移學習簡介源域數據減小差異知識遷移135n

應用前景廣闊n

模式識別、計算機視覺、語音識別、自然語言處理、數據挖掘

…1遷移學習應用場景不同用戶、不同設備、不同位置的行為識別不同場景、不同設備、不同時間的室內定位不同用戶、不同接口、不同情境的人機交互不同視角、不同背景、不同光照的圖像識別不同領域、不同背景下的文本翻譯、輿情分析語料匱乏條件下不同語言

的相互翻譯學習n

數據為王,計算是核心n數據爆炸的時代!n

計算機更強大了!

n

但是n

大數據、大計算能力只是有錢人的游戲普通研究人員無法獲取足夠標定數據,并且沒有足夠的計算資源1遷移學習簡介:為什么需要遷移學習Googlea4onn

云+端的模型被普遍應用n

通常需要對設備、環境、用戶作具體優化n

個性化適配通常很復雜、很耗時n

對于不同用戶,需要不同的隱私處理方式如何針對新用戶、新設備、新環境,快速構建模型?1遷移學習簡介:為什么需要遷移學習沒有足夠的用戶數據,如何構建模型?n

特定的機器學習應用n

推薦系統中的冷啟動問題:沒有數據,如何作推薦?1遷移學習簡介:為什么需要遷移學習n

為什么需要遷移學習n

數據的角度n

收集數據很困難n

為數據打標簽很耗時n

訓練一對一的模型很繁瑣n

模型的角度n

個性化模型很復雜n

云+端的模型需要作具體化適配n

應用的角度n

冷啟動問題:沒有足夠用戶數據,推薦系統無法工作因此,遷移學習是必要的1遷移學習簡介:為什么需要遷移學習基于實例的遷移(instance

basedTL)?

通過權重重用源域和目標域的樣例進行遷移基于特征的遷移

(feature

basedTL)?

將源域和目標域的特征變換到相同空間基于模型的遷移

(parameter

basedTL)?

利用源域和目標域的參數共享模型基于關系的遷移

(relation

basedTL)?

利用源域中的邏輯網絡關系進行遷移1遷移學習簡介:遷移學習方法n

常見的遷移學習方法分類1遷移學習簡介:遷移學習方法研究領域n

常見的遷移學習研究領域與方法分類目

錄CONTENTS最新研究成果遷移學習簡介領域自適應問題領域自適應方法參考資料12345n

遷移學習基本概念n

域(Domain):由數據特征和特征分布組成,是學習的主體nSourcedomain(源域):已有知識的域n

Targetdomain

(目標域):要進行學習的域n

任務(Task):由目標函數和學習結果組成,是學習的結果n

形式化n目標:利用

學習在目標域上的預測函數

。n

限制條件:

Ts

/

TT2領域分布自適應:形式化條件:給定一個源域Ds

的學習任務TT和源域上的學習任務Ts

,目標域DT

和目標域上nn

領域自適應問題nDomainAdaptation

(DA);cross-domain

learning;

同構遷移學習n問題定義:有標簽的源域和無標簽的目標域共享相同的特征和類別,但是特征分布不同,如何利用源域標定目標域Ds

/

DT:PS

(X)

/

PT

(X)n

計算機視覺中的一個重要問題n

每年發表大量相關論文:CVPR、ICCV、ICML、NIPS、IJCAI、AAAI2領域自適應:形式化n

領域自適應問題n

按照目標域有無標簽n目標域全部有標簽:supervised

DAn目標域有一些標簽:semi-supervised

DAn目標域全沒有標簽:unsupervised

DAn

Unsupervised

DA最有挑戰性,是我們的關注點2領域自適應:形式化目

錄CONTENTS最新研究成果遷移學習簡介領域自適應問題領域自適應方法參考資料12345n

基本假設n

數據分布角度:源域和目標域的概率分布相似n

最小化概率分布距離n

特征選擇角度:源域和目標域共享著某些特征n

選擇出這部分公共特征n

特征變換角度:源域和目標域共享某些子空間n

把兩個域變換到相同的子空間3領域自適應:方法概覽解決思路數據分布特征選擇法(Feature

Selection)子空間學習法(Subspace

Learning)概率分布適配法(DistributionAdaptation)特征變換特征選擇nn概率分布適配法

(DistributionAdaptation)n

邊緣分布適配

(Marginal

distribution

adaptation)n假設:

P(xg)豐P(X)n

條件分布適配

(Conditional

distribution

adaptation)n

假設:

P(YS]X)*P(Y

X)n

聯合分布適配

(Joint

distribution

adaptation)n假設:

P(xs,ys)*p(xt,y)3領域自適應:概率分布適配法源域數據

目標域數據(1)

目標域數據(2)優先考慮邊緣分布

優先考慮條件分布n

邊緣分布適配

(1)n

遷移成分分析

(Transfer

Component

Analysis,TCA)[Pan,

TNN-11]n優化目標:3領域自適應:概率分布適配法n

最大均值差異(Maximum

Mean

Discrepancy,

MMD)n

最小化MMD,同時維持遷移過程中目標域的結構n

DomainTransfer

Multiple

Kernel

Learning

(DTMKL)

[Duan,

PAMI-12]n

多核MMDn

Deep

Domain

Confusion

(DDC)

[Tzeng,

arXiv-14]n

把MMD加入到神經網絡中n

Deep

Adaptation

Networks

(DAN)

[Long,

ICML-15]n

把MKK-MMD加入到神經網絡中n

Distribution-Matching

Embedding

(DME)

[Baktashmotlagh,

JMLR-16]n

先計算變換矩陣,再進行映射n

Central

Moment

Discrepancy

(CMD)

[Zellinger,

ICLR-17]n

不只是一階的MMD,推廣到了k階n

邊緣分布適配

(2)n

遷移成分分析

(TCA)方法的一些擴展n

Adapting

Component

Analysis

(ACA)

[Dorri,

ICDM-12]3領域自適應:概率分布適配法n

條件分布適配n

DomainAdaptationofConditional

Probability

Modelsvia

Feature

Subsetting

[Satpal,

PKDD-07]n

條件隨機場+分布適配n優化目標:n

Conditional

Transferrable

Components

(CTC)

[Gong,

ICML-15]n

定義條件轉移成分,對其進行建模3領域自適應:概率分布適配法n

聯合分布適配

(1)n

聯合分布適配

(Joint

Distribution

Adaptation,JDA)[Long,

ICCV-13]n

直接繼承于TCA,但是加入了條件分布適配n優化目標:n問題:如何獲得估計條件分布?n

充分統計量:用類條件概率近似條件概率n

用一個弱分類器生成目標域的初始軟標簽n

最終優化形式3領域自適應:概率分布適配法n

聯合分布適配的結果普遍優于比單獨適配邊緣或條件分布n

聯合分布適配

(2)n

聯合分布適配(JDA)方法的一些擴展n

Adaptation

Regularization

(ARTL)

[Long,

TKDE-14]n

分類器學習+聯合分布適配n

Visual

Domain

Adaptation

(VDA)

[Tahmoresnezhad,

KIS-17]n

加入類內距、類間距n

JointGeometricalandStatisticalAlignment(JGSA)

[Zhang,

CVPR-17]n

加入類內距、類間距、標簽適配n[Hsu,TIP-16]:加入結構不變性控制n[Hsu,AVSS-15]:目標域選擇n

Joint

Adaptation

Networks

(JAN)

[Long,

ICML-17]n

提出JMMD度量,在深度網絡中進行聯合分布適配3領域自適應:概率分布適配法n

聯合分布適配

(3)n

平衡分布適配

(Balanced

Distribution

Adaptation,

BDA)[Wang,n

僅僅適配條件分布和邊緣分布就夠了嗎?n

聯合分布適配的問題:兩種分布同等重要n

真實環境:兩種分布不一定同等重要n

加入平衡因子動態衡量兩種分布的重要性ue

[0,1n

,表示邊緣分布更占優,應該優先適配n

當,表示條件分布更占優,應該優先適配n

最終表示形式平衡因子3領域自適應:概率分布適配法ICDM-2017]n

聯合分布適配

(4)n

平衡分布適配

(BDA):平衡因子的重要性n

對于不同的任務,邊緣分布和條件

分布并不是同等重要,因此,BDA方法可以有效衡量這兩個分布的權

重,從而達到最好的結果n

平衡分布適配

(BDA):平衡因子的求解與估計n

目前尚無精確的估計方法;我們采用A-distance來進行估計n

求解源域和目標域整體的A-distancen

對目標域聚類,計算源域和目標域每個類的A-distancen

計算上述兩個距離的比值,則為平衡因子3領域自適應:概率分布適配法n

概率分布適配:總結

n

方法n

基礎:大多數方法基于MMD距離進行優化求解n

分別進行邊緣/條件

/聯合概率適配n效果:平衡

(BDA)

>聯合

(JDA)

>邊緣

(TCA)

>條件

n

使用n

數據整體差異性大

(相似度較低),邊緣分布更重要n

數據整體差異性小

(協方差漂移),條件分布更重要n

最新成果n

深度學習+分布適配往往有更好的效果

(DDC、DAN、JAN)3領域自適應:概率分布適配法DDC、DAN、JAN與其他方法結果比較BDA、JDA、TCA精度比較n特征選擇法

(Feature

Selection)n

從源域和目標域中選擇提取共享的特征,建立統一模型n

Structural

Correspondence

Learning

(SCL)

[Blitzer,

ECML-06]n

尋找Pivotfeature,將源域和目標域進行對齊3領域自適應:特征選擇法n

特征選擇法其他擴展n

Joint

feature

selection

and

subspace

learning

[Gu,

IJCAI-11]n

特征選擇/變換+子空間學習n

優化目標:

n

Transfer

Joint

Matching

(TJM)

[Long,

CVPR-14]n

MMD分布適配+源域樣本選擇n

優化目標:

n

Feature

Selection

and

Structure

Preservation

(FSSL)[Li,

IJCAI-16]n

特征選擇+信息不變性n

優化目標:3領域自適應:特征選擇法n

特征選擇法:總結n

從源域和目標域中選擇提取共享的特征,建立統一模型n

通常與分布適配進行結合n

選擇特征通常利用稀疏矩陣3領域自適應:特征選擇法n子空間學習法

(Subspace

Learning)n

將源域和目標域變換到相同的子空間,然后建立統一的模型n

統計特征變換

(Statistical

Feature

Transformation)n

將源域和目標域的一些統計特征進行變換對齊n

流形學習

(Manifold

Learning)n

在流形空間中進行子空間變換3領域自適應:子空間學習法統計特征變換流形學習n

統計特征變換

(1)n

子空間對齊法

(Subspace

Alignment,

SA)

[Fernando,

ICCV-13]n

直接尋求一個線性變換,把source變換到target空間中n優化目標:n直接獲得線性變換的閉式解:n

子空間分布對齊法

(Subspace

Distribution

Alignment,SDA)

[Sun,

BMVC-15]n

子空間對齊+概率分布適配3領域自適應:子空間學習法n

空間對齊法:方法簡潔,計算高效n

統計特征變換

(2)n

關聯對齊法

(CORrelation

Alignment,CORAL)[Sun,

AAAI-15]n

最小化源域和目標域的二階統計特征n優化目標:n

形式簡單,求解高效n

深度關聯對齊

(Deep-CORAL)

[Sun,

ECCV-16]n

在深度網絡中加入CORALnCORAL

loss:3領域自適應:子空間學習法n

流形學習

(1)n

采樣測地線流方法

(Sample

Geodesic

Flow,

SGF)

[Gopalan,

ICCV-11]n

把領域自適應的問題看成一個增量式“行走”問題n

從源域走到目標域就完成了一個自適應過程n

在流形空間中采樣有限個點,構建一個測地線流n

測地線流式核方法

(Geodesic

Flow

Kernel,

GFK)

[Gong,

CVPR-12]n

繼承了SGF方法,采樣無窮個點n

轉化成Grassmann流形中的核學習,構建了GFKn優化目標:3領域自適應:子空間學習法GFK方法SGF方法n

流形學習

(2)n

域CVP不R-變13]映射

(Domain-Invariant

Projection,

DIP)[Baktashmotlagh,

n

直接度量分布距離是不好的:原始空間特征扭曲n

僅作流形子空間學習:無法刻畫分布距離n

解決方案:流形映射+分布度量n

統計流形法

(Statistical

Manifold)

[Baktashmotlagh,

CVPR-14]n

在統計流形(黎曼流形)上進行分布度量n

用Fisher-Raodistance

(Hellingerdistance)進行度量3領域自適應:子空間學習法n

子空間學習法:總結n

主要包括統計特征對齊和流形學習方法兩大類n

和分布適配結合效果更好n

趨勢:與神經網絡結合3領域自適應:子空間學習法目

錄CONTENTS最新研究成果遷移學習簡介領域自適應問題領域自適應方法參考資料12345n領域自適應的最新研究成果(1)n

與深度學習進行結合n

Deep

Adaptation

Networks

(DAN)

[Long,

ICML-15]n

深度網絡+MMD距離最小化n

Joint

Adaptation

Networks

(JAN)

[Long,

ICML-17]n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論