SlideShare a Scribd company logo
2017-06-29
1
NIPS+読み会・関西 第4回
Yasuo YAMAMOTO
Variational Recurrent Adversarial Deep
Domain Adaptation
自己紹介
山本 康生 (Yasuo Yamamoto)
所属:データ&サイエンス サイエンス本部@大阪オフィス
担当:広告サイエンス
経歴:
• Yahoo! JAPAN 在籍
• これまで京阪奈地区で研究開発(NICT, ATRなど)
• KaggleTop10%入賞とか Airbnb(143rd/1462)、HomeDept(85th/2125)
2
本論文について
Variational Recurrent Adversarial
Deep Domain Adaptation
Sanjay Purushotham*,Wilka Carvalho*, Tanachat Nilanon, Yan Liu @南カリフォルニア大学
ICML 2017 accepted paper
3
本テーマの課題
教師ありデータが不足している
•現状、教師ありデータが溜まった特定の分野で
しか精度の高いモデルが構築できない
4
転移学習のモチベーション
じゃあモデルを転移しよう
“転移学習しよう”
5
転移学習の問題設定
6
Source Domain
𝑋𝑠
𝑌𝑠
Target Domain
𝑋 𝑇
𝑌𝑇
1.データが異なる場合
𝑋𝑠 ≠ 𝑋𝑡
2.データの分布が異なる
𝑃(𝑋𝑠) ≠ 𝑃(𝑋𝑡)
3.ラベルが異なる
𝑌𝑠 ≠ 𝑌𝑡
4.ラベルの分布が異なる
𝑃(𝑌𝑠) ≠ 𝑃(𝑌𝑡)
本研究が扱う転移学習の課題
7
Source Domain
𝑋𝑠
𝑌𝑠
Target Domain
𝑋 𝑇
1.データが異なる場合
𝑋𝑠 ≠ 𝑋𝑡
2.データの分布が異なる
𝑃(𝑋𝑠) ≠ 𝑃(𝑋𝑡)
3.ラベルが異なる
𝑌𝑠 ≠ 𝑌𝑡
4.ラベルの分布が異なる
𝑃(𝑌𝑠) ≠ 𝑃(𝑌𝑡)
e.g.) ドメインが異なる例
年齢別の薬品の効果予測
地域別のレコメンデーション
ドメイン転移
Domain Adaptation
転移学習の取組み
Reducing the domain discrepancy between the source and target
domains(Ben-David et al. (2007))
ドメイン不一致度を低減する手法
Instance re-weighting (Jiang & Zhai (2007))
学習に優良なインスタンスの重み付けを行う
Subspace alignment (Fernando et al. (2013))
ドメイン間の部分空間のマッピング関数を学習する手法
Deep learning (Tzeng et al. (2015); Ganin & Lempitsky (2014))
Deep Featureなど深層学習から得られる特徴量の転移
Deep Transfer Learning with Joint Adaptation Networks ;(Mingsheng
Long, Jianmin Wang, Michael I. Jordan(2016))
特徴量とラベルの結合分布をヒルベルト空間にマッピングする手法
8
転移学習の取組み
Reducing the domain discrepancy between the source and target
domains(Ben-David et al. (2007))
ドメイン不一致度を低減する手法
Instance re-weighting (Jiang & Zhai (2007))
学習に優良なインスタンスの重み付けを行う
Subspace alignment (Fernando et al. (2013))
ドメイン間の部分空間のマッピング関数を学習する手法
Deep learning (Tzeng et al. (2015); Ganin & Lempitsky (2014))
Deep Featureなど深層学習から得られる特徴量の転移
Deep Transfer Learning with Joint Adaptation Networks ;(Mingsheng
Long, Jianmin Wang, Michael I. Jordan(2016))
特徴量とラベルの結合分布をヒルベルト空間にマッピングする手法
9
時系列データなどには最適でない
本研究のシナリオ
時系列隠れ変数の依存性を考慮する
教師なしドメイン適応を実現する
実際の医療データを使って実験する
10
本研究の提案
11
Variational Recurrent Neural Network
VRNN
(Chung et al. (2016))
Domain Adversarial Neural Networks
DANN
(Ganin et al. (2016))
Variational Recurrent Adversarial Deep Domain Adaptation
VRADA
先行研究の特徴
12
Variational Recurrent Neural Network
VRNN
(Chung et al. (2016))
Domain Adversarial Neural Networks
DANN
(Ganin et al. (2016))
Variational Recurrent Adversarial Deep Domain Adaptation
VRADA
タイムステップが異なる時系列デー
タの隠れ変数モデリングに強い
隠れ変数をドメインラベルで
Adversarial Trainingする
VRADA グラフィカル・モデル
13
: VRNN - Variational Recurrent Neural Network
: DANN - Domain Adversarial Neural Networks
VRADA グラフィカル・モデルの処理
14
: inference process
: generation process
: recurrent process
: classification
𝑧: latent variable
ℎ: hidden state
𝑥: data
𝐺𝑦: DNN for a label
𝐺𝑔: DNN for a domain
VRNNの目的関数
15
Encoder:
Prior:
Decoder:
DNN
DNN
DNN
VRNNの目的関数
16
推論モデル:
𝑞 𝜃 𝑒
𝑧𝑡
𝑖
𝑥≤𝑡
𝑖
, 𝑧<𝑡
𝑖
過去のモデル:
𝑝 𝑧𝑡
𝑖
𝑥<𝑡
𝑖
, 𝑧<𝑡
𝑖
生成モデル:
𝑝 𝜃 𝑔
𝑥 𝑡
𝑖
𝑧≤𝑡
𝑖
, 𝑥<𝑡
𝑖
KL-Divergence
DANN分類正則化項の追加
17
分類正則化項:
分類正則化項
DNN
DNN
正解レベル
ドメインラベル
VRADAの目的関数
18
RNN項 ラベル分類項 ドメイン分類項
𝑁: 全サンプル数
𝑇: 対象時間
𝑛: ソースドメイン・サンプル数
𝑛′: ターゲットドメイン・サンプル数
最適化とパラメータ更新
19
Generator, Encoder, クラス分類
のパラメータを求める
ドメイン分類のパラメータを求める
SGDで更新
𝜂: 学習率
実験データ
20
MIMIC-III
• 匿名化された成人38,645人と新生児7,875人の入院
記録58,000件以上
https://physionet.org/physiobank/database/mimic3cdb/
実験データ:MIMIC-III
21
患者分類 ドメイン 説明 サンプル数
成人 グループ2 20〜45歳 508
グループ3 46〜65歳 1,888
グループ4 66〜85歳 2,394
グループ5 85歳以上 437
子供 グループ1 0〜19歳 398
変数 説明
𝑋 患者の体液(インスリンなど)
臨床検査結果(pH値、血小板数など)
処方イベント(アスピリン、塩化カリウムの詳報など)
𝑦 ICD9診断コード
AHRF(急性低酸素呼吸不全)データセット
ICD9 データセット
問題設定
22
死亡率予測
ICD9診断コード予測
ドメイン適応タスク
死亡率予測の結果
23
Domain Adaptationなし Domain Adaptationあり
提案手法は
死亡率推定
で良い結果
ICD9診断コード予測
24
提案手法はICD9診断コー
ド予測でもで良い結果
ドメイン適応3-4,2-5:ニューロン発火状態
25
提案手法はSource-Target間で
ニューロンの励起が似ている
ドメイン適応3-4,2-5:ドメイン適応・時間推移
26
提案手法はニューロンの時系列
遷移を鮮明に表現している
t-SNEプロジェクション
27
提案手法はTargetとSourceが分離
されることなく表現できている
VRADAのまとめ
28
時系列データに対するドメイン遷移を効果的に実現
ヘルスケア領域の実データに対しても優れた精度を達成
他手法と比べ時系列潜在変数を的確に表現可能
他手法と比べドメイン間のデータ分離を削減

More Related Content

PDF
JavaOne2017参加報告 Microservices topic & approach #jjug
PDF
ICML2017 参加報告会 山本康生
PDF
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
PDF
グロースハック なぜ我々は無意味な施策を打ってしまうのか
PPTX
データ利活用を促進するメタデータ
PDF
Yahoo! JAPANのOSS Cassandra貢献の今までとこれから
PDF
Cassandra: Now and the Future @ Yahoo! JAPAN
PDF
Design pattern in presto source code
JavaOne2017参加報告 Microservices topic & approach #jjug
ICML2017 参加報告会 山本康生
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
グロースハック なぜ我々は無意味な施策を打ってしまうのか
データ利活用を促進するメタデータ
Yahoo! JAPANのOSS Cassandra貢献の今までとこれから
Cassandra: Now and the Future @ Yahoo! JAPAN
Design pattern in presto source code

More from Yahoo!デベロッパーネットワーク (20)

PDF
ゼロから始める転移学習
PDF
継続的なモデルモニタリングを実現するKubernetes Operator
PDF
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
PDF
オンプレML基盤on Kubernetes パネルディスカッション
PDF
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
PDF
Persistent-memory-native Database High-availability Feature
PDF
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
PDF
eコマースと実店舗の相互利益を目指したデザイン #yjtc
PDF
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
PDF
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
PDF
ビッグデータから人々のムードを捉える #yjtc
PDF
サイエンス領域におけるMLOpsの取り組み #yjtc
PDF
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
PDF
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
PDF
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
PDF
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PDF
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
PDF
「新しいおうち探し」のためのAIアシスト検索 #yjtc
PDF
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ゼロから始める転移学習
継続的なモデルモニタリングを実現するKubernetes Operator
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
Persistent-memory-native Database High-availability Feature
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
eコマースと実店舗の相互利益を目指したデザイン #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
ビッグデータから人々のムードを捉える #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
Ad

第4回 NIPS+読み会・関西 発表資料 山本