SlideShare a Scribd company logo
Generative Adversarial Networks
- 敵対的生成ネットワーク -
2017/9/29 @shuyo
従来のデータ生成
• データの構造を反映したモデルを構築
• 文生成
‣生成的な言語モデルを構築・学習してサンプリング
• 文字生成
‣ペン・ストロークなどをモデル化して生成
• 画像生成
‣3Dモデルを物理シュミレーションして生成
Deep Learning な時代なのに
古くね?
やりたいこと
• いっぱいデータを用意して食わせたら、
よく似たデータが生成される
‣人間が見て同じカテゴリーと判断
• データの構造の知識は(あんまり)不要
‣過剰にリッチなモデルに魔法の正則化を組み
合わせたらなんか解けちゃった?
• ディープラーニングっぽい!
最近流行ってる
生成フレームワーク
• GAN (Generative Adversarial
Networks)
• VAE (Variational Auto-Encoders)
データから生成器を作る
• 観測データ から真の分布 を得たい
‣ =人が と同じカテゴリとみなすデータの分布
• 問題1: 負例が無い、あるいは多すぎる
‣観測データは全て正例
‣ランダムサンプルは確率 で負例
• 問題2:負例があっても、
作れるのは生成器ではなく判別器
Generative Adversarial Nets
[Goodfellow+ 2014]
• :判別器
‣ が本物なら 、
偽物なら
• :生成器
‣ (ガウス分布や一様分布)に対し、
本物 と見分けられない を対応
• フレームワーク的には G/D がニューラルネットである
必要はない
‣が、後述の理由により表現力の高いモデルが要請される
GAN の学習
1. を正例、 を負例として
判別器 を学習
‣鑑定家 D が、本物と G が作った偽物を見分けら
れるように訓練
2. に対し が 1 になるよう
生成器 を学習
‣贋作家 G が、D に見分けがつかない本物を作れ
るように訓練
3. 1. 2. を繰り返す
GAN の理論的解析
• 目的関数
• D/G が十分な表現力をもつモデルで、目
的関数を最適化するパラメータが得られ
たとき、
‣ に対し、
‣ に対し、
真の分布が
得られる!
真贋の見分けが
つかない!
GAN 実装してみた
• https://github.com/shuyo/iir/blob/ma
ster/dnn/gan-mnist.py
‣Tensor-flow / MNIST
‣D : 隠れ1層 256ユニット、マックスアウト
‣G : 隠れ1層 512ユニット
‣ : [-1, 1] の一様分布×32次元
元画像と生成した画像
• G に入力する乱数によって適当な数字画像を生成
‣確かに MNIST っぽい数字が生成される
‣生成する数字の種類は選べない
MNIST GAN
数字の種類を指定したい
• 方法1: 各数字ごとにモデルを学習する
‣“1” の画像のみ、”2” の画像のみ、……
‣数字や手書き文字に共通する性質も別々に学習
‣スタイルのバラバラな数字が得られる
• 方法2: Conditional GAN
Conditional GAN
[Mirza+ 2014]
• 生成/識別する画像のカテゴリを指定する
‣G/D の入力に正解
ラベル を追加
‣D は、データが正解ラ
ベルに対応するなら 1、
それ以外は 0 を出力
‣G は入力されたラベルの
データを生成する ラベル
(one hot vector)
Conditional GAN 実装してみた
• ラベルで生成する数字を指定できる
‣ https://github.com/shuyo/iir/blob/master/dnn/cgan-mnist.py
‣乱数で生成する数字のスタイルが決まる
同じスタイルの
数字セットが
得られる!!
各行は
同じ乱数から
生成
0~9 のラベル
もっとかっこいい数字を
生成したい
DCGAN [Radford+ 2015]
• G に deconvolution を用いた GAN
‣生成可能な画像の表現力が上がる
‣D は普通の convolution
Street View House Numbers
[Netzer+ 2011]
• Google ストリートビューから切り出した
ハウスナンバー(表札)画像のデータセット
‣http://ufldl.stanford.edu/housenumbers/
• 2種類の形式
‣画像に含まれている複数の数字とそれぞれ領域
‣画像から切り出した個々の数字 (←今回を使う方)
フルセット
揃っている
同じスタイ
ルの数字は
ない
Conditional DCGAN 実装してみた
• https://github.com/shuyo/iir/blob/ma
ster/dnn/cdcgan-svhn.py
‣Street View House Numbers
‣チャンネル数は設定ファイルで指定
• G : 512, 256, 128
• D : 64, 128, 256
• p_z : 100次元
生成結果
• 文字色/背景色、幅、ストローク、ヒゲや飾りの有
無や形が揃ったフルセットの数字が生成される
• 学習の様子 https://youtu.be/IXaeo9wxSoQ
References
• Goodfellow, Ian, et al. "Generative adversarial nets."
Advances in neural information processing systems. 2014.
• Mirza, Mehdi, and Simon Osindero. "Conditional generative
adversarial nets." arXiv preprint arXiv:1411.1784 (2014).
• Radford, Alec, Luke Metz, and Soumith Chintala.
"Unsupervised representation learning with deep
convolutional generative adversarial networks." arXiv preprint
arXiv:1511.06434 (2015).
• Yuval Netzer, Tao Wang, Adam Coates, Alessandro Bissacco,
Bo Wu, Andrew Y. Ng Reading Digits in Natural Images with
Unsupervised Feature Learning NIPS Workshop on Deep
Learning and Unsupervised Feature Learning 2011.

More Related Content

PDF
大規模並列実験を支えるクラウドサービスと基盤技術
PDF
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
PDF
Variational AutoEncoder
PDF
顕著性マップの推定手法
PPTX
[DL輪読会] “Asymmetric Tri-training for Unsupervised Domain Adaptation (ICML2017...
PPTX
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
PDF
グラフニューラルネットワークとグラフ組合せ問題
PDF
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction
大規模並列実験を支えるクラウドサービスと基盤技術
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
Variational AutoEncoder
顕著性マップの推定手法
[DL輪読会] “Asymmetric Tri-training for Unsupervised Domain Adaptation (ICML2017...
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
グラフニューラルネットワークとグラフ組合せ問題
[DL輪読会]Reward Augmented Maximum Likelihood for Neural Structured Prediction

What's hot (20)

PDF
Iclr2016 vaeまとめ
PPTX
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
PDF
ICCV 2019 論文紹介 (26 papers)
PDF
Nagoya.R #12 非線形の相関関係を検出する指標の算出
PDF
【基調講演】『深層学習の原理の理解に向けた理論の試み』 今泉 允聡(東大)
PDF
Amazon SageMaker 推論エンドポイントを利用したアプリケーション開発
PDF
[論文解説]KGAT:Knowledge Graph Attention Network for Recommendation
PDF
ECCV2020 オーラル論文完全読破 (2/2)
PDF
PFN Summer Internship 2021 / Kohei Shinohara: Charge Transfer Modeling in Neu...
PPTX
Triplet Loss 徹底解説
PPTX
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
PDF
MICの解説
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
教師なしGNNによるIoTデバイスの異常通信検知の検討
PPTX
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
PDF
TVM の紹介
PPTX
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PDF
三次元点群を取り扱うニューラルネットワークのサーベイ
PDF
猫でも分かりたい線形回帰の自由度
PDF
4 データ間の距離と類似度
Iclr2016 vaeまとめ
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
ICCV 2019 論文紹介 (26 papers)
Nagoya.R #12 非線形の相関関係を検出する指標の算出
【基調講演】『深層学習の原理の理解に向けた理論の試み』 今泉 允聡(東大)
Amazon SageMaker 推論エンドポイントを利用したアプリケーション開発
[論文解説]KGAT:Knowledge Graph Attention Network for Recommendation
ECCV2020 オーラル論文完全読破 (2/2)
PFN Summer Internship 2021 / Kohei Shinohara: Charge Transfer Modeling in Neu...
Triplet Loss 徹底解説
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
MICの解説
Domain Adaptation 発展と動向まとめ(サーベイ資料)
教師なしGNNによるIoTデバイスの異常通信検知の検討
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
TVM の紹介
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
三次元点群を取り扱うニューラルネットワークのサーベイ
猫でも分かりたい線形回帰の自由度
4 データ間の距離と類似度
Ad

Viewers also liked (20)

PDF
[DL輪読会]Adversarial Feature Matching for Text Generation
PPTX
Twitter炎上分析事例 2014年
PDF
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
PPTX
Approximate Scalable Bounded Space Sketch for Large Data NLP
PDF
Argmax Operations in NLP
PPTX
「人工知能」の表紙に関するTweetの分析・続報
PPTX
第35回 強化学習勉強会・論文紹介 [Lantao Yu : 2016]
PDF
オープンソースを利用した新時代を生き抜くためのデータ解析
PDF
あなたの業務に機械学習を活用する5つのポイント
PDF
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
PDF
オンコロジストなるためのスキル
PDF
Uncertainty Awareness in Integrating Machine Learning and Game Theory
PDF
新たなRNNと自然言語処理
PDF
ディープラーニングでラーメン二郎(全店舗)を識別してみた
PDF
Deep LearningフレームワークChainerと最近の技術動向
PDF
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
PDF
現在のDNNにおける未解決問題
PDF
論文紹介 Semi-supervised Learning with Deep Generative Models
PDF
ディープラーニングによるラーメン二郎全店舗識別と生成
PDF
生成モデルの Deep Learning
[DL輪読会]Adversarial Feature Matching for Text Generation
Twitter炎上分析事例 2014年
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
Approximate Scalable Bounded Space Sketch for Large Data NLP
Argmax Operations in NLP
「人工知能」の表紙に関するTweetの分析・続報
第35回 強化学習勉強会・論文紹介 [Lantao Yu : 2016]
オープンソースを利用した新時代を生き抜くためのデータ解析
あなたの業務に機械学習を活用する5つのポイント
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
オンコロジストなるためのスキル
Uncertainty Awareness in Integrating Machine Learning and Game Theory
新たなRNNと自然言語処理
ディープラーニングでラーメン二郎(全店舗)を識別してみた
Deep LearningフレームワークChainerと最近の技術動向
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
現在のDNNにおける未解決問題
論文紹介 Semi-supervised Learning with Deep Generative Models
ディープラーニングによるラーメン二郎全店舗識別と生成
生成モデルの Deep Learning
Ad

Similar to Generative adversarial networks (8)

PPTX
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
PPTX
Machine learning
PDF
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
PDF
文献紹介:Omnivore: A Single Model for Many Visual Modalities
PPTX
Python 機械学習入門
PDF
Unity開発で使える設計の話+Zenjectの紹介
PDF
マイニング探検会#09 情報レコメンデーションとは
PPTX
情報理工学院情報工学系村田研究室.pptx
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
Machine learning
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
文献紹介:Omnivore: A Single Model for Many Visual Modalities
Python 機械学習入門
Unity開発で使える設計の話+Zenjectの紹介
マイニング探検会#09 情報レコメンデーションとは
情報理工学院情報工学系村田研究室.pptx

More from Shuyo Nakatani (20)

PDF
画像をテキストで検索したい!(OpenAI CLIP) - VRC-LT #15
PDF
無限関係モデル (続・わかりやすいパターン認識 13章)
PDF
Memory Networks (End-to-End Memory Networks の Chainer 実装)
PDF
人工知能と機械学習の違いって?
PDF
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
PDF
ドラえもんでわかる統計的因果推論 #TokyoR
PDF
[Yang, Downey and Boyd-Graber 2015] Efficient Methods for Incorporating Knowl...
PDF
星野「調査観察データの統計科学」第3章
PDF
星野「調査観察データの統計科学」第1&2章
PDF
言語処理するのに Python でいいの? #PyDataTokyo
PDF
Zipf? (ジップ則のひみつ?) #DSIRNLP
PDF
ACL2014 Reading: [Zhang+] "Kneser-Ney Smoothing on Expected Count" and [Pickh...
PDF
ソーシャルメディアの多言語判定 #SoC2014
PDF
猫に教えてもらうルベーグ可測
PDF
アラビア語とペルシャ語の見分け方 #DSIRNLP 5
PDF
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
PDF
Active Learning 入門
PDF
数式を綺麗にプログラミングするコツ #spro2013
PDF
ノンパラベイズ入門の入門
PDF
[Kim+ ICML2012] Dirichlet Process with Mixed Random Measures : A Nonparametri...
画像をテキストで検索したい!(OpenAI CLIP) - VRC-LT #15
無限関係モデル (続・わかりやすいパターン認識 13章)
Memory Networks (End-to-End Memory Networks の Chainer 実装)
人工知能と機械学習の違いって?
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoR
[Yang, Downey and Boyd-Graber 2015] Efficient Methods for Incorporating Knowl...
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第1&2章
言語処理するのに Python でいいの? #PyDataTokyo
Zipf? (ジップ則のひみつ?) #DSIRNLP
ACL2014 Reading: [Zhang+] "Kneser-Ney Smoothing on Expected Count" and [Pickh...
ソーシャルメディアの多言語判定 #SoC2014
猫に教えてもらうルベーグ可測
アラビア語とペルシャ語の見分け方 #DSIRNLP 5
どの言語でつぶやかれたのか、機械が知る方法 #WebDBf2013
Active Learning 入門
数式を綺麗にプログラミングするコツ #spro2013
ノンパラベイズ入門の入門
[Kim+ ICML2012] Dirichlet Process with Mixed Random Measures : A Nonparametri...

Generative adversarial networks