Submit Search
PostgreSQL画像データ収集・格納
Download as PPTX, PDF
1 like
5,478 views
Ayumi Ishii
2015/12/12 PostgreSQLアンカンファレンス講演資料
Technology
Read more
1 of 20
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Most read
15
16
Most read
17
Most read
18
19
20
More Related Content
PPTX
Azure Cosmos DB のキホンと使いドコロ
Kazuyuki Miyake
PDF
もうひとつのアンチパターン OTLT、あるいは如何にして私はオレオレフレームワークを忌み嫌うようになったか
suno88
PDF
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
PDF
君はyarn.lockをコミットしているか?
Teppei Sato
PPTX
やってはいけない空振りDelete
Yu Yamada
PDF
SQLアンチパターン読書会 第10章 サーティワンフレーバー
tkfuji
PDF
Where狙いのキー、order by狙いのキー
yoku0825
ODP
Goのサーバサイド実装におけるレイヤ設計とレイヤ内実装について考える
pospome
Azure Cosmos DB のキホンと使いドコロ
Kazuyuki Miyake
もうひとつのアンチパターン OTLT、あるいは如何にして私はオレオレフレームワークを忌み嫌うようになったか
suno88
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
君はyarn.lockをコミットしているか?
Teppei Sato
やってはいけない空振りDelete
Yu Yamada
SQLアンチパターン読書会 第10章 サーティワンフレーバー
tkfuji
Where狙いのキー、order by狙いのキー
yoku0825
Goのサーバサイド実装におけるレイヤ設計とレイヤ内実装について考える
pospome
What's hot
(20)
PPTX
AWSメンテナンス ElastiCache編
Serverworks Co.,Ltd.
PPTX
SQLチューニング入門 入門編
Miki Shimogai
PDF
pg_bigmと類似度検索
Masahiko Sawada
PPTX
失敗から学ぶAWSの監視
株式会社オプト 仙台ラボラトリ
PDF
cyREST入門~RとCytoscapeのAPI連携~
Mitsunori Sato
PDF
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
PDF
DynamoDB設計のちょっとした技
Yoichi Toyota
PDF
今からでも大丈夫!Firebase入門
Tomoki Koga
PDF
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
Uptime Technologies LLC (JP)
PDF
アルゴリズムのイメージを擬人化する
AtCoder Inc.
PDF
AWS初心者向けWebinar AWS上でのDDoS対策
Amazon Web Services Japan
PDF
RESTfulとは
星影 月夜
PDF
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Takahiko Ito
PDF
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
PDF
マルチテナントのアプリケーション実装〜実践編〜
Yoshiki Nakagawa
PPT
Cassandraのしくみ データの読み書き編
Yuki Morishita
PPTX
Azure Search 言語処理関連機能 〜 アナライザー、検索クエリー、辞書、& ランキング, etc
Yoichi Kawasaki
PDF
ニュースパスのクローラーアーキテクチャとマイクロサービス
mosa siru
PDF
SolrとElasticsearchを比べてみよう
Shinsuke Sugaya
PDF
Jokyo20110711
y-kobayashi
AWSメンテナンス ElastiCache編
Serverworks Co.,Ltd.
SQLチューニング入門 入門編
Miki Shimogai
pg_bigmと類似度検索
Masahiko Sawada
失敗から学ぶAWSの監視
株式会社オプト 仙台ラボラトリ
cyREST入門~RとCytoscapeのAPI連携~
Mitsunori Sato
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
DynamoDB設計のちょっとした技
Yoichi Toyota
今からでも大丈夫!Firebase入門
Tomoki Koga
PostgreSQLアーキテクチャ入門(INSIGHT OUT 2011)
Uptime Technologies LLC (JP)
アルゴリズムのイメージを擬人化する
AtCoder Inc.
AWS初心者向けWebinar AWS上でのDDoS対策
Amazon Web Services Japan
RESTfulとは
星影 月夜
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Takahiko Ito
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
マルチテナントのアプリケーション実装〜実践編〜
Yoshiki Nakagawa
Cassandraのしくみ データの読み書き編
Yuki Morishita
Azure Search 言語処理関連機能 〜 アナライザー、検索クエリー、辞書、& ランキング, etc
Yoichi Kawasaki
ニュースパスのクローラーアーキテクチャとマイクロサービス
mosa siru
SolrとElasticsearchを比べてみよう
Shinsuke Sugaya
Jokyo20110711
y-kobayashi
Ad
Viewers also liked
(20)
PDF
PostgreSQL監査
Ayumi Ishii
PPTX
Scaling MongoDB on AWS
Yasuhiro Matsuo
PDF
マイクロサービスバックエンドAPIのためのRESTとgRPC
disc99_
PPTX
PostgreSQL JSON型と Facebook APIを使ってwebアプリ開発をした話
Ayumi Ishii
PDF
Dev back
Michaël Bruniaux
PDF
Develipers.IO 2016 E-1 「AWS Configを使ったAWS環境の見える化」
morisshi
PPT
Gestão para a qualidade - um exemplo
IsabelSa
PPTX
Raspberry Pi를 이용한 얼굴 표정과 감정인식 시스템 개발
Hyunmin Kim
PPTX
Los Fármacos Drogas y Adicciones
Luis David Rosales Osuna
PDF
Hotel Del Coronado Custom Gifts by Classic Legacy
Classic Legacy Custom Gifts
PDF
MySQL 5.7 InnoDB 日本語全文検索(その2)
yoyamasaki
PDF
An overview of Amazon Athena
Julien SIMON
PDF
Phantom Type in Scala
Yasuyuki Maeda
PDF
ビーコンをつかうIoTアプリケーション
CRI Japan, Inc.
PDF
Optimize Your VMware SDDC with IBM Infrastructure
Paula Koziol
PDF
Impression of realm java
Ryutaro Miyashita
PDF
CAPとBASEとEventually Consistent
Yohei Yamamoto
PDF
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
Uptime Technologies LLC (JP)
PDF
Apache Hiveの今とこれから
Yifeng Jiang
PDF
JDV for Codemotion Rome 2017
Luigi Fugaro
PostgreSQL監査
Ayumi Ishii
Scaling MongoDB on AWS
Yasuhiro Matsuo
マイクロサービスバックエンドAPIのためのRESTとgRPC
disc99_
PostgreSQL JSON型と Facebook APIを使ってwebアプリ開発をした話
Ayumi Ishii
Dev back
Michaël Bruniaux
Develipers.IO 2016 E-1 「AWS Configを使ったAWS環境の見える化」
morisshi
Gestão para a qualidade - um exemplo
IsabelSa
Raspberry Pi를 이용한 얼굴 표정과 감정인식 시스템 개발
Hyunmin Kim
Los Fármacos Drogas y Adicciones
Luis David Rosales Osuna
Hotel Del Coronado Custom Gifts by Classic Legacy
Classic Legacy Custom Gifts
MySQL 5.7 InnoDB 日本語全文検索(その2)
yoyamasaki
An overview of Amazon Athena
Julien SIMON
Phantom Type in Scala
Yasuyuki Maeda
ビーコンをつかうIoTアプリケーション
CRI Japan, Inc.
Optimize Your VMware SDDC with IBM Infrastructure
Paula Koziol
Impression of realm java
Ryutaro Miyashita
CAPとBASEとEventually Consistent
Yohei Yamamoto
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012)
Uptime Technologies LLC (JP)
Apache Hiveの今とこれから
Yifeng Jiang
JDV for Codemotion Rome 2017
Luigi Fugaro
Ad
PostgreSQL画像データ収集・格納
2.
目次 問題意識 仮説 ターゲット 実装 まとめ
3.
問題意識 変化の激しい世の中において、常に技術を追いかけ 高いパフォーマンスが求められる 仕事でより高いパフォーマンスを上げるために、癒 しが必要 自宅のうさぎが癒し業をボイコット中
4.
仮説 うさぎ画像をみれば癒される!? googleうさぎ検索!!
6.
やりたいこと うさぎ検索結果から画像を抜き出す ↓ ローカルに画像を保存 ↓ PostgreSQLで画像情報を管理する!
7.
ターゲット 非営利目的での再利用が許可された画像に限定 取得した画像は、個人でただ、癒されるためだけに利 用
10.
↑このときのURLに検索条件が入っている!
12.
画像を自動で抜き出す 地道に正規表現でがんばる <img height="90" src="https://encrypted- tbn2.gstatic.com/images?q=tbn:ANd9GcTwTK9 5XZfQyU-HGdMSgxUy78nhw- XdpkcA3qwL0fv7sBJm-EOuZ1Nnicw" width="136"
alt="「うさぎ」の画像検索結果"> →リンクから、画像をローカルにダウンロード!
14.
画像をどうやって管理する? 方法は基本3つ 説明 検索性能 備考 bytea
PostgreSQLの型の 1つ。バイナリを保 存する。 △ データ量が多くなる と性能劣化。 ラージオブジェクト 大きなデータを扱 うための仕組み ◯ lo_import()などを使 う。 外部ファイル 画像自体はDBに保 存せず、画像への パスを保存。 ◯ 画像自体の更新は DBで管理できない。
15.
bytea vs large
Object https://www.microolap.com/products/connectivity/postgresdac/help/tipsandtrick s_byteavsoid.htm
16.
今回実施した手順 ラージオブジェクトのOID保存テーブルを作成 =# create table
image(object_id oid); ファイルからラージオブジェクトをimport =# insert into image values (lo_import('/home/postgres/1'));
17.
<?php $filename="https://www.google.co.jp/search?as_st=y&tbm=isch&hl=ja&as_q=%E3%81%86%E3%81% 95%E3%81%8E&as_epq=&as_oq=&as_eq=&cr=&as_sitesearch=&safe=images&tbs=sur:f#q=%E3%8 1%86%E3%81%95%E3%81%8E&as_st=y&hl=ja&tbs=sur:f,qdr:w&tbm=isch&imgrc=_"; $pattern = '/img
height=".*?" src=.*?alt="「うさぎ」の画像検索結果"/'; $html = file_get_contents($filename); $path = '/home/postgres/'; mb_language("Japanese"); $subject = mb_convert_encoding($html,'UTF-8','auto'); preg_match_all($pattern, $subject, $matched); for( $i = 0; $i < count($matched[0]) ; $i++){ $yobun = '/" width=".*?" alt="「うさぎ」の画像検索結果"/'; $yobun2 = '/img height=".*?" src="/'; $data = preg_replace($yobun, "", $matched[0][$i]); $data = preg_replace($yobun2, "", $data); $image = file_get_contents($data); file_put_contents($path.$i,$image); $con = pg_connect("dbname=postgres user=postgres"); $sql = "INSERT INTO image VALUES(lo_import('".$path.$i."'));"; pg_set_client_encoding($con, "UTF-8"); $res = pg_query($con,$sql); pg_close($con); }
18.
結果 画像フォルダがうさぎ画像でいっぱいに!! 今回の取り組みの結果、たとえオフラインでも、 googleが突然使えなくなっても手元にうさ画像があ る
19.
広がる夢 「常に最新のうさぎ画像」を集めるべく収集対象を 最新の画像に絞るという夢 cron等の自動実行により確実に収集するという夢 可愛いうささんだけ集めたいという夢
20.
おわり ZZZ
Download