忍者ブログ
個人HP After Cider の管理人、 ほねっとのブログです。 なのはプロジェクトとか大好きです。 八神はやてが大好きな管理人です。 コメント歓迎です!
[236] [235] [234] [233] [232] [231] [230] [229] [228] [227] [226]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

第6回「コンピュータビジョン最先端ガイド」勉強会に参加してみました。

CVIMチュートリアル勉強会
http://groups.google.co.jp/group/cvim_tutorial/web/%E5%A4%96%E9%83%A8%E5%90%91%E3%81%91%E5%85%AC%E5%BC%8F%E3%83%9A%E3%83%BC%E3%82%B8

参加者のATND
http://atnd.org/events/7588

USTREAM(録画もあり?)
http://www.ustream.tv/channel/learncv



対応点探索による画像マッチング方式

対応点の探索では128次元の特徴量に対してユークリッド距離を尺度としてはかる

ソフト例

Autostitch 普通の画像を何枚かとると自動で特徴点でつないでパノラマ画像ができるアプリケーション。
http://cvlab.epfl.ch/~brown/autostitch/autostitch.html

対応点はSIFTで探している。
対応点を曲げる処理はどうしてる?(lensひずみや円筒画像の時)
>Homography / Homographiesとかで処理する。
Homography
http://en.wikipedia.org/wiki/Homography

>RANSACでの一致を探す

英語では「Image  stitching」、「Image mosaic」というキーワード

デジカメのスウィングパノラマとかもこの処理かもしれない

特定画像を用いた画像認識
 予め参照画像を用意して、入力画像の中から探す処理。
 ただし、入力画像内に参照画像が複数ある可能性あり。

 >一般化ハフ変換をおこなう
 >>スケールと回転が分かるのでこの方向にオブジェクトがあるだろうという投票を行い、そのピークをつかう

 >中心に投票する方法
 >>同じ画像があった場合でも、特徴点の方向、スケールなどを基に、参照画像での中心位置を参照・投票すれば自動的にクラスタリングできる

特徴点追跡
・KLT法
 特徴点で追跡しやすい点を見つけて使う。物体は剛体の平行移動に仮定
・Mean-Shift法
 非剛体において、KLTよりも追跡がりょうこうだった。
 特徴点の追跡
 >Δx、Δs(スケール)を測ることで、xyzの移動を追跡する

画像分類
・Bag-of-Keypoints
 学習データとして、SIFT特徴量のインデックスだけもつ
 >そのベクトルのヒストグラムで識別器を学習し、判別する
 ベクトル量子化した特徴量:visual word

 ☆文章検索の応用が利くようになる
 検索エンジンでの単語の出現率みたいなのをつかえる。

SIFTのライセンス・特許的な話

 Evolution RoboticsにはSIFTライセンスが付いてきたりするらしい
 http://www.evolution.com/

 デビッドロウ(David Lowe)
 http://www.cs.ubc.ca/~lowe/

 ライセンスに関して学術的な用途に関してはOK
 OpenCVを製品にそのまま突っ込むのはとっても危険


SIFTの拡張

 PCA-SIFT
  キーポイントの取り方はSIFTと一緒
  41x41の画像にりサンプリングして勾配をもとめ、39x39x2の3042次元を使う
  PCA(主成分分析)を行い、次元圧縮
  次元が小さいので高速化ができる

 >SURFもPCA-SIFTも論文では「ロバスト(キリッ」って書いてるけどたまたまなことも多いからあんまり信用しないで・・・

 GLOH
  キーポイントの取り方はSIFTと一緒
  特徴量の取り方がSIFTとちがって極座標的なとり方を行う。
  16方向×17=272次元の特徴量をつかう
  その後次元圧縮をおこない、128次元にする。

 SURF
  かなりの高速化ができる
  DoGの計算をHessian-Laplace検出器を近似したBoxフィルタを使って近似計算する

 U-SURF
  回転の計算は行わないSURFで高速化
  実験によると±15度のロバスト性がある

 OpenSURF
  解説論文。 http://www.cs.bris.ac.uk/Publications/Papers/2000970.pdf



カメラキャリブレーションの話
 この前の画像処理の授業で色々あったのでその話ですね!
 外部パラメータとか内部パラメータとかレンズひずみとか
 【第1回】視覚情報処理論・コンピュータビジョン
 http://javen.blog.shinobi.jp/Entry/229/

 キャリブレーションではチェッカーボードをよくつかう
 でもサッカーフィールドなどのでかい場所だと地獄のキャリブレーションになってしまう。
 >SIFTの登場

 Bundle Adjustmentなどでいけるはず!
 Bundle Adjustment
 http://www.eml.hiroshima-u.ac.jp/member/staff/tamaki/memo/index.php?bundle%20adjustment
 多数の画像からのシーン復元 (n-view geometry)
 http://nekojunky.blog96.fc2.com/blog-entry-74.html

 SIFTはパターン認識にも使える技術であるが、本来、「対応点を探す」という設定なのでGeometry関連でとても重要な地位にある技術!


Randomized Treesの話
 決定木+アンサンブル+ランダム学習
 類似手法 AdaBoost
 別名
  Random Forests
  Randomized Forests
  Ferns

 SIFTと違うところは射影変換が可能
 画像から領域をセグメンテーションして分類できる(※リアルタイムで!)

 文字認識、visual wordクラスタリング、行動認識や姿勢推定にも使われる。

メリット
 高速な学習
 教師信号のおノイズに強い
デメリット
 オーバーフィッティング

マルチクラス識別器
 SVM
 Boosting
 Randomized Treesとかあるよ

学習アルゴリズム
 決定木を作る
  学習サンプル(カテゴリとあたい)がある
  二分木で深さをある程度決めておく
  木をいくつか作っておく。
  木に突っ込んであげてどれにたどり着くか
 
 サンプル集合をT個のサブセットに分ける(完全にランダムで)
 学習に利用されないサンプルや、サブセット間でのサンプルの重複は許容
 (Randomized Treesはパラメータが多い)

 分木ノードの決定方法
 一般的には二つの方法がとられる
  ○情報量を基準として選択
  単純にランダムで選択

 基本的に設計は自由
  Semantic TextonForestsではしきい値を利用
  他には特徴量の大小関係
  
-ブログ途中で消えちゃった-

RandomizeTreeは40度傾けても行けるけどそれ以上はきつい
>その改良として、ViewPointの変化とKeyPointの変化の2段階の決定木を作った
予め視点でViewPointクラスタリングを行う

Fernsはメモリ容量を削減するために決定木を一本にする

識別器でおいて分岐させていくのではなく、判別を011010みたいなかんじで01判別してシリアライズする
で、そのシリアライズされたのを基に、参照データでのひかくをおこなってマッチング

PR

コメント


コメントフォーム
お名前
タイトル
文字色
メールアドレス
URL
コメント
パスワード
  Vodafone絵文字 i-mode絵文字 Ezweb絵文字


トラックバック
この記事にトラックバックする:


忍者ブログ [PR]
カレンダー
10 2017/11 12
S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
フリーエリア
最新CM
プロフィール
HN:
ほねっと
性別:
非公開
自己紹介:
ついったーはこちらです!
http://twitter.com/aftercider
バーコード
ブログ内検索
カウンター
アクセス解析