忍者ブログ
個人HP After Cider の管理人、 ほねっとのブログです。 なのはプロジェクトとか大好きです。 八神はやてが大好きな管理人です。 コメント歓迎です!
[1] [2] [3] [4] [5] [6]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

特徴軸 
φ1,φ2,,,,φn φj=(φj1 φj2 ... φjn)'

直行性φi'φj = 1(if i=j or 0 (i≠j)

1)PCA 最良近似 n次元→m次元

スペクトルx=Σαikφk

☆このあとはPCAのやり方

2)Fisherの判別関数
LDA(Linear Discriminant Analsis 線形判別分析)

n次元の特徴空間の2クラス→1次元の実数値に写像して識別する
クラスω1に属するサンプル数 n1
クラスω2に属するサンプル数 n2

線形変換
y=A'x A:n×1の重みベクトル

識別にもっともよい軸を得る線形変換 重みベクトルを求める
クラスωiの点のAによる変換の集合をyi

平均ベクトルμi = 1/ni Σx
変換軸上での平均 μ~i = 1/ni Σy = 1/ni ΣA'x = A'μi

変換した1次元軸上でのクラス内分散
S~i = Σ(y-μ~i)^2 クラス内分散が小さく、クラス間の平均値間の距離が大きい

Fisherの関数
http://d.hatena.ne.jp/aidiary/20100425/1272158587
の4.25らへんから
J_s(A) = |μ~_1 - μ~_2|^2 / (S~_1^2 - S~_2^2)
具体的に求めると、
S1 = Σ(x-μ_i)(x-μ_i)' クラス内変動行列

読めない…

多重判別分散(MDA)
PR
月曜4限 パターン認識/パターン識別
石塚 満 教授

シラバス
画像パターンだけに限らず,データやテキストも対象にして認識/識別する
汎用性の高い基礎となる統計的手法を中心にして学ぶ.事例データからの
識別器の設計は学習であることから,統計的学習の基礎も含む.データ
マイニングとも部分的に関係する.

参考図書
1)R. O. Duda, P.E. Hart and D. G. Stork:
Pattern Classification -- 2nd Edition,
John Wiley & Sons, 2001.
[邦訳] 尾上守夫(監訳):パターン識別,新技術コミュニケーションズ,2001.

2)C. M. Bishop: Pattern Recognition and Machine Learning,
Springer-Verlag, 2006.
[邦訳] 元田浩,他(監訳):パターン認識と機械学習(上,下),
 シュプリンガー・ジャパン,2007.

3)P. N. Tan, M. Steinbach and V. Kumar: Introduction to Data Mining,
Addison Wesley, 2006.

評価方法
出席とレポート
出席半分以上ないと単位は来ない



パターンとは?
視覚的パターン:図形・画像・映像・3D物体・シーン
ほかには:波形・音声・データセット・テキスト・Webページなど

人間(動物)
  自分にとって危険かどうかを見分ける=生存するうえで必須

識別⇒記号化⇒言語

認識(recognition) … 識別・分類(classification) + 理解(understand)←部分要素間の(空間的)関係構造まで把握

パターン集合からカテゴリーに対応付けする
(類似度やパターン間の距離を使う)
画像1


文脈依存性 OCRで「A」のてっぺんの部分が離れてた場合: T☆EならTHE 、 C☆TならCAT
みたいな


0.直接的パターンマッチング
 1)標準的パターンとの相互相関係数(テンプレートマッチング)

 一般マッチング尺度 標準パターン:f 未知入力パターン:g
 ∬|f-g|^2=∬f^2 - 2∬fg + ∬g^2 のfgがマッチングの尺度になる

 2)定点サンプリング
 重要な点でのみマッチング

 3)ゾンデ法(手書き数字認識)
 定点から検出線をだし、図形要素が乗る検出線でマッチング(若干の柔軟性)

 4)一次系列の場合
  音声⇒HMM(隠れマルコフモデル)
 文字系列
 例:f1=cbabdbb テンプレート
   g=cbbabbdb 入力パターン

 パターン間の距離:編集距離(代入・削除・挿入の回数)
 効率的な距離計算法DP(Dynamic Programming)


データマイニングのTop10アルゴリズム
1 C4.5
2 K-Means
3 SVM
4 Apriori
5 EM
6 PageRank
7 Ada Boost
8 kNN
9 Naive Bayes
10 CART


1.統計パターン認識(Statistical Pattern Recognition)
 入力→[前処理]→[特徴抽出]→[識別・分類]→出力・クラス(ω1,ω2)

 前処理:検出・セグメンテーション・など
 特徴抽出:x=(x1 x2 x3…)' 特徴ベクトルを作る
  どんな初期特徴がいいのかの理論がなく、設計者の直観に頼るところが大きい
  抽出した特徴の選択・組み合わせ変換については理論あり

特徴量の例
 面積・周囲長・円形度・長軸長・輪郭のフーリエ成分・2Dのフーリエ成分・平均濃度・平均カラー
テキスト文章の時
 単語ベクトル(Bag-of-Words(Stock Words(the,a,isなど)を除く))・形態素解析
 ・steming(-es -edなど取り除く)を行う・単語のn-gramをとる・係り受け関係など
安藤広志先生
ATRメディア情報科学研究所 認知ダイナミクス研究所
NICT(情報通信研究機構)ユニバーサルメディア研究センター

ATR:Advanced Telecommunication Research Institute International

専門
 視覚の計算モデル
 心理物理実験
 脳科学イメージング

おすすめの本
 Vision, D. Marr著 乾・安藤訳

情報社会と人間
 情報技術に対する期待とリスク
 *期待・可能性
  [超]臨場感情報の伝達
  ・高精細・立体映像・音響伝達
  ・多感覚の伝達
   立体映像音響放送・通信
   多感覚訓練・教育システム
   高臨場感会議・懇親システム
   五感遠隔協調システム
   遠隔医療・診療システム
   五感ネットショッピング
 *リスク・危険性
  伝達される情報は安全か
   身体器官・脳に対する安全性
    AVATORをみて、3Dメガネがつらくてはずしてしまう人
    映像が手前に飛び出して来た時に、眼球の向き(輻輳)は寄り目方向(手前を見る方向)にうごくが、目のピントはスクリーン位置に固定されたままという矛盾が生じる。
   3Dをずっと研究している人は慣れているから平気で出来るが、そういうのに慣れていない人は疲れてしまうことがある。
  コンテンツの質の問題
   低質の情報に振り回されるリスク
    画面の枠で切れてしまう3Dとか、雑なポリゴンや3D表示技術
  情報セキュリティ

 安全性・危険性について、調査を行う必要がある
  ☆しかし、どうやって調査を行うか?
  直接聞いたところで信頼性のあるデータは取れない
  こういう部分を調査する研究を行っている。

超臨場感コミュニケーションの研究
 NICT
  ├超臨場感基盤グループ(小金井) 物理的に忠実な映像・音響を目指す
  └超臨場感システムグループ(けいはんな研究所) 人間にとって最適化された臨場感実現する

超臨場感システムのプロトタイプを作っていく

裸眼立体視のディスプレイの裏事情
 東芝とかが作った
 でも、多分ちょっと売れてすぐ収まるという予想
  ・見るための制約が多すぎる 視点数が少ない・横方向のみの視差など

大画面裸眼立体ディスプレイ
 プロジェクタアレイ(63台)を並べて特殊なスクリーンに投影

☆この大画面3Dディスプレイが自動車業界に求められている!なぜ?
 自動車デザインのモックアップを作るコスト・時間を省きたいため!(大画面だから等身大のものができる)

3D映像作るのも大変
 視点が63個あれば、63回レンダリングしなきゃいけない
 実写動画だと、63視点必要←NICTではカメラアレイ30台で、カメラの間の画像を作り出して63視点作る。
  ☆カメラの個体差の調整が非常に大変らしい。
  再生するのにもメモリが足りないことがあるらしいww

手持ち箱型裸眼立体ディスプレイ "gCubik"

インテグラル方式による光線制御

テーブル型裸眼立体ディスプレイ "fVisiOn"

テーブルの上に3Dオブジェクトが浮かび上がっているように見える!
360度はまだ達成できてなくて、現状は130度程度(原理的にはできる)
テーブルの下に小型プロジェクタを100台以上配置して、多数の光線を作り出す。
新しく開発した円錐状の光学素子を用いて現実に近い光線群を作りだす。
☆なんでいまは130度なんだろ?
 →プロジェクタの数が問題だから数あればできるはず。

多感覚interactionシステム
四感覚(視覚聴覚触覚嗅覚)の多感覚interaction技術開発



音を付けるところがちょっと他にはない
 物体に触れるとその材質特有の接触音がする&触り方に応じて音が変化&HRTF畳みこみによって立体音響提示
 ☆かつ、実時間!!←ここが大事
 ☆コツとしては、叩いているのか擦っているのかを判定してから音の生成をするのではなく、接触したら両方の音を生成し始め、生成が終わる前に叩いてるのか擦っているのかの判定が終わるのでどちらかを再生することで再生を速めている。

匂いを単に出しているだけだと部屋に充満してしまう&人が順応してしまう
 特許出願中の技術で鼻に向けてピンポイントに出したりとめたりして制御している

人の把持感覚特性に基づいた把持感覚提示デバイス
 把持感覚は加速度が大事
  ワイヤーで把持デバイスを引っ張るとワイヤの伸び縮みがあるので柔らかさを感じてしまうらしい
 触った時に音が出ると、音によって触った時の堅さの感じが違ってくる。


立体音響技術
 HRTFのはなし
  音が立体的に聞こえるのは音が頭や耳介で反射・回折するからで、この音の周波数特性をHRTFという
  HRTFは測定するのが大変
  HRTFを測定せずに、個人の耳介形状などから推定する技術の確立を目指す
 →高精度の音場シミュレータを開発した

 立体音場シミュレータを用いたところ、耳介形状モデル("耳"字モデル)に近似できることが分かった

広視野3D映像が脳に与える効果
 MRIで脳活動を撮りながらいろんな広さの視野の3D映像を見せる
 →視野が広がっていくほど活動している脳の範囲が広がる

先端表現情報学特別講義Ⅴ

超臨場感システム NICT井ノ上先生
http://www2.nict.go.jp/x/x152/index.html
要素技術
 立体映像
 立体音響
 触覚
 心理評価などなど・・・

ユニバーサルコミュニケーションを実現する技術
 安全・信頼・共感・感動の想像
 自然な表現・伝達
 壁の超越
 ユニバーサルコミュニケーションに関する調査研究会(2005.12)
 http://www.soumu.go.jp/main_sosiki/joho_tsusin/policyreports/chousa/universal/index.html

ユニバーサルメディア研究センター
 http://www2.nict.go.jp/x/x152/index.html
 “見る、聞く、触れる、香る”あなたのそばに超臨場感環境を実現!
 立体映像・立体音響・多感覚インタフェース技術・知覚や認知メカニズムの解明

超臨場感とは
 五感情報をできるだけ物理的に忠実に取得・伝達・再生することで、あたかもその場にいるような高い臨場感の提示。
 超高臨場感の実現
 時空間を超えるコミュニケーション手段の追及
 感覚特性を考慮して、人間に適した臨場感の実現

社会的な貢献
 ☆物理的に忠実な再現
 異放射指向性スピーカ
 電子ホログラフィ
 ☆人間に最適化された臨場感の生成
 大画面裸眼立体ディスプレイ
 多感覚インタフェース
 臨場感の客観的評価技術

研究目標
 環境:場・雰囲気の生成→遠隔地のリアルな体験共有
 人:人の気配の生成→遠隔コミュニケーションの促進
 物:物の操作・感触→モノを介したインタラクション
 認知メカニズムの解明:臨場感評価指標の策定・多感覚統合のメカニズム・臨場感の測定解析技術

取り組んでいる立体ディスプレイ
 大画面
 テーブル
 手持ち箱型

立体映像技術を取り巻く環境
 3度目の正直(10年に一回ずつ、ブームはあった)
 今回はテレビ放送などもあり、かなり強いブーム
 ヨーロッパや韓国の国家プロジェクト
  EU FP6プロジェクト、FP7プロジェクト
 日本では各企業・研究機関で行われている
 ☆いまは大画面化・高解像度化・裸眼立体視の研究

現在の立体映像ディスプレイの課題
 視点位置ごとに違う映像を届ける必要
  →視点が9個(3x3)あれば、900万画素のディスプレイを使ってみた場合、100万画素のディスプレイに見えてしまう。

 解決するための方法はいろいろ提案
  大量のプロジェクタ→スクリーン→ユーザ:900万画素のプロジェクタを9台並べれば、2700万画素になる。
 



忍者ブログ [PR]
カレンダー
05 2017/06 07
S M T W T F S
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30
フリーエリア
最新CM
プロフィール
HN:
ほねっと
性別:
非公開
自己紹介:
ついったーはこちらです!
http://twitter.com/aftercider
バーコード
ブログ内検索
カウンター
アクセス解析