忍者ブログ
個人HP After Cider の管理人、 ほねっとのブログです。 なのはプロジェクトとか大好きです。 八神はやてが大好きな管理人です。 コメント歓迎です!
[1] [2] [3] [4] [5] [6]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

こんにちは、ほねっとです∩( 'ヮ' 三 'ヮ' )∩

今回のコミックマーケット80にむけた特設ページを
開設しました。

logo.jpg



http://www.aftercider.com/comicmarket80/

新刊情報やゲスト情報などに関しては、こちらのページで
ご確認ください!∩( 'ヮ' 三 'ヮ' )∩

では、会場でお待ちしております!
PR
こんにちは、ほねっとです。

コミックマーケット80にサークル参加します!
いま鋭意執筆中で、詳細は近日公開しようと思います。

もう少々お待ちくださいまし!

スペースは
三日目
東 リ14-b Aftercider です!

∩( 'ヮ' 三 'ヮ' )∩

特徴軸 
φ1,φ2,,,,φn φj=(φj1 φj2 ... φjn)'

直行性φi'φj = 1(if i=j or 0 (i≠j)

1)PCA 最良近似 n次元→m次元

スペクトルx=Σαikφk

☆このあとはPCAのやり方

2)Fisherの判別関数
LDA(Linear Discriminant Analsis 線形判別分析)

n次元の特徴空間の2クラス→1次元の実数値に写像して識別する
クラスω1に属するサンプル数 n1
クラスω2に属するサンプル数 n2

線形変換
y=A'x A:n×1の重みベクトル

識別にもっともよい軸を得る線形変換 重みベクトルを求める
クラスωiの点のAによる変換の集合をyi

平均ベクトルμi = 1/ni Σx
変換軸上での平均 μ~i = 1/ni Σy = 1/ni ΣA'x = A'μi

変換した1次元軸上でのクラス内分散
S~i = Σ(y-μ~i)^2 クラス内分散が小さく、クラス間の平均値間の距離が大きい

Fisherの関数
http://d.hatena.ne.jp/aidiary/20100425/1272158587
の4.25らへんから
J_s(A) = |μ~_1 - μ~_2|^2 / (S~_1^2 - S~_2^2)
具体的に求めると、
S1 = Σ(x-μ_i)(x-μ_i)' クラス内変動行列

読めない…

多重判別分散(MDA)
月曜4限 パターン認識/パターン識別
石塚 満 教授

シラバス
画像パターンだけに限らず,データやテキストも対象にして認識/識別する
汎用性の高い基礎となる統計的手法を中心にして学ぶ.事例データからの
識別器の設計は学習であることから,統計的学習の基礎も含む.データ
マイニングとも部分的に関係する.

参考図書
1)R. O. Duda, P.E. Hart and D. G. Stork:
Pattern Classification -- 2nd Edition,
John Wiley & Sons, 2001.
[邦訳] 尾上守夫(監訳):パターン識別,新技術コミュニケーションズ,2001.

2)C. M. Bishop: Pattern Recognition and Machine Learning,
Springer-Verlag, 2006.
[邦訳] 元田浩,他(監訳):パターン認識と機械学習(上,下),
 シュプリンガー・ジャパン,2007.

3)P. N. Tan, M. Steinbach and V. Kumar: Introduction to Data Mining,
Addison Wesley, 2006.

評価方法
出席とレポート
出席半分以上ないと単位は来ない



パターンとは?
視覚的パターン:図形・画像・映像・3D物体・シーン
ほかには:波形・音声・データセット・テキスト・Webページなど

人間(動物)
  自分にとって危険かどうかを見分ける=生存するうえで必須

識別⇒記号化⇒言語

認識(recognition) … 識別・分類(classification) + 理解(understand)←部分要素間の(空間的)関係構造まで把握

パターン集合からカテゴリーに対応付けする
(類似度やパターン間の距離を使う)
画像1


文脈依存性 OCRで「A」のてっぺんの部分が離れてた場合: T☆EならTHE 、 C☆TならCAT
みたいな


0.直接的パターンマッチング
 1)標準的パターンとの相互相関係数(テンプレートマッチング)

 一般マッチング尺度 標準パターン:f 未知入力パターン:g
 ∬|f-g|^2=∬f^2 - 2∬fg + ∬g^2 のfgがマッチングの尺度になる

 2)定点サンプリング
 重要な点でのみマッチング

 3)ゾンデ法(手書き数字認識)
 定点から検出線をだし、図形要素が乗る検出線でマッチング(若干の柔軟性)

 4)一次系列の場合
  音声⇒HMM(隠れマルコフモデル)
 文字系列
 例:f1=cbabdbb テンプレート
   g=cbbabbdb 入力パターン

 パターン間の距離:編集距離(代入・削除・挿入の回数)
 効率的な距離計算法DP(Dynamic Programming)


データマイニングのTop10アルゴリズム
1 C4.5
2 K-Means
3 SVM
4 Apriori
5 EM
6 PageRank
7 Ada Boost
8 kNN
9 Naive Bayes
10 CART


1.統計パターン認識(Statistical Pattern Recognition)
 入力→[前処理]→[特徴抽出]→[識別・分類]→出力・クラス(ω1,ω2)

 前処理:検出・セグメンテーション・など
 特徴抽出:x=(x1 x2 x3…)' 特徴ベクトルを作る
  どんな初期特徴がいいのかの理論がなく、設計者の直観に頼るところが大きい
  抽出した特徴の選択・組み合わせ変換については理論あり

特徴量の例
 面積・周囲長・円形度・長軸長・輪郭のフーリエ成分・2Dのフーリエ成分・平均濃度・平均カラー
テキスト文章の時
 単語ベクトル(Bag-of-Words(Stock Words(the,a,isなど)を除く))・形態素解析
 ・steming(-es -edなど取り除く)を行う・単語のn-gramをとる・係り受け関係など


忍者ブログ [PR]
カレンダー
06 2017/07 08
S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
フリーエリア
最新CM
プロフィール
HN:
ほねっと
性別:
非公開
自己紹介:
ついったーはこちらです!
http://twitter.com/aftercider
バーコード
ブログ内検索
カウンター
アクセス解析