忍者ブログ
個人HP After Cider の管理人、 ほねっとのブログです。 なのはプロジェクトとか大好きです。 八神はやてが大好きな管理人です。 コメント歓迎です!
[248] [247] [246] [245] [244] [243] [242] [241] [240] [239] [238]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

先端表現情報学特別講義Ⅴ

NHK放送技術研究所 八木信行先生
『映像コンテンツの検索・活用技術』

TV番組・映像コンテンツをもっと活用したい
 数百chの放送が24時間
 NHKアーカイブスには約六十万本の番組が保存
家庭でのHDD/DVD/BDなど
インターネット上の動画

⇒何をキーにして映像コンテンツの検索を行うか
 ・○○が××している映像
 ・映像よりも映像を説明するテキスト情報や意味を検索すると便利
 ☆しかし、映像に説明はほとんどついていない

画像をキーにした映像検索
 画像を与えて検索・画像の特徴を比較して類似画像検索などなど
  色・明るさ・輪郭・テクスチャ・数・配置・動き
 検索対象の意味を与えるのではなく、物理特徴を与える(☆意味を考えるのは人間)
 画像が無い時はスケッチを与えて検索
 最初から画像を分類して提示する

テキストをキーにした映像検索
 キーワードを与えて検索
 しかし・・・
  検索のための適切なキーワードが分からない(絵は浮かんでも名前が分からなかったり「インテンションギャップ」)
  多くの映像に説明テキストが付いていない
 クローズドキャプション(聴覚障害者向け字幕)
  NHKでは47.6%、在京民放キー5局は43.9%ついてる
 フォークその見―=Folk + taxsonomy:みんなで分類・タグ付け
  Flickr、Viddler、ニコニコ動画など
 ☆ただし、誤検出が多い
  画像を検索しているように見えるが、画像周辺にあるテキストを検索している。
  単純なキーワードマッチングで、意味を理解しているわけでない。
  字幕は映像と関係ないことをしゃべってることが多く、見てわかることは言わない

NHKアーカイブス
 さいたま新産業拠点SKIPシティーにある。
 放送済み番組が保存されている(六十万本以上)
 巨大なテープ倉庫
  サーバ化は規模・コスト面で不利(放送は16~20MbpsでOKだけど、スタジオ制作は125~250Mbpsにもなる)
  制作・送出がビデオテープ主体
  サーバへのデジタイズ時間が無い(1時間のテープはデジタル化に1時間かかる!間に合わない!)
 NHK内で保存コンテンツを検索可能(放送を自動デジタイズ化し、メタデータを付ける)
 試写も可能
  アーカイブスのオープン1年前から蓄積
  サーバ化された映像(MPEG4,500kbps)

放送コンテンツの活用
 再放送が中心
 多メディア展開(パッケージメディア(DVDなど)、本、ネット、モバイル、NHKオンデマンド、NHKデジタル教材、NHKクリエイティブライブラリ)
 他番組制作のための素材活用
  ただし、素材利用よりも事前リサーチや過去番組での扱われ方を調査する
  ☆意図を持って撮影された映像は使いにくい(自然風景などは使いやすい)
 外部へ販売
 ※コンテンツは自由に使えるわけではない
  権利関係が複雑で、再放送権は事後処理で可能。
  放送以外の再利用では新たな権利処理を事前に行う必要がある。
  古いものは権利情報が不十分

著作権者:作曲・作詞・脚本・制作会社・放送事業者
著作隣接権者:俳優・歌手・演奏社・レコード会社・放送事業者
権利を全部買いとろうとするといまの制作費ではとても足りない

メタデータ
 活用のキーとなるのは、メタデータ(データのためのデータ、映像内容についての情報)
 メタデータを使うことで、映像を探すよりも格段に速い検索が可能

 メタデータの内容
 管理情報:タイトルや放送日、制作者、権利者など
       放送業務と連動したシステム化(NHK:編成情報システム、TOPICS、ベアトス)
 物理情報:明るさや色などを計算機処理で自動付与
 意味情報:概要や出演者、キーワードなどを人手で入力する(手間がかかる、生への対応は困難、アーカイブスへの事後付与はコスト的に無理、計算機処理で自動付与できると便利…)

ベアトス:番組の企画や提案段階から制作・放送・アーカイブスの全過程を支援・管理する。その際にメタデータを入力し、管理する。

 

メタデータ規格
 Dublin Core(ISO 15836)
  最もシンプルなメタデータ規格
  正式名称 The Dublin Core metadata element set
  メタデータ規格では最も古いもの
  15種類のElementを決めているのみ
  DCMI(The Dubliin Core Metadata Initiative)が策定・保守・普及活動
  国立国会図書館のメタデータが準拠している

 MPEG-7規格
  Multimedia Content Discription Interface
  ISO/IEC 15938
  Part1~12まであり、仕様書は約2000ページに及ぶ
  信号レベルの特徴量(色や形状やテクスチャ、音だと波形やパワー、音色やメロディーなど)を扱うρレベル記述
  コンテンツの意味的内容・構造を記述するハイレベル記述

 しかし、MPEG-7は膨大すぎて、誰が導入するのかなどの課題で、普及がなかなか進まない!

 SMPTE規格
  Society of Motion Picture and Television Engineers
  メタデータは1800のKeyが登録される。しかし多すぎてなかなか普及しない
  ⇒DMS-1(Descriptive Metadata Scheme 1)やMXF(Material Exchange Format)などのファイルフォーマット規格が出てきた。
  
 SMPTEのコンテンツ識別ID
  UMID
   素材レベルでユニーク性を確保する識別子
  ISAN
   映像作品に対する識別子
  V-ISAN
   ISANに対して派生版(日本語吹き替えやテレビ放送版など)のバージョン番号を付加したもの

でした。

PR

コメント


コメントフォーム
お名前
タイトル
文字色
メールアドレス
URL
コメント
パスワード
  Vodafone絵文字 i-mode絵文字 Ezweb絵文字


トラックバック
この記事にトラックバックする:


忍者ブログ [PR]
カレンダー
11 2017/12 01
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
フリーエリア
最新CM
プロフィール
HN:
ほねっと
性別:
非公開
自己紹介:
ついったーはこちらです!
http://twitter.com/aftercider
バーコード
ブログ内検索
カウンター
アクセス解析