富士通の映像処理技術 - ネットワーク :...
TRANSCRIPT
2011年9月
株式会社富士通研究所
富士通の映像処理技術
Copyright 2011 FUJITSU LIMITED
H.264符号化変換技術
Copyright 2011 FUJITSU LIMITED
映像情報 メディア学会 テストチャート
“Sprinkling”
高画質化 アルゴリズム
ソフトウェアベース 符号化技術
映像伝送システム
AV機器向け 映像符号化LSI
業界トップクラスの 低消費電力・高画質
概要
最新の映像符号化標準H.264において、業界トップクラスの高画質化アルゴリズムを開発。
様々な映像を高品質に映像をH.264に変換する 製品(ソフト/ハード)を開発。
技術のポイント
人間の視覚特性の研究に基づき、業界トップクラスの高画質化を実現する高性能アルゴリズム。
複数のCPUによる最適な並列処理により、映像データファイルを実時間の数倍の速度でH.264に高速変換するソフトウェア技術。
映像の実時間伝送装置に向け、画質と低遅延化の最適化を実現するリアルタイム符号化技術。
用途・適用先例
モバイルからTVまで様々な端末に適したフォーマットに映像データを高速に変換するソフトサービス。
高品位・低遅延が求められる放送局向けのIP対応映像伝送システム(IP-9500シリーズ)。
コンシューマAV機器向け映像符号化LSI。
従来方式 (Conventional Method)
富士通方式 (Fujitsu’s Method)
1
Copyright 2011 FUJITSU LIMITED
蓄積 抽出 分散KVS
乗車 混雑
ペタバイト級 データ
イベント
大量イベント
土曜日
土曜日、乗車が多い駅は?
渋滞マップ作成
配車計画
土曜日、渋滞する道路は?
サーバ
・・・
大量かつ高頻度なデータ蓄積を多数サーバで分散
1000台規模のサーバで高速な集合演算(通信量最小化)
サーバ サーバ 蓄積しながら大量データを抽出
タグ
タグ付加
タグベースのデータ抽出技術
概要
ペタバイト級データに対する高速な蓄積・抽出 技術であり、蓄積時に追加的な情報をタグとして付加しそれを基に高速にデータを抽出
用途
大量のセンサー情報やシステムのログを蓄積し分析する際のデータ管理 例)タクシーのセンサー情報を基にしたタクシー配車計画など
技術ポイントと効果
サーバ間の通信量を最小化する集合演算機能を用いた高速なタグ検索
分散キーバリューストア(KVS)を採用することによりサーバ台数に応じて抽出性能がリニアに向上
データ蓄積時に付加するタグは任意に選べるため目的に合わせた事前定義が不要
今後の展開
センサー情報の蓄積・活用基盤への適用を検討中
2
Copyright 2011 FUJITSU LIMITED
カット 頻度
音声 周波数
無音 区間 色レイ
アウト 音響
盛上り
ダイジェスト 映像
カメラモーション推定
ズーム
手振れ
ハイライトシーン抽出
ゴールシーン等
特徴抽出器
ダイジェスト 映像生成
さまざまな ジャンルの映像
スポーツ番組
監視映像
音響
映像
映画
ホームビデオ
ダイジェスト映像生成技術
概要
さまざまなジャンルの映像から見どころとなるシーンだけを抽出し、映像の内容を短時間で把握できるダイジェスト映像を自動生成
用途・応用例
ダイジェスト映像生成を使用した映像配信・共有サービス
ホームビデオの編集支援
監視カメラ映像からの不法投棄シーンの検索
現場作業映像からの映像形式の作業マニュアル自動生成
技術ポイントと効果
映像中の動画や音響の特徴を多様な観点から分析可能とする200種類以上の特徴抽出器を開発
特徴抽出器の組合せによりさまざまなジャンルのダイジェスト映像の効率的な自動生成が可能
今後の展開
映像の共有/配信サービスへの適用を計画中
冗長シーン抽出
音声 or
画像
映像
音声/画像変化が少ない区間
3
Copyright 2011 FUJITSU LIMITED
補正前 補正後
明
暗
位置
反射率成分
明るさ
照明成分
画像
原画像
明
暗
位置
明るさ
拡大
拡大
圧縮
圧縮
処理結果
視認性 向上処理
視認性向上の仕組み
適用先例
視認性向上処理技術
概要
明暗のコントラストの強い、逆光・夜間画像の視認性向上
暗部階調を選択的に明るく自動補正/適正明度領域は適正のまま
技術のポイント
独自の高速画像フィルタで画像成分を「反射率成分」と「照明成分」に分解
※ 画像は、反射率成分(そのものの色)×照明光(あたっている光の強さ)
自然さを維持して「反射率成分を拡大」、「照明成分を圧縮」し視認性を向上
※ 逆光や夜間のハレーションでの視認性低下は「照明の偏り」が原因
用途・適用先例
デジタルカメラや携帯電話、ビデオカメラの 逆光補正機能(静止画・動画/ハード実装・ソフト実装)
車載カメラ、監視カメラ映像の視認性向上
新聞・印刷向け画像システム
4
Copyright 2011 FUJITSU LIMITED
上場へ
テロップ 領域抽出
“ABC信託上場へ”
文字認識
色分解
白成分 赤成分
ABC信託
映像検索を効率的に行うテロップ認識技術
富士通独自の多色テロップ認識技術により、
複雑な背景を持つ映像中のテロップ文字を高精度で認識可能
技術の特徴
複雑な背景映像からの高精度テロップ抽出
色分解画像を利用した多色テロップ認識
多種多様なテロップを認識可能
5
Copyright 2011 FUJITSU LIMITED
署名付加 5637868 3083676 9307212 8721317 7981663 0424592
コマ毎の特徴情報 (メッセージダイジェスト)
計算
5637868 7981663 カット編集時に 再度署名付加
切り抜き映像 電子署名が有効 ⇒各作業者の 特定も可能
元映像
参考資料として見せたいコマと 電子署名付きの特徴情報を
セットで公開して比較
5637868 7981663
5637868 7981663
一致
特許出願中 デジタル映像の原本性保証技術
切り抜き映像が元画像の一部であることを保証可能
各コマの特徴情報と電子署名をセットで管理、コマの連続性も保証
撮影者署名
切り抜き者
署名
6
Copyright 2011 FUJITSU LIMITED
e-learning教材、動画マニュアルの 音声ナレーション
道路交通情報、 防災情報の放送
午前8時30分現在の、 高速道路情報をお知らせします。
情報セキュリティについて勉強しましょう。 現代社会には、個人情報を含む・・・。
発話リズム制御モデル
テキスト
橋を渡る。 端を渡る • 人が日本語を話す際に、
無意識に作り出すリズムを モデル化
大規模 音声波形データベース
橋を
端を
箸を
大規模 音声波形データベース
• 様々なイントネーションを網羅
• 使用頻度の高い単語や 文例を数万フレーズ格納
合成音声
橋を渡る。 端を渡る。
音声合成技術
概要
テキストを入力するだけで、明瞭さと自然性を兼ね備えた、プロのナレーションに迫る読み 上げ音声に変換
従来コストをかけてきた、ナレータ音声の 収録が一切不要
用途・応用例
e-learning教材などの音声コンテンツ作成
映像のナレーション作成
道路交通情報や防災情報の放送
コールセンターの音声自動応答
技術ポイント・効果
【独自の発話制御モデル】 プロのナレーターに匹敵する人間らしい流暢な語り口を実現
【大規模音声データベース】 人間の声と比べて不自然に感じることがない滑らかな音声を実現
製品化
(株)アニモから製品提供中(FineSpeech Ver.3)
渡る
渡る
歩道を
海を
7
8 Copyright 2010 FUJITSU LIMITED