富士通の映像処理技術 - ネットワーク :...

9
2011年9月 株式会社富士通研究所 富士通の映像処理技術 Copyright 2011 FUJITSU LIMITED

Upload: others

Post on 09-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

2011年9月

株式会社富士通研究所

富士通の映像処理技術

Copyright 2011 FUJITSU LIMITED

Page 2: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

H.264符号化変換技術

Copyright 2011 FUJITSU LIMITED

映像情報 メディア学会 テストチャート

“Sprinkling”

高画質化 アルゴリズム

ソフトウェアベース 符号化技術

映像伝送システム

AV機器向け 映像符号化LSI

業界トップクラスの 低消費電力・高画質

概要

最新の映像符号化標準H.264において、業界トップクラスの高画質化アルゴリズムを開発。

様々な映像を高品質に映像をH.264に変換する 製品(ソフト/ハード)を開発。

技術のポイント

人間の視覚特性の研究に基づき、業界トップクラスの高画質化を実現する高性能アルゴリズム。

複数のCPUによる最適な並列処理により、映像データファイルを実時間の数倍の速度でH.264に高速変換するソフトウェア技術。

映像の実時間伝送装置に向け、画質と低遅延化の最適化を実現するリアルタイム符号化技術。

用途・適用先例

モバイルからTVまで様々な端末に適したフォーマットに映像データを高速に変換するソフトサービス。

高品位・低遅延が求められる放送局向けのIP対応映像伝送システム(IP-9500シリーズ)。

コンシューマAV機器向け映像符号化LSI。

従来方式 (Conventional Method)

富士通方式 (Fujitsu’s Method)

1

Page 3: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

Copyright 2011 FUJITSU LIMITED

蓄積 抽出 分散KVS

乗車 混雑

ペタバイト級 データ

イベント

大量イベント

土曜日

土曜日、乗車が多い駅は?

渋滞マップ作成

配車計画

土曜日、渋滞する道路は?

サーバ

・・・

大量かつ高頻度なデータ蓄積を多数サーバで分散

1000台規模のサーバで高速な集合演算(通信量最小化)

サーバ サーバ 蓄積しながら大量データを抽出

タグ

タグ付加

タグベースのデータ抽出技術

概要

ペタバイト級データに対する高速な蓄積・抽出 技術であり、蓄積時に追加的な情報をタグとして付加しそれを基に高速にデータを抽出

用途

大量のセンサー情報やシステムのログを蓄積し分析する際のデータ管理 例)タクシーのセンサー情報を基にしたタクシー配車計画など

技術ポイントと効果

サーバ間の通信量を最小化する集合演算機能を用いた高速なタグ検索

分散キーバリューストア(KVS)を採用することによりサーバ台数に応じて抽出性能がリニアに向上

データ蓄積時に付加するタグは任意に選べるため目的に合わせた事前定義が不要

今後の展開

センサー情報の蓄積・活用基盤への適用を検討中

2

Page 4: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

Copyright 2011 FUJITSU LIMITED

カット 頻度

音声 周波数

無音 区間 色レイ

アウト 音響

盛上り

ダイジェスト 映像

カメラモーション推定

ズーム

手振れ

ハイライトシーン抽出

ゴールシーン等

特徴抽出器

ダイジェスト 映像生成

さまざまな ジャンルの映像

スポーツ番組

監視映像

音響

映像

映画

ホームビデオ

ダイジェスト映像生成技術

概要

さまざまなジャンルの映像から見どころとなるシーンだけを抽出し、映像の内容を短時間で把握できるダイジェスト映像を自動生成

用途・応用例

ダイジェスト映像生成を使用した映像配信・共有サービス

ホームビデオの編集支援

監視カメラ映像からの不法投棄シーンの検索

現場作業映像からの映像形式の作業マニュアル自動生成

技術ポイントと効果

映像中の動画や音響の特徴を多様な観点から分析可能とする200種類以上の特徴抽出器を開発

特徴抽出器の組合せによりさまざまなジャンルのダイジェスト映像の効率的な自動生成が可能

今後の展開

映像の共有/配信サービスへの適用を計画中

冗長シーン抽出

音声 or

画像

映像

音声/画像変化が少ない区間

3

Page 5: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

Copyright 2011 FUJITSU LIMITED

補正前 補正後

位置

反射率成分

明るさ

照明成分

画像

原画像

位置

明るさ

拡大

拡大

圧縮

圧縮

処理結果

視認性 向上処理

視認性向上の仕組み

適用先例

視認性向上処理技術

概要

明暗のコントラストの強い、逆光・夜間画像の視認性向上

暗部階調を選択的に明るく自動補正/適正明度領域は適正のまま

技術のポイント

独自の高速画像フィルタで画像成分を「反射率成分」と「照明成分」に分解

※ 画像は、反射率成分(そのものの色)×照明光(あたっている光の強さ)

自然さを維持して「反射率成分を拡大」、「照明成分を圧縮」し視認性を向上

※ 逆光や夜間のハレーションでの視認性低下は「照明の偏り」が原因

用途・適用先例

デジタルカメラや携帯電話、ビデオカメラの 逆光補正機能(静止画・動画/ハード実装・ソフト実装)

車載カメラ、監視カメラ映像の視認性向上

新聞・印刷向け画像システム

4

Page 6: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

Copyright 2011 FUJITSU LIMITED

上場へ

テロップ 領域抽出

“ABC信託上場へ”

文字認識

色分解

白成分 赤成分

ABC信託

映像検索を効率的に行うテロップ認識技術

富士通独自の多色テロップ認識技術により、

複雑な背景を持つ映像中のテロップ文字を高精度で認識可能

技術の特徴

複雑な背景映像からの高精度テロップ抽出

色分解画像を利用した多色テロップ認識

多種多様なテロップを認識可能

5

Page 7: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

Copyright 2011 FUJITSU LIMITED

署名付加 5637868 3083676 9307212 8721317 7981663 0424592

コマ毎の特徴情報 (メッセージダイジェスト)

計算

5637868 7981663 カット編集時に 再度署名付加

切り抜き映像 電子署名が有効 ⇒各作業者の 特定も可能

元映像

参考資料として見せたいコマと 電子署名付きの特徴情報を

セットで公開して比較

5637868 7981663

5637868 7981663

一致

特許出願中 デジタル映像の原本性保証技術

切り抜き映像が元画像の一部であることを保証可能

各コマの特徴情報と電子署名をセットで管理、コマの連続性も保証

撮影者署名

切り抜き者

署名

6

Page 8: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

Copyright 2011 FUJITSU LIMITED

e-learning教材、動画マニュアルの 音声ナレーション

道路交通情報、 防災情報の放送

午前8時30分現在の、 高速道路情報をお知らせします。

情報セキュリティについて勉強しましょう。 現代社会には、個人情報を含む・・・。

発話リズム制御モデル

テキスト

橋を渡る。 端を渡る • 人が日本語を話す際に、

無意識に作り出すリズムを モデル化

大規模 音声波形データベース

橋を

端を

箸を

大規模 音声波形データベース

• 様々なイントネーションを網羅

• 使用頻度の高い単語や 文例を数万フレーズ格納

合成音声

橋を渡る。 端を渡る。

音声合成技術

概要

テキストを入力するだけで、明瞭さと自然性を兼ね備えた、プロのナレーションに迫る読み 上げ音声に変換

従来コストをかけてきた、ナレータ音声の 収録が一切不要

用途・応用例

e-learning教材などの音声コンテンツ作成

映像のナレーション作成

道路交通情報や防災情報の放送

コールセンターの音声自動応答

技術ポイント・効果

【独自の発話制御モデル】 プロのナレーターに匹敵する人間らしい流暢な語り口を実現

【大規模音声データベース】 人間の声と比べて不自然に感じることがない滑らかな音声を実現

製品化

(株)アニモから製品提供中(FineSpeech Ver.3)

渡る

渡る

歩道を

海を

7

Page 9: 富士通の映像処理技術 - ネットワーク : 富士通fenics.fujitsu.com/media-solutions/movie/pdf/m04-03.pdfCopyright 2011 FUJITSU LIMITED 蓄積 抽出 分散KVS 乗車

8 Copyright 2010 FUJITSU LIMITED