hadoop によるゲノム解読

9
® © 2015 MapR Technologies 1 ® © 2015 MapR Technologies Hadoop によるゲノム解読 2015 5

Upload: mapr-technologies-japan

Post on 13-Feb-2017

765 views

Category:

Data & Analytics


0 download

TRANSCRIPT

®© 2015 MapR Technologies 1

®

© 2015 MapR Technologies

Hadoop によるゲノム解読

2015 年 5 月

®© 2015 MapR Technologies 2

なぜ Hadoop はゲノム研究に最適な基盤といわれるのか?

ゲノム解読マーケットは指数関数的な成長を遂

げており、臨床ゲノム研究の分野で働く人々に

とっては素晴らしい状況だ。しかし、成長は新た

な課題を突きつける。特に、解読された巨大なヒ

トゲノムデータをどうやって適切に管理するかと

いう観点において。

®© 2015 MapR Technologies 3

解読コストは劇的に減少している

®© 2015 MapR Technologies 4

Hadoop 以前の DNA シーケンシングアーキテクチャ

Storage

write-only

read/write

High-Performance Compute ClusterCoordinator / Edge Node

Sequencer

®© 2015 MapR Technologies 5

Hadoop 後の DNA シーケンシングアーキテクチャ

Storage

write-only

read/write

High-Performance Compute ClusterCoordinator / Edge Node

DNA Sequencer Cluster (e.g. Illumina X-Ten)

HPC ボトルネック

シーケンサからの データ流入圧力

®© 2015 MapR Technologies 6

今や二次解析はスケールアウト可能に

HPC による解析

Hadoop / Spark による解析

®© 2015 MapR Technologies 7

Hadoop の利点

•  コスト効率の高い基盤上に構築されたストレージと計算資源

•  大規模なデータ処理を行う際に問題となる、既存の HPC (High Performance Computing) や NAS (Network Attached Storage) アーキテクチャに伴うボトルネックを克服

•  DNA 解析の現実の業務運用における遅延を最小化

®© 2015 MapR Technologies 8

MapR の優位点 •  企業全体の信頼性向上

–  高度なマルチテナント運用 –  事業継続性 – 高可用性、災害復旧

•  性能 –  他の Hadoop ディストリビューションよりも2〜7倍高速 –  超高速データ投入 (毎秒1億データ項目) –  NFS および リード/ライトファイルシステム

•  リアルタイムおよびセルフサービスデータ探索 –  事前のスキーマ定義不要の On-the-fly SQL –  高速検索・クエリ

ゲノム解析に最適な Hadoop プラットフォーム

Security

Streaming NoSQL & Search

Provisioning &

coordination

ML, Graph

Workflow & Data Governance

Batch

SQL

商用エンジン との連携

ツール 処理エンジン

バッチ

インタラクティブ

リアルタイム

オンライン

その他

管理

運用

ガバナンス

監査

セキュリティ

MapR-FS MapR-DB

MapR Data Platform

®© 2015 MapR Technologies 9

ホワイトペーパーをご覧ください Next Generation Genome Sequencing Using MapR ホワイトペー

パーをダウンロードして、インターネットのスケールアウトアーキテクチャ

がどのように臨床ゲノム研究に適用できるかをお確かめください。

次のことを学ぶことができます:

•  なぜ Hadoop がゲノム研究のワークフロー処理に理想的な基盤

なのか

•  規模と経済性を得るために、学術的なプロジェクトからより商業的

な基盤へと移行する利点

•  なぜ MapR 特有の機能がゲノム研究におけるデータ処理と解析

の最適なソリューションとなるのか

今すぐダウンロード!