“これから”のライフサイエンス研究とバイオインフォマティクス (next...
Post on 06-May-2015
2.424 Views
Preview:
DESCRIPTION
TRANSCRIPT
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
“これから”の ライフサイエンス研究と バイオインフォマティクス
坊農 秀雅 情報・システム研究機構(ROIS)
ライフサイエンス統合データベースセンター(DBCLS)Pictures from
http://g86.dbcls.jp/togopic/!1
Next Generation Life Science & Bioinformatics
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
坊農秀雅•読み: ぼうのうひでまさ •趣味: 道の駅&温泉巡り、スキー、元鉄オタ •専門: ‒バイオインフォマティクス ‒ゲノム生物学(微生物→マウス、最近は昆虫)
•ドメイン: bonohu.jp
!2 bonohu!! bono@dbcls.jp
• twitter可 •ハッシュタグは
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
本日のお題
1. ライフサイエンス研究の現状
2. バイオインフォマティクスとは
3. これからのライフサイエンス研究とバイオインフォマティクス
!3
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
1. ライフサイエンス研究の現状
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
Nature 464, 670-671 (2010)
!5
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
DNA塩基配列解読の超高速化•かつてはSanger法 •最近は「次世代シーケンサー(NGS)」 ‒Illumina: Sequence By Synthesis
• http://www.youtube.com/watch?v=womKfikWlxM
‒Life Technologies(Applied Biosystems) •ヌクレオチドがDNA鎖に取り込まれる過程でポリメラーゼによって放出される水素イオンを検出
• https://www.youtube.com/watch?v=MxkYa9XCvBQ
‒PacBio: 一分子・リアルタイム(SMRT®)検出 • https://www.youtube.com/watch?v=NHCJ8PtYCFc
!6
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
exomeの例
!7
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
whole genomeの例
!8
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
遺伝医学の入門書•遺伝医学やさしい系統講義18講 ‒例えば… ‒単一遺伝子疾患とメンデル遺伝学 ‒多因子疾患の遺伝学 ‒エピジェネティックス ‒集団遺伝学 ‒薬理遺伝学・ゲノム薬理学 ‒遺伝カウンセリング ‒など
!9
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
個人ゲノム解読: 新たな問題も
!10
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
MiSeq• Illumina社のデスクトップ次世代シーケンサ •富山大学にも導入済み •最新の v3 試薬だと1runで ‒300塩基(base) ‒5000万リード ‒→15 Gb(参考: ヒトハプロイドゲノム 約3Gb)
!11
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
次世代シーケンサからのデータ•FASTQフォーマットのファイル ‒4行/readが基本単位 ‒MiSeq v3 •5000万リードx4行 •=2億行
•ファイルサイズも2Gbyte/file超 ‒FAT32フォーマットでは扱えない
•いわゆる「開く」ことが不可能!12
SRR001356.1 2023DAAXX:5:1:123:563 length=33 TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC +SRR001356.1 2023DAAXX:5:1:123:563 length=33 -IIIIIIII8IIIIIIIIIII6IIIIIIIII9I @SRR001356.2 2023DAAXX:5:1:123:476 length=33 TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG +SRR001356.2 2023DAAXX:5:1:123:476 length=33 IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III @SRR001356.3 2023DAAXX:5:1:121:746 length=33 GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT +SRR001356.3 2023DAAXX:5:1:121:746 length=33 IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
(・́ω`・)困ッタナァ...
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
2. バイオインフォマティクス とは?
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
バイオインフォマティクスとは•コンピュータを実験デバイスとして使って、生物学的に有意な結論を引き出そうとする学問 ‒坊農秀雅(2002)
•計算機科学の技術を応用して生物学の問題を解こうとする学問 ‒日本語版Wikipedia(2013/12/7版)
!15
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
バイオインフォマティクスの教科書1. バイオインフォマティクスの歴史と全貌 2. 配列の収集と蓄積 3. 対にした配列のアラインメント 4. 配列アラインメントの確率的,統計的解析入門 5. 多重配列アラインメント 6. 類似配列のデータベース検索 7. 系統推定 8. RNA二次構造の予測 9. 遺伝子予測と遺伝子調節 10.タンパク質の分類と構造予測 11.ゲノム解析 12.PerlとPerlモジュールを用いたバイオインフォマティクス・プログラミング 13.マイクロアレイの解析
!16
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
バイオインフォマティクスの範疇
!17
シミュレーション
イメージ解析
!
パスウェイ解析
遺伝子発現解析
!
アミノ酸配列解析 塩基配列解析
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
(かつての)バイオインフォマティクス研究者の職種別分類
•アルゴリズム屋!–方法を考える人!–「NP完全」がキーワード!
•実装屋!–プログラムやツールを書く人!
•解析屋!–プログラムを使って実際に生データを相手に手を動かす人
!18
数学的 抽象的
生物的 具体的ライフサイエンス研究
者の範疇!18
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
あなたも バイオインフォマティクス研究者!
!19
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
0. 他力本願
!21
Photo by Hidemasa Bono on Dec.08, 2013
1. コピペ系
2. コマンドライン系3. ガチ系
バイオインフォマティクス研究者の分類(改) ~富山城の天守に喩えて~
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
1. コピペ系バイオインフォマティクス•配列断片などをコピー&ペースト(コピペ)してGUI(Graphical User Interface)で解析 ‒ウェブブラウザ上や専用ソフトウェア ‒コピペマティクスw
•武器 ‒ショートカットキー(例: ⌘+C, ⌘+V) ‒グーグル先生 ‒ソーシャルネットワーク(SNS) •Twitter
!22
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
2. コマンドライン系バイオインフォマティクス
•UNIXのコマンドライン上で、既存のツールを組み合わせて解析をする ‒Command line User Interface(CUI) (cf. GUI)
•たまに捨てコードを書く •武器 ‒shell script ‒Perl, Ruby ‒Python ‒R
!23
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
3. ガチ系バイオインフォマティクス•ある解析技術に特化したプログラムを書く ‒例えば、BLAST
•ライフサイエンスに興味あるのかな…!? •でもそういう人がプログラム作ってくれないと…いつも大変感謝しております
•武器 ‒C, C++ ‒Fortran
!24
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
0. 他力本願•他人にやらせる系 •自分の研究テーマなのに •「あなた、本当に研究者?」 •武器 ‒自然言語(関西弁が多い)
!25
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
考察•レベル0は論外。すぐにレベルアップを •時代が経ってソフトウェアが進化すれば、レベル1でもなんとかなる(はず) •早く目的の課題を解きたいのであれば、自らのレベルをさらに上げるしかない
!26
ぼうのふは レベル2にあがった!
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
レベルを上げるとは?•レベル0→1 ‒インターネットをもっと活用、ソフトウェア導入など、自らの意識改革で実現可能
•レベル1→2 ‒UNIX使いましょう •MacOSX: 「アプリケーション」→「ユティリティ」の「ターミナル」を常時起動 •Windows: cygwinを導入。できればMacOSXへ
‒cygwin: UNIX系の便利なプログラムを利用するためのツール!27
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
レベル1: GUIを決め込む•NGS解析GUIソフトウェア(有償)
–CLC Genomics workbench http://www.clcbio.co.jp/
–Avadis NGS http://www.avadis-ngs.com/
•遺伝子発現解析 ‒無償でいいものが多数 –例えば、GSEA(Gene Set Enrichment Analysis)のDAVID!
–Google 検索して調べましょう
!28
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
マイクロアレイ解析
!29
遺伝子アノテーション
oligoprobeに対応する遺伝子ごとの発現量
!29
Genespring
レベル1で可
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
データ形式の実際(マイクロアレイ)
!30
•タブ区切りテキスト!–数万(=スポットの数)行!
• (古い)Excelでも「開ける」!–Excel2003の行数制限内!
•コマンドライン操作なしで中身が直接見れる
!30
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
RNAseq
!31
•「次世代シーケンサを利用して、サンプル中の RNA の中身に関する情報を得るために cDNA をシーケンシングする方法」!–http://en.wikipedia.org/wiki/RNA-Seqより勝手に翻訳!
• Whole transcriptome shutgun sequencing(WTSS) や!
• Transcriptome sequencingとも
!31
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
RNAseq データ 解析の流れ
!32
ゲノムに対する多重配列アラインメント
.bam
ゲノムアノテーション
.gtf
予測転写単位ごとの(推定)発現量情報
SRR001356.1 2023DAAXX:5:1:123:563 length=33!TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC!+SRR001356.1 2023DAAXX:5:1:123:563 length=33!-IIIIIIII8IIIIIIIIIII6IIIIIIIII9I!@SRR001356.2 2023DAAXX:5:1:123:476 length=33!TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG!+SRR001356.2 2023DAAXX:5:1:123:476 length=33!IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III!@SRR001356.3 2023DAAXX:5:1:121:746 length=33!GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT!+SRR001356.3 2023DAAXX:5:1:121:746 length=33!IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII
FASTQゲノム .fa
1.tophat (bowtie)
2.cufflinks
3.cummeRbund!32
遺伝子アノテーション
上流はレベル2
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
レベル2: UNIXの使い方(CUI)デモ•出典: http://bit.ly/unixdemo131209
‒grep ‒ less ‒cut, sort, wc
!
•どうしてもWindowsという人はcygwinを –http://togotv.dbcls.jp/20110520.html
!33
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
http://www.hiroogakuen.jp/weblog/archives/17598!34
レベル1-2
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
学部生でレベル2だとこんなことも
!35
•現在、学部4年生!
• First authorの論文がすでにaccepted
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
3. これからの ライフサイエンス研究と バイオインフォマティクス
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
バイオインフォマティクススキルがあれば、ライフサイエンス研究はできるか?
NOhttp://www.geocities.jp/papertoy_box/make/98CmdCar.html
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
車輪の両輪
•バイオインフォマティクスを含めた実験スキル •ライフサイエンスの知識
!38
研究前進
http://www.geocities.jp/papertoy_box/make/98CmdCar.html
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
ライフサイエンスの知識•蓄積された事実 ‒(これまで)教科書 ‒(最近は)データベース •特定のテーマに沿ったデータを集めて管理し、容易に検索・抽出などの再利用をできるようにしたもの
!39
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
ライフサイエンス分野の データベース
•PubMed, PubMedCentral(PMC) ‒論文のデータ
•DDBJ/EMBL/Genbank ‒塩基配列データ
•UniProtKB(かつてのSwissProt) ‒アミノ酸配列データ
•PDB ‒タンパク質の立体構造データ
!40
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
データベース乱立時代•Nucleic Acids Research •毎年年頭にDatabase issueを発刊 •2013年(最新版)の巻頭言
–http://nar.oxfordjournals.org/content/41/D1/D1.abstract
•1,512のDB! •多すぎ。把握困難
!41
統合しましょう
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
日本の「統合DB」とは?•生命科学分野のいわゆる「公共データベース」 •ライフサイエンスデータの流通業 •NBDC 、 DBCLS、DDBJ を中心に 日本中のさまざまな大学・研究機関が協力
•安心してすぐに利用できるデータを提供 •公共DBとして外に出す際にデータを綺麗に
!42
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
•基本的にユーザー登録なし •for profit(企業の方)もタダ
!43
無料で使えます
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
じゃ、どうやって?•やりたいことを「インターネット検索」して見つかります ‒要するにググって下さい
•見つからない場合は、NBDC portalから ‒かつてのYahoo!的なindexサイト
!44
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
http://biosciencedbc.jp/
!45
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
IntegbioDBカタログ
!46
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
生命科学DB横断検索
!47
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
生命科学DBアーカイブ
!48
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
バイオサイエンスデータベースセンター(NBDC)
•National Bioscience Database Center ‒Since 2011
•独立行政法人 科学技術振興機構(JST)の傘下
!49http://biosciencedbc.jp/about-us/projects-and-activitiesより引用
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
RDFによるDB統合ゲノムの配列情報と多種多様なアノテーションデータを個別のオントロジー、データ変換プログラムを開発し RDF 形式にして統合
!50
Slide from トーゴーの日シンポジウム2013 「データベース統合の実現に向けて2」 by 岡本忍 (DBCLS)
NCBI: BioProject/RefSeq -- 既存のリファレンス配列 DDBJ: Annotation pipeline/GTPS -- 新規ゲノム配列
ゲノム配列
UniProt: Protein functions and links Formats: GFF3, GTF, GVF, DAS, BED ... Tools: Cufflinks, BLAST, InterProt ...
アノテーション
NCBO: BioPortal, OBO (GO, SO ...) DBCLS: MEO, GMO, MCCV ...
オントロジー
INSDC, NCBI: SRA, GEODBCLS: RefEx, Kusarinoko GOLD, GSC: 環境メタデータBulk data: 文献, 画像 ...
実験・メタデータ
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
LSQA
!51
http://qa.lifesciencedb.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
和を以て貴しと為す
継続的に維持管理していくことが大事!52
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!53
全部紹介している時間ないので
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
統合DBの活用法 統合TV
http://togotv.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
統合TV (togoTV)•動画によるDBやツールのチュートリアル ‒ 各DBやツール名で検索
•統合データベース講演会AJACSの動画も •YouTubeにも
•約750の動画 (アップデート込)
!55クリエイティブ・コモンズ 表示 2.1 日本
http://togotv.dbcls.jp/
http://youtube.com/togotv
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!56
NGS
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!57
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!58
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!59
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
MotDB•Master of the DB「データベースの達人」 ‒「もっとDB? もういらん、増やさんといて!」
•統合DB講習会のテキスト置き場 ‒DBやツールの使い方の宝庫 ‒例えば… •RNAseq,ChIPseqのRによる解析方法 •遺伝子発現データの生物学的解釈方法 •Local BLASTのやり方(MacOSX, Windowsの両方)
!60
http://MotDB.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
統合DBの活用法 1. 文献データ
新着論文レビュー 領域融合レビュー
Allie: 生命科学分野の略語/展開形検索 inMeXes: 逐次PubMed表現検索
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!62大人気のサービス
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
新着論文レビュー
!63クリエイティブ・コモンズ 表示 2.1 日本
http://first.lifesciencedb.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
領域融合レビュー
クリエイティブ・コモンズ 表示 2.1 日本!64
http://leading.lifesciencedb.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!65
http://allie.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
inMeXes
!66 http://docman.dbcls.jp/im/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!67
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!68
Life Science Dictionary のサイトにリンク
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
統合DBの活用法 2. 塩基配列データ
DDBJ DBCLS SRA GGRNA
GGGenome
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
突然ですが…DBCLS移転します•2013年度末に ‒柏の葉キャンパス駅前のビル ‒遺伝研DDBJ/CIBの隣のビル
•「統合」なのに分割移転w ‒予算的、制度的な都合
•物理的に「統合」 ‒DDBJ+DBCLS(一部)
!70でも、前から協調してやっています
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!71
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
1. DBCLS SRA
• Yellow pages for NGS data archived!–Indexed by metadata. Search by....!
• Statistics!• Publications!• Diseases!
–Direct link to original DB(SRA)!• Pre-calculated QC data
!72
Search data
Download
Quality Check
Data processing
Analysis
Pipeline to help re-use public NGS data
http://SRA.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
Statistics: studies
!73Picture from Togo Picture Gallery http://g86.dbcls.jp/togopic/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
PUBLISHED OR NOT 公開されたデータを元にした論文はあるのか
!74
19%
paper publishednot published
NUMBER OF SUBMITTED STUDY
「論文を公開してからデータを公開する」!とは限らない
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
Search by publications
!75http://bit.ly/sra2pubmed
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
Search by diseases
!76
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
Search by diseases(cont.)
!77
Nakazato T, Ohta T, Bono H!Experimental design-based functional mining and characterization of high-throughput sequencing data in the Sequence Read Archive.!PLOS ONE. 2013; doi: 10.1371/journal.pone.0077910
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
GGRNA
!78
■ あらゆるキーワードや塩基配列・ アミノ酸配列からすばやく簡単に 遺伝子を検索するウェブサーバ
■ RefSeqのmRNA+ncRNAを 高速に全文検索する
■ PCRのプライマー、マイクロ アレイのプローブ、siRNAの 標的配列を即座に確認
■ REST API提供により外部の システムと連携可能
GooGle ライクな RNA 検索エンジンhttp://GGRNA.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!79
GooGle ライクな Genome 検索エンジンhttp://GGGenome.dbcls.jp/
Genomeも検索できたらええなあ… やりましょう!!
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
統合DBの活用法 3. 遺伝子発現データ
NCBI GEO目次 RefEx
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
GEO目次
!81
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
同じようなものが一杯あって、 どれを選んでいいか、わからない
!82
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
RefEx: 遺伝子発現 リファレンスデータセット
•臓器ごとの発現比較を4つの実験手法とBodyParts3Dで ‒正常組織・臓器における遺伝子発現のリファレンス ‒再利用可能で有用なパブリックデータの活用例 •「組織特異的遺伝子」検索機能の実装
!83
EST Classical Expressed Sequence Tags
GeneChip Affymetrix’s microarray
CAGE Cap Analysis of Gene Expression
RNAseq Transcriptome Sequencing
http://RefEx.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
!84http://RefEx.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
!85
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN
!86
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
結語
!87
整備されてきた公共データベースをうまく活用して自分のやっていることに役立てていきましょう!
私もやっています
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
いつでもどこでもタダじゃない…
!88
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
結語2
!89
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
!90
photo by @hirabat (1st Bono Conference on 20130113 )
御清聴ありがとうございました
bonohu!bono@dbcls.jp !90
スライドのありか http://bit.ly/bono131209
We all level 2 and more!
top related