ai&bigdata lab. Дмитрий Новицкий "big data и...

Post on 27-Jul-2015

74 Views

Category:

Technology

6 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1ДМИТРИЙ НОВИЦКИЙ

BIG DATA И БИОИНФОРМАТИКА

ЧТО ТАКОЕ БИОИНФОРМАТИКА

• математические методы компьютерного анализа генома, транскриптома, протеома(омикс- биоинформатика).

• разработка алгоритмов и программ для предсказания пространственной структуры биополимеров– РНК и белок - структурная биоинформатика ~ ФОЛДНИНГ

• ]моделирование белковых каскадов,предсказание функции белка, регуляторных контуров и т.

2

SHOTGUN & NEXT GEN. SEQUENCING

3

Strand Sequence

Original AGCATGCTGCAGTCATGCTTAGGCTA

First shotgun sequence AGCATGCTGCAGTCATGCT--------------------------TAGGCTA

Second shotgun sequence AGCATG--------------------------CTGCAGTCATGCTTAGGCTA

Reconstruction AGCATGCTGCAGTCATGCTTAGGCTA

ФОРМАТ FASTA : ПРИМЕР БЕЛКОВОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

4

ВЫРАВНИВАНИЕПОСЛЕДОВАТЕЛЬНОСТЕЙ

5

• Обнаружение внутривидового и межвидового полиморфизма.

• Таксономия• Молекулярные часы

БЕЛКОВЫЕ КАСКАДЫ

6

ОДИН ИЗ КАСКАДОВ РЕАКЦИЙ В КОНСОЛИДАЦИИ ПАМЯТИ С УЧАСТИЕМ

CREB/EBP

7

ПРЕДСКАЗАНИЕ СТРУКТУРЫ БЕЛКА (ФОЛДИНГ)

• .Моделирование5 (молекулярная физика)• Решение сложной задачи оптимизации• Можно использовать машинное обучение• Глубокие нейронные сети• Высокий параллелизм, можно использовать GPU

8

9

МНОГОФУНКЦИОНАЛЬНЫЙ ФАКТОР CREB1

10

Популярный белок CREB1 участвует в десятках процессах в клетке.Является транскрипционным фактором, выглядит как «ножницы» связывающиеся с ДНК.

Играет важную роль в процессах обучения и памяти.

ТРАНСКРИПЦИОННЫЙ ФАКТОР ZIF268-ВАЖНЫЙ БЕЛОК В СИНАПТИЧЕСКОЙ

ПЛАСТИЧНОСТИ• Показан комплекс zif268 , ДНК и цинка

11

ЯЗЫКИ, ПЛАТФОРМЫ, БИБЛИОТЕКИ

• BioPerl• BioPython• R/Bioconductor• Matlab• Julia (BioSeq ?)• Scala/Spark (ADAM)

12

13

14

15

ИЛЬЯ ИЛЬИЧ МЕЧНИКОВ

16

СПАСИБО ЗА ВНИМАНИЕ!

17

ДАНИО РЕРИО (DANIO RERIO), ИЛИ ZEBRAFISH (ДИКИЙ)

18

ЧЕМ ХОРОША РЫБКА ДАНИО

• Позвоночное животное• Достаточно сложный мозг, может обучаться• Внешнее оплодотворение- легче проводить генетическую модификацию (трансфекцию)

• Стандартный модельный организм. Геном секвенирован

• Мальки прозрачны. Есть линии (породы), прозрачные во взрослом возрасте

19

ЭКСПЕРИМЕНТ С ПОДСВЕТКОЙ КАЛЬЦИЕВЫХ КАНАЛОВ В МАЛЬКЕ

ДАНИО

20

КАСПЕР- ЛИНЕЙНЫЕ ПОЛУПРОЗРАЧНЫЕ ДАНИО

21

top related