linked open dataとは

78
Linked Open Dataとは LODI 加藤文彦 バイオインフォマティクス・ハンズオンセミナー 2013-02-22 1

Upload: fumihiro-kato

Post on 13-Dec-2014

960 views

Category:

Technology


1 download

DESCRIPTION

2013-02-22 バイオインフォマティクス・ハンズオンセミナーでの講演

TRANSCRIPT

Page 1: Linked Open Dataとは

Linked Open DataとはLODI 加藤文彦

バイオインフォマティクス・ハンズオンセミナー 2013-02-22

1

Page 2: Linked Open Dataとは

2

Page 3: Linked Open Dataとは

ティム・バーナーズ=リーが示す次のウェブ

http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

オープンデータとマッシュアップで変わる世界

http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html

Raw Data Now!

3

Page 4: Linked Open Dataとは

4

Page 5: Linked Open Dataとは

5

Page 6: Linked Open Dataとは

作品

作品

書誌

6

Page 7: Linked Open Dataとは

友人

在住

人物

7

Page 8: Linked Open Dataとは

舞台

観光地

観光地名前の由来

観光

8

Page 9: Linked Open Dataとは

舞台

観光地

観光地名前の由来

作品

作品

友人

在住

書誌人物

観光

9

Page 10: Linked Open Dataとは

Open Data+

Linked Data

10

Page 11: Linked Open Dataとは

Reuse

11

Page 12: Linked Open Dataとは

Open Data

12

Page 13: Linked Open Dataとは

“A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”

The Open Definition - http://opendefinition.org/

13

Page 14: Linked Open Dataとは

Open (Data) License

14

Page 15: Linked Open Dataとは

Public Domain

15

Page 16: Linked Open Dataとは

Attribution

16

Page 17: Linked Open Dataとは

Share-Alike

17

Page 18: Linked Open Dataとは

18

Page 20: Linked Open Dataとは

20

Page 23: Linked Open Dataとは

23

Page 24: Linked Open Dataとは

http://opendataday.org/

24

Page 25: Linked Open Dataとは

https://opendataday.crowdmap.com/main

25

Page 28: Linked Open Dataとは

Linked Data

28

Page 29: Linked Open Dataとは

29

Page 30: Linked Open Dataとは

Web技術でデータを公開・共有するための方法論

30

Page 31: Linked Open Dataとは

データのWeb

31

Page 32: Linked Open Dataとは

Webの原則1. IRIをHTML文書の識別子として使う

2. IRIにはhttpスキームを使う

3. IRIを見るとHTML文書が返ってくる

4. HTML文書には他のIRIへのリンクがある

32

Page 33: Linked Open Dataとは

Linked Dataの原則1. IRIをモノ(Thing)の識別子として使う

2. IRIにはhttpスキームを使う

3. IRIを見るとモノの構造化データが返ってくる

4. データには他のIRIへの型付リンクがある

子供

執筆

発行日

誕生日出版社

所在地

"Things,  not  Strings"  by  Google

33

Page 34: Linked Open Dataとは

Reuse

Discovery Integration

ID

34

Page 35: Linked Open Dataとは

Reuse構造化データ

35

Page 36: Linked Open Dataとは

IRIID

36

Page 37: Linked Open Dataとは

DiscoveryHTTP + 型付リンク

37

Page 38: Linked Open Dataとは

IntegrationIRI + 型付リンク

38

Page 39: Linked Open Dataとは

RDF

Discovery Integration

Reuse

全てを含んだグラフデータモデル

ID

39

Page 40: Linked Open Dataとは

子供

執筆

発行日

誕生日出版社

所在地

40

Page 41: Linked Open Dataとは

子供

執筆

発行日

誕生日出版社

所在地

41

Page 42: Linked Open Dataとは

シリアライズ形式• Turtle (N3)• JSON-LD• RDFa• Microdata• RDF/XML• TriX• TriG• ......

42

Page 43: Linked Open Dataとは

1.オープンライセンス

2.構造化データ

3.オープンな形式

4. IRIによる識別 / W3C標準

5.他データへのリンク

Linked Open Data

43

Page 44: Linked Open Dataとは

Linked  Data(データのWeb)

Open  Data(オープンライセンス)

RDF(グラフデータモデル)

44

Page 45: Linked Open Dataとは

As of September 2011

MusicBrainz

(zitgist)

P20

Turismo de

Zaragoza

yovisto

Yahoo! Geo

Planet

YAGO

World Fact-book

El ViajeroTourism

WordNet (W3C)

WordNet (VUA)

VIVO UF

VIVO Indiana

VIVO Cornell

VIAF

URIBurner

Sussex Reading

Lists

Plymouth Reading

Lists

UniRef

UniProt

UMBEL

UK Post-codes

legislationdata.gov.uk

Uberblic

UB Mann-heim

TWC LOGD

Twarql

transportdata.gov.

uk

Traffic Scotland

theses.fr

Thesau-rus W

totl.net

Tele-graphis

TCMGeneDIT

TaxonConcept

Open Library (Talis)

tags2con delicious

t4gminfo

Swedish Open

Cultural Heritage

Surge Radio

Sudoc

STW

RAMEAU SH

statisticsdata.gov.

uk

St. Andrews Resource

Lists

ECS South-ampton EPrints

SSW Thesaur

us

SmartLink

Slideshare2RDF

semanticweb.org

SemanticTweet

Semantic XBRL

SWDog Food

Source Code Ecosystem Linked Data

US SEC (rdfabout)

Sears

Scotland Geo-

graphy

ScotlandPupils &Exams

Scholaro-meter

WordNet (RKB

Explorer)

Wiki

UN/LOCODE

Ulm

ECS (RKB

Explorer)

Roma

RISKS

RESEX

RAE2001

Pisa

OS

OAI

NSF

New-castle

LAASKISTI

JISC

IRIT

IEEE

IBM

Eurécom

ERA

ePrints dotAC

DEPLOY

DBLP (RKB

Explorer)

Crime Reports

UK

Course-ware

CORDIS (RKB

Explorer)CiteSeer

Budapest

ACM

riese

Revyu

researchdata.gov.

ukRen. Energy Genera-

tors

referencedata.gov.

uk

Recht-spraak.

nl

RDFohloh

Last.FM (rdfize)

RDF Book

Mashup

Rådata nå!

PSH

Product Types

Ontology

ProductDB

PBAC

Poké-pédia

patentsdata.go

v.uk

OxPoints

Ord-nance Survey

Openly Local

Open Library

OpenCyc

Open Corpo-rates

OpenCalais

OpenEI

Open Election

Data Project

OpenData

Thesau-rus

Ontos News Portal

OGOLOD

JanusAMP

Ocean Drilling Codices

New York

Times

NVD

ntnusc

NTU Resource

Lists

Norwe-gian

MeSH

NDL subjects

ndlna

myExperi-ment

Italian Museums

medu-cator

MARC Codes List

Man-chester Reading

Lists

Lotico

Weather Stations

London Gazette

LOIUS

Linked Open Colors

lobidResources

lobidOrgani-sations

LEM

LinkedMDB

LinkedLCCN

LinkedGeoData

LinkedCT

LinkedUser

FeedbackLOV

Linked Open

Numbers

LODE

Eurostat (OntologyCentral)

Linked EDGAR

(OntologyCentral)

Linked Crunch-

base

lingvoj

Lichfield Spen-ding

LIBRIS

Lexvo

LCSH

DBLP (L3S)

Linked Sensor Data (Kno.e.sis)

Klapp-stuhl-club

Good-win

Family

National Radio-activity

JP

Jamendo (DBtune)

Italian public

schools

ISTAT Immi-gration

iServe

IdRef Sudoc

NSZL Catalog

Hellenic PD

Hellenic FBD

PiedmontAccomo-dations

GovTrack

GovWILD

GoogleArt

wrapper

gnoss

GESIS

GeoWordNet

GeoSpecies

GeoNames

GeoLinkedData

GEMET

GTAA

STITCH

SIDER

Project Guten-berg

MediCare

Euro-stat

(FUB)

EURES

DrugBank

Disea-some

DBLP (FU

Berlin)

DailyMed

CORDIS(FUB)

Freebase

flickr wrappr

Fishes of Texas

Finnish Munici-palities

ChEMBL

FanHubz

EventMedia

EUTC Produc-

tions

Eurostat

Europeana

EUNIS

EU Insti-

tutions

ESD stan-dards

EARTh

Enipedia

Popula-tion (En-AKTing)

NHS(En-

AKTing) Mortality(En-

AKTing)

Energy (En-

AKTing)

Crime(En-

AKTing)

CO2 Emission

(En-AKTing)

EEA

SISVU

education.data.g

ov.uk

ECS South-ampton

ECCO-TCP

GND

Didactalia

DDC Deutsche Bio-

graphie

datadcs

MusicBrainz

(DBTune)

Magna-tune

John Peel

(DBTune)

Classical (DB

Tune)

AudioScrobbler (DBTune)

Last.FM artists

(DBTune)

DBTropes

Portu-guese

DBpedia

dbpedia lite

Greek DBpedia

DBpedia

data-open-ac-uk

SMCJournals

Pokedex

Airports

NASA (Data Incu-bator)

MusicBrainz(Data

Incubator)

Moseley Folk

Metoffice Weather Forecasts

Discogs (Data

Incubator)

Climbing

data.gov.uk intervals

Data Gov.ie

databnf.fr

Cornetto

reegle

Chronic-ling

America

Chem2Bio2RDF

Calames

businessdata.gov.

uk

Bricklink

Brazilian Poli-

ticians

BNB

UniSTS

UniPathway

UniParc

Taxonomy

UniProt(Bio2RDF)

SGD

Reactome

PubMedPub

Chem

PRO-SITE

ProDom

Pfam

PDB

OMIMMGI

KEGG Reaction

KEGG Pathway

KEGG Glycan

KEGG Enzyme

KEGG Drug

KEGG Com-pound

InterPro

HomoloGene

HGNC

Gene Ontology

GeneID

Affy-metrix

bible ontology

BibBase

FTS

BBC Wildlife Finder

BBC Program

mes BBC Music

Alpine Ski

Austria

LOCAH

Amster-dam

Museum

AGROVOC

AEMET

US Census (rdfabout)

Media

Geographic

Publications

Government

Cross-domain

Life sciences

User-generated content

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

45

Page 49: Linked Open Dataとは

http://ja.dbpedia.org/resource/沖縄科学技術大学院大学

49

Page 50: Linked Open Dataとは

http://ja.dbpedia.org/resource/東京都

http://ja.dbpedia.org/page/東京都

http://ja.dbpedia.org/data/東京都

"東京都"のIRI

HTML表現

データ表現

DBpediaのIRI設計

cf. http://www.w3.org/TR/cooluris/

"東京都"についてのウェブページIRI

"東京都"についてのデータIRI

50

Page 51: Linked Open Dataとは

http://ja.dbpedia.org/resource/東京都

http://ja.dbpedia.org/page/東京都

http://ja.dbpedia.org/data/東京都

"東京都"のIRI

HTML表現

データ表現

% curl -IH 'Accept: text/html' http://ja.dbpedia.org/resource/東京都TTP/1.1 303 See OtherServer: Virtuoso/06.01.3127 (Linux) x86_64-unknown-linux-gnu Connection: closeContent-Type: text/html; charset=UTF-8Date: Fri, 25 Jan 2013 03:43:38 GMTAccept-Ranges: bytesLink: <http://mementoarchive.lanl.gov/dbpedia/timegate/http://ja.dbpedia.org/resource/東京都>; rel="timegate"

Location: http://ja.dbpedia.org/page/東京都Content-Length: 0

"東京都"についてのウェブページIRI

"東京都"についてのデータIRI

51

Page 52: Linked Open Dataとは

http://ja.dbpedia.org/resource/東京都

http://ja.dbpedia.org/page/東京都

http://ja.dbpedia.org/data/東京都

"東京都"のIRI

HTML表現

データ表現

% curl -IH 'Accept: text/n3' http://ja.dbpedia.org/resource/東京都

HTTP/1.1 303 See OtherServer: Virtuoso/06.01.3127 (Linux) x86_64-unknown-linux-gnu Connection: closeDate: Fri, 25 Jan 2013 03:44:13 GMTAccept-Ranges: bytesTCN: choiceVary: negotiate,acceptContent-Location: /data/東京都.n3

Content-Type: text/n3; qs=0.8Link: <http://mementoarchive.lanl.gov/dbpedia/timegate/http://ja.dbpedia.org/resource/東京都>; rel="timegate"

Location: http://ja.dbpedia.org/data/東京都.n3

Content-Length: 0

"東京都"についてのデータIRI

"東京都"についてのウェブページIRI

52

Page 53: Linked Open Dataとは

クエリ言語

• データの検索や操作を行うための言語

• データモデルやDBシステムに合わせて設計

• 例: SQL

–データモデル: 関係モデル

–DBシステム: RDBMS

• LODのデータモデル: グラフモデル53

Page 54: Linked Open Dataとは

グラフのクエリ• グラフの最小単位: 3つ組 (トリプル)

• グラフパターン1. 完全一致

• dbp:東京都 dbp-owl:country dbp:日本 .

2. 変数によるパターンマッチ

• dbp:東京都 dbp-owl:country ?country .

3. 1と2の組み合わせ

dbp:東京都 dbp:⽇日本dbpedia-­‐owl:country

54

Page 55: Linked Open Dataとは

:Amy :Bob :Cathy

:Dan

:Jim

:Ed

:Kate

:Gil

:Flo

:Hal

:Ian

:Lee:May

:like :like

:like

:like :like

:like

:like

:dislike

:dislike

:dislike :dislike

:dislike

:dislike :dislike

:dislike

好き嫌いグラフ

55

Page 56: Linked Open Dataとは

:Amy :Bob :Cathy

:Dan

:Jim

:Ed

:Kate

:Gil

:Flo

:Hal

:Ian

:Lee:May

:like :like

:like

:like :like

:like

:like

:dislike

:dislike

:dislike :dislike

:dislike

:dislike :dislike

:dislike

Amyが好きな人グラフパターン:Amy  :like  ?person  .

56

Page 57: Linked Open Dataとは

:Amy :Bob :Cathy

:Dan

:Jim

:Ed

:Kate

:Gil

:Flo

:Hal

:Ian

:Lee:May

:like :like

:like

:like :like

:like

:like

:dislike

:dislike

:dislike :dislike

:dislike

:dislike :dislike

:dislike

“Amyが好きな人”が好きな人グラフパターン:Amy  :like  ?person1  .?person1  :like  ?person2  .

57

Page 58: Linked Open Dataとは

SPARQL• LOD用クエリ言語

– データモデル: RDF (ラベル付き有向グラフ)

– プロトコル: HTTP

• W3C仕様

– 1.0: Recommendations

– 1.1: Working Drafts

58

Page 59: Linked Open Dataとは

SPARQLエンドポイント• SPARQLクエリを受け付ける場所– SPARQLエンドポイントURI

• プログラムからSPARQLを使うときに指定

– 入力フォームがある場合もあり

59

Page 60: Linked Open Dataとは

DBpedia Japanese SPARQLエンドポイント

60

Page 61: Linked Open Dataとは

dbp-owl:AdministrativeRegiondbp:サイボーグ009 dbp-owl:

ComicsCreatordbp:宮城県

dbp:石ノ森章太郎

rdfs:label

rdf:type

rdfs:label

dbp-prop:生年

dbp-owl:notableWork

dbp-owl:award

dbp-owl:birthPlace

rdf:type

サイボーグ009

宮城県 foaf:Person

1938石ノ森章太郎

rdf:type

rdfs:labeldbp:村井嘉浩

dbp-owl:leaderName

DBpedia Japaneseのグラフ例

dbp:手塚治虫文化賞

dbp-owl:Comics

rdf:type

61

Page 62: Linked Open Dataとは

dbp-owl:AdministrativeRegiondbp:サイボーグ009 dbp-owl:

ComicsCreatordbp:宮城県

dbp:石ノ森章太郎

rdfs:label

rdf:type

rdfs:label

dbp-prop:生年

dbp-owl:notableWork

dbp-owl:award

dbp-owl:birthPlace

rdf:type

サイボーグ009

宮城県 foaf:Person

1938

rdf:type

rdfs:labeldbp:村井嘉浩

dbp-owl:leaderName

dbp:手塚治虫文化賞

dbp-owl:Comics

rdf:type

クエリ:  手塚治虫文化賞を受賞した漫画家の代表的な漫画PREFIX  dbp:  <hPp://ja.dbpedia.org/resource/>PREFIX  dbp-­‐owl:  <hPp://dbpedia.org/ontology/>

SELECT  ?creatorName  ?comicNameWHERE  {    ?creator  a  dbp-­‐owl:ComicsCreator  ;  dbp-­‐owl:award  dbp:手塚治虫文化賞  ;

         dbp-­‐owl:notableWork  ?comic  ;  rdfs:label  ?creatorName  .    ?comic  a  dbp-­‐owl:Comics  ;  rdfs:label  ?comicName  .}

石ノ森章太郎

62

Page 63: Linked Open Dataとは

63

Page 65: Linked Open Dataとは

65

Page 66: Linked Open Dataとは

66

Page 67: Linked Open Dataとは

© 2013 Scholex co.,ltd. and ATR Creative Inc. © 2013 ATR Creative Inc., Linked Open Data Initiative

67

Page 68: Linked Open Dataとは

As of September 2011

MusicBrainz

(zitgist)

P20

Turismo de

Zaragoza

yovisto

Yahoo! Geo

Planet

YAGO

World Fact-book

El ViajeroTourism

WordNet (W3C)

WordNet (VUA)

VIVO UF

VIVO Indiana

VIVO Cornell

VIAF

URIBurner

Sussex Reading

Lists

Plymouth Reading

Lists

UniRef

UniProt

UMBEL

UK Post-codes

legislationdata.gov.uk

Uberblic

UB Mann-heim

TWC LOGD

Twarql

transportdata.gov.

uk

Traffic Scotland

theses.fr

Thesau-rus W

totl.net

Tele-graphis

TCMGeneDIT

TaxonConcept

Open Library (Talis)

tags2con delicious

t4gminfo

Swedish Open

Cultural Heritage

Surge Radio

Sudoc

STW

RAMEAU SH

statisticsdata.gov.

uk

St. Andrews Resource

Lists

ECS South-ampton EPrints

SSW Thesaur

us

SmartLink

Slideshare2RDF

semanticweb.org

SemanticTweet

Semantic XBRL

SWDog Food

Source Code Ecosystem Linked Data

US SEC (rdfabout)

Sears

Scotland Geo-

graphy

ScotlandPupils &Exams

Scholaro-meter

WordNet (RKB

Explorer)

Wiki

UN/LOCODE

Ulm

ECS (RKB

Explorer)

Roma

RISKS

RESEX

RAE2001

Pisa

OS

OAI

NSF

New-castle

LAASKISTI

JISC

IRIT

IEEE

IBM

Eurécom

ERA

ePrints dotAC

DEPLOY

DBLP (RKB

Explorer)

Crime Reports

UK

Course-ware

CORDIS (RKB

Explorer)CiteSeer

Budapest

ACM

riese

Revyu

researchdata.gov.

ukRen. Energy Genera-

tors

referencedata.gov.

uk

Recht-spraak.

nl

RDFohloh

Last.FM (rdfize)

RDF Book

Mashup

Rådata nå!

PSH

Product Types

Ontology

ProductDB

PBAC

Poké-pédia

patentsdata.go

v.uk

OxPoints

Ord-nance Survey

Openly Local

Open Library

OpenCyc

Open Corpo-rates

OpenCalais

OpenEI

Open Election

Data Project

OpenData

Thesau-rus

Ontos News Portal

OGOLOD

JanusAMP

Ocean Drilling Codices

New York

Times

NVD

ntnusc

NTU Resource

Lists

Norwe-gian

MeSH

NDL subjects

ndlna

myExperi-ment

Italian Museums

medu-cator

MARC Codes List

Man-chester Reading

Lists

Lotico

Weather Stations

London Gazette

LOIUS

Linked Open Colors

lobidResources

lobidOrgani-sations

LEM

LinkedMDB

LinkedLCCN

LinkedGeoData

LinkedCT

LinkedUser

FeedbackLOV

Linked Open

Numbers

LODE

Eurostat (OntologyCentral)

Linked EDGAR

(OntologyCentral)

Linked Crunch-

base

lingvoj

Lichfield Spen-ding

LIBRIS

Lexvo

LCSH

DBLP (L3S)

Linked Sensor Data (Kno.e.sis)

Klapp-stuhl-club

Good-win

Family

National Radio-activity

JP

Jamendo (DBtune)

Italian public

schools

ISTAT Immi-gration

iServe

IdRef Sudoc

NSZL Catalog

Hellenic PD

Hellenic FBD

PiedmontAccomo-dations

GovTrack

GovWILD

GoogleArt

wrapper

gnoss

GESIS

GeoWordNet

GeoSpecies

GeoNames

GeoLinkedData

GEMET

GTAA

STITCH

SIDER

Project Guten-berg

MediCare

Euro-stat

(FUB)

EURES

DrugBank

Disea-some

DBLP (FU

Berlin)

DailyMed

CORDIS(FUB)

Freebase

flickr wrappr

Fishes of Texas

Finnish Munici-palities

ChEMBL

FanHubz

EventMedia

EUTC Produc-

tions

Eurostat

Europeana

EUNIS

EU Insti-

tutions

ESD stan-dards

EARTh

Enipedia

Popula-tion (En-AKTing)

NHS(En-

AKTing) Mortality(En-

AKTing)

Energy (En-

AKTing)

Crime(En-

AKTing)

CO2 Emission

(En-AKTing)

EEA

SISVU

education.data.g

ov.uk

ECS South-ampton

ECCO-TCP

GND

Didactalia

DDC Deutsche Bio-

graphie

datadcs

MusicBrainz

(DBTune)

Magna-tune

John Peel

(DBTune)

Classical (DB

Tune)

AudioScrobbler (DBTune)

Last.FM artists

(DBTune)

DBTropes

Portu-guese

DBpedia

dbpedia lite

Greek DBpedia

DBpedia

data-open-ac-uk

SMCJournals

Pokedex

Airports

NASA (Data Incu-bator)

MusicBrainz(Data

Incubator)

Moseley Folk

Metoffice Weather Forecasts

Discogs (Data

Incubator)

Climbing

data.gov.uk intervals

Data Gov.ie

databnf.fr

Cornetto

reegle

Chronic-ling

America

Chem2Bio2RDF

Calames

businessdata.gov.

uk

Bricklink

Brazilian Poli-

ticians

BNB

UniSTS

UniPathway

UniParc

Taxonomy

UniProt(Bio2RDF)

SGD

Reactome

PubMedPub

Chem

PRO-SITE

ProDom

Pfam

PDB

OMIMMGI

KEGG Reaction

KEGG Pathway

KEGG Glycan

KEGG Enzyme

KEGG Drug

KEGG Com-pound

InterPro

HomoloGene

HGNC

Gene Ontology

GeneID

Affy-metrix

bible ontology

BibBase

FTS

BBC Wildlife Finder

BBC Program

mes BBC Music

Alpine Ski

Austria

LOCAH

Amster-dam

Museum

AGROVOC

AEMET

US Census (rdfabout)

Media

Geographic

Publications

Government

Cross-domain

Life sciences

User-generated content

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

68

Page 69: Linked Open Dataとは

http://www.uniprot.org/

69

Page 71: Linked Open Dataとは

http://beta.sparql.uniprot.org/

71

Page 72: Linked Open Dataとは

72

Page 73: Linked Open Dataとは

http://linkedlifedata.com/

73

Page 74: Linked Open Dataとは

74

Page 75: Linked Open Dataとは

75

Page 76: Linked Open Dataとは

データの作成・共有・再利用をして新しい世界をつくりましょう

76