linked data - webをグローバルなデータ空間にする仕組み 第4章

24
Linked Data Webをグローバルなデータ空間にする仕組み 総合地球環境学研究所 佳孝 『第4つながるデータをデザインし よう』 2013/8/5 2Linked Open DataLOD)とオントロジー勉強会

Upload: yoshitaka-minami

Post on 07-Jul-2015

640 views

Category:

Technology


3 download

DESCRIPTION

第2回 Linked Open Data(LOD)とオントロジー勉強会にて発表したLinked Data: Webをグローバルなデータ空間にする仕組みの 「第4章 つながるデータをデザインしよう」の内容。

TRANSCRIPT

Page 1: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

Linked DataWebをグローバルなデータ空間にする仕組み

総合地球環境学研究所

南 佳孝

『第4章 つながるデータをデザインしよう』

2013/8/5 第2回 Linked Open Data(LOD)とオントロジー勉強会

Page 2: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

おさらい

① 事物の名前としてURIを使うこと② 事物の名前を調べられるようにHTTP URIを使うこと③ URIが参照されたとき、有用な情報を供給できるようにすること④ データの中に他のURIへのリンクをいれること

Linked Data 4原則

303URI と ハッシュURI

RDFとその形式

他の事物へのリンク

Page 3: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

URIで名前をつける

人物

建物

飼い犬

科学的な概念

Page 4: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

どうやってURIを決めるの?

名前空間

※自分がコントロールできること

Page 5: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

自分が管理する名前空間

新たなURIを発行

http://oreno.site

新たなURIを発行

http://omaeno.site

自分が管理できない名前空間

○ ×

Page 6: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

Linked Dataを生成する最大の理由

内部・外部へリンクして、付加価値を生み出す!

http://oreno.site http://omaeno.site

じゃあ

リンクを貼ってもらうには?

Page 7: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

• コントロール可能

• 実装に非依存

• Natural Key

一貫したルール

永続的・安定的

Page 8: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

コントロール可能な名前空間

http://omaeno.site

http://omaeno.site/person/aho/

http://oreno.site

http://omaeno.site/person/aho/#comedian http://oreno.site/ahosisho/

同一のデータ

※ http://omaeno.site/がLinked DataでなければDbpediaなどをリンク先として考えるべき

Page 9: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

実装に非依存http://oreno.site

http://oreno.site/comedian.php?id=ahosisho&format=rdf

http://oreno.site:8080/comedian.php?id=ahosisho&format=rdf

http://oreno.site/comedian/ahosisho.rdf

ぴ、PHP?

ぽ、ポート番号?

×

×

Page 10: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

ユニーク性を保証する

Natural Key(自然なキー)

http://oreno.site/comedian/ahosisho

http://oreno.site/comedian/geinin00001

ポイント

一般的な規則:可能な限り、データセットを持つドメインで意味があるキー

を使う

※どちらを使うかについては未だに議論されるところ

Page 11: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

3種類のURI

• 現実世界の事物そのものを表現するURI

• 現実世界の事物の記述をHTMLによって表現した関連情報リソースのURI

• 現実世界の事物の記述をRDF/XMLファイルによって表現した関連情報リソースを示すURI

視覚的に区別しづらく、間違ったURIを使ってしまう可能性がある

拡張子(.html .rdf)を使って区別する方法が通常よく使われる

Page 12: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

URIが参照されたら

Page 13: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

① 事物の名前としてURIを使うこと② 事物の名前を調べられるようにHTTP URIを使うこと③ URIが参照されたとき、有用な情報を供給できるようにすること④ データの中に他のURIへのリンクをいれること

Linked Data 4原則

どんな情報を載せればいいの?

1. リテラル(文字列)のトリプル

2. 他のリソース(作者やタイプなど)にリンクするトリプル

3. 他のリソースからリンクされるトリプル

4. 関係するリソース(リソースの名前や作者の所属など)のトリプル

5. データの由来など、記述自体を記述するトリプル6. リソース全体に関するトリプル

例えば、LODAC Species:http://lod.ac/species/Papilio_xuthus

Page 14: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

データセットの記述

• 何を記述する?

– 製作者・更新状況・ライセンス・データの由来など

• メカニズム

– Semantic Sitemaps

– voiD(the Vocabulary of Interlinked Datasets)

Page 15: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

データを記述するための語彙

• 概念階層を表現するための語彙

– SKOS(Simple Knowledge Organization System)

• 概念モデルを記述するための語彙

– RDFS(RDF Vocabulary Description Language、RDF Shema)

– OWL(Web Ontology Language)

Page 16: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

rdfs:Class RDFクラスであるリソースのクラスrdf:Property すべてのRDFプロパティのクラス

RDFSの基本

• クラスとプロパティの型定義から構成

• 2つの名前空間– http://www.w3.org/2000/01/rdf-schema#

• プレフィックスは「rdfs:」

– http://www.w3.org/1999/02/22-rdf-syntax-ns#• プレフィックスは「rdf:」

基本クラス

Page 17: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

RDFSの基本

• アノテーション

– rdfs:label

– rdfs:comment

• クラスとプロパティの関係

– rdfs:subClassOf

– rdfs:subPropertyOf

– rdfs:domain

– rdfs:range

Page 18: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

【推奨】語彙• ダブリンコア・メタデータ・イニシアティブ(Dublin Core Metadata Initiative (DCMI) )

– http://dublincore.org/documents/dcmi-terms/

• フレンド・オブ・ア・フレンド(Friend-of-a-Friend (FOAF) )

– http://xmlns.com/foaf/spec/

• 意味論的相互リンク・オンライン・コミュニティ(Semantically-Interlinked Online Communities (SIOC) )

– http://rdfs.org/sioc/spec/

• プロジェクト記述(Description of a Project (DOAP) )

– http://trac.usefulinc.com/doap

• 音楽オントロジー(Music Ontology)

– http://musicontology.com/

• プログラム・オントロジー(Programmes Ontology)

– http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml

• グッド・リレーション・オントロジー(Good Relations Ontology)

– http://purl.org/goodrelations/

• クリエイティブ・コモンズ(Creative Commons (CC) )

– http://creativecommons.org/ns#

• 書誌オントロジー(Bibliographic Ontology (BIBO) )

– http://bibliontology.com/

• OAIオブジェクト再利用・交換(OAI Object Reuse and Exchange)

– http://www.openarchives.org/ore/

• レビュー語彙(Review Vocabulary)

– http://purl.org/stuff/rev#

• ベーシック・ジオ(Basic Geo (WGS84) )

– http://www.w3.org/2003/01/geo/

Page 19: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

語彙の選び方

• 利用と理解– 広く用いられている– 既存のアプリからアクセスできるようになる

• 維持管理– 管理方針が明瞭である– 維持活動が活発である– 更新される基準がある

• カバー範囲– データセットを十分にカバーしている

• 表現力– 過不足ではなく適切な表現である

Page 20: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

用語の定義

• 既存語彙を補充するため

• 管理できる名前空間内で

• RDFS、OWLを用いて既存語彙と関連させる

• Linked Data原則に則る

• 人間がわかりやすいラベルとコメント

• 必要最低限だけ

LODAC Speciesでは:http://lod.ac/ns/species#

Page 21: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

リンクする

Page 22: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

http://oreno.site

外からのリンクを得るには1.データセットの価値2.リンクすることで新たな事がで

きる3.リンクの生成・維持が容易

外へのリンク先を選ぶ

データセットを包括的に維持するCKAN http://data.linkedopendata.jp/

Page 23: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

http://oreno.site http://omaeno.site

.html

自動化!(参考)Silk:http://www.slideshare.net/YoshitakaMinami/silk-13745740

プロパティの選び方1.どのくらい他で使われているか2.参照してデータを得ることができ

るか

Page 24: Linked Data - Webをグローバルなデータ空間にする仕組み 第4章

① 事物の名前としてURIを使うこと

② 事物の名前を調べられるようにHTTP URIを使うこと

③ URIが参照されたとき、有用な情報を供給できるようにすること

④ データの中に他のURIへのリンクをいれること

Linked Data 4原則

まとめ