مقدمه ای بر داده های پيوندی

60
1389/2/26 1 هان ف صه ا گا ش ن دا ي س د ن ه م و ي ن ف کده ش ن دا ر% ت و ي) مپ روه کا گ/ های وب ش ل ا4 ار و چ% ت خ ي سا سر ر/ ت3 دی ون ي) پ های ر داده/ ت ي ن% ن م/ وب ما: ن هد را ا% ن س ا ش خ/ ب% ت م ع ن ي عل مد حM م ر% کت د ده: ن ه ه دS ارائ ی ن ارسا ف روی س خ هادی% ت ش پ ارد1389

Upload: khosravi82

Post on 21-Nov-2014

2.980 views

Category:

Education


12 download

DESCRIPTION

مروری بر کارهای انجام شده در داده های پيوندی

TRANSCRIPT

Page 1: مقدمه ای بر داده های پيوندی

1389/2/261

دانشگاه اصفهاندانشکده فني و مهندسي

گروه کامپيوتر

3بررسی ساختار و چالشهای وب وب مبتنی بر داده های پيوندی

استاد راهنما:دکتر محمدعلی نعمت بخش

ارائه دهنده:هادي خسروي فارسانی

1389ارديبهشت

Page 2: مقدمه ای بر داده های پيوندی

2

فهرست مطالب

بررسی وب سنتی و معرفی مشکالت آن•

Linkedمعرفی مفاهيم، اصول و خصوصيات کليدی داده های پيوندی )•Data)

بررسی روش انتشار داده در ساختار جديد•

معرفی تعدادی از ابزارهای مورد استفاده در اين تکنولوژی•

آينده داده های پيوندي•

سوال و پاسخ•

1389/2/26

Page 3: مقدمه ای بر داده های پيوندی

3

(The Web of Documentوب سنتی )

مشابه •توزيع شدهسيستم فايل يک •

اشياء اوليه•اسناد•

لينک ها مابين • )به عنوان رابطه بخشی از(اسناد•

درجه ساختار در اشياء•بسيار پايين•

معناي محتوا و لينک ها•ضمنیبه صورت •

طراحی شده برای •انسانمصرف •

1389/2/26

Page 4: مقدمه ای بر داده های پيوندی

4

وب سنتی ) وب مبتنی بر اسناد لينک داده شده(

1389/2/26

Page 5: مقدمه ای بر داده های پيوندی

5

سيلوهای داده ای در وب•

1389/2/26

Page 6: مقدمه ای بر داده های پيوندی

6

1389/2/26

سيلوهای داده ای در وب

Page 7: مقدمه ای بر داده های پيوندی

7

چالشهای وب سنتی

سادگی•داده های با ساختار بسيار پايين، لينک های بدون نوع ، داده های جدا از •هم

يکپارچگی•تمام مقاالت چاپ شده از اساتيد دانشگاه اصفهان در کنفرانس داده کاوی •

را نشان بده

پرس و جوی وب•نام مقاله ای را که من با استادی از دانشگاه تهران چاپ کرده ام•

1389/2/26

Page 8: مقدمه ای بر داده های پيوندی

8

وب مبتنی بر داده های پيوندی

نه تنها لينک مابين اسناد وجود دارد بلکه مابين موجوديت ها نيز لينک وجود دارد•

1389/2/26

Page 9: مقدمه ای بر داده های پيوندی

9

وب مبتنی بر داده های پيوندی

مشابه•پايگاه داده توزيع شده يک •

طراحی شده •انسان در ابتدا و سپس برای ماشينبرای •

اشياء اوليه•و يا توصيفی از موجوديت هاموجوديت ها •

لينک مابين •موجوديت ها•

ميزان ساختار در موجوديت ها•بسيار باال•

معنای محتوا و لينک ها•مشخص است.صورت واضح به •

1389/2/26

Page 10: مقدمه ای بر داده های پيوندی

10

تکنولوژی های مورد استفاده برای داده های پيوندی

URI

RDF

HTTP

(RDFS/OWL)

(FAOF, SKOS, etcتعدادی از انتولوژی های استاندارد )

SPARQL

1389/2/26

Page 11: مقدمه ای بر داده های پيوندی

11

URI

روشی ساده برای شناسايي منابع در وب •

شماهای مختلفی می تواند استفاده شود••FTP،HTTP ، mailto :

ها از موجوديت هاي واقعی URIتعدادی •

•http://tomheath.com/id/me•http://eng.ui.ac.ir/~khosravi/hadi•http://dbpedia.org/resource/Talis_Group

1389/2/26

Page 12: مقدمه ای بر داده های پيوندی

12

RDF (Resource Description Framework)

فرمت داده ای برای توصيف موجوديت ها و روابط مابين آنها•

•subject → predicate → object

•Hadi → LivesIn → Isfahan•hadi → WorksFor → ShaikhBahayi

•<uri> → <uri> → <uri> or "literal"

1389/2/26

Page 13: مقدمه ای بر داده های پيوندی

13

Talis is Based Near Birmingham

<http://dbpedia.org/resource/Talis_Group><http://xmlns.com/foaf/0.1/based_near>

<http://sws.geonames.org/3333125/>

1389/2/26

Page 14: مقدمه ای بر داده های پيوندی

14

RDF

Prefixesrc: <http://richard.cyganiak.de/foaf.rdf#>rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>foaf: <http://xmlns.com/foaf/0.1/>dbpedia: <http://dbpedia.org/resource/>dp: <http://dbpedia.org/property/>skos: <http://www.w3.org/2004/02/skos/core#>

1389/2/26

Page 15: مقدمه ای بر داده های پيوندی

15

RDF

1389/2/26

Page 16: مقدمه ای بر داده های پيوندی

16

SPARQL

استRDF زبان استانداردي براي پرس و جو بر روي آنتولوژي • استاندارد شده و بسيار انعطاف پذير و قدرتمند استw3cاين زبان توسط •

مثال: تمام کالسهايي که از کالس دوربين ديجيتال مشتق مي شوند را •. نشان دهيد

PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT ?name WHERE { ?person foaf:name ?name . }

SELECT ?p ?o { <http://nasa.dataincubator.org/spacecraft/1968-089A> ?p ?o }

1389/2/26

Page 17: مقدمه ای بر داده های پيوندی

17

SPARQL

PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT * WHERE { ?person foaf:name ?name . ?person foaf:mbox ?email . }

PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?craft ?homepage { ?craft foaf:name "Apollo 7" . ?craft foaf:homepage ?homepage }

1389/2/26

Page 18: مقدمه ای بر داده های پيوندی

18

SPARQL

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX type: <http://dbpedia.org/class/yago/> PREFIX prop: <http://dbpedia.org/property/>

SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER (?population > 15000000) . }

1389/2/26

Page 19: مقدمه ای بر داده های پيوندی

19

FOAF: Friend of A Friend

برای توصيف افراد: RDF Vocabluary يک •نام، نام خانوادگی، و بقيه اطالعات درباره شخص•عالقه های آنها•دوستان شخص•شبکه های اجتماعی••FOAF Ontology

1389/2/26

Page 20: مقدمه ای بر داده های پيوندی

20

SKOS: Simple Knowledge Organization System

RDF Vocabluary يک •

برای مدل کردن و به اشتراک گذاری سيستمهای اطالعاتی•

SKOS:relatedSKOS:BroaderSKOS:Collecion…

مشاهده استاندارد•

1389/2/26

Page 21: مقدمه ای بر داده های پيوندی

21

تکنولوژی های مورد استفاده در داده های پيوندی

1389/2/26

Page 22: مقدمه ای بر داده های پيوندی

22

(Linked Data Principlesاصول داده های پيوندی )

1389/2/26

Page 23: مقدمه ای بر داده های پيوندی

23

The Web of Data

The Linking Open Data ProjectLOD Project

1389/2/26

Page 24: مقدمه ای بر داده های پيوندی

24

LOD project

انجام شد W3Cپروژه ای است که با پشتيبانی •

شروع شد.2007در سال •

تبديل RDFمجموعه داده های موجود در وب را گرفته و آنها را به فرمت •کردند.

داده ها را با داده های ديگر لينک دادند•

1389/2/26

Page 25: مقدمه ای بر داده های پيوندی

25

مشارکت کنندگان

• Massachusetts Institute ofTechnology (US)• University of Southampton (UK)• Freie Universitat Berlin (DE)• DERI (IE)• KMi, Open University (UK)• University of London (UK)• Universitat Hannover (DE)• University of Pennsylvania (US)• Universitat Leipzig (DE)• Universitat Karlsruhe (DE)• Joanneum (AT)• University of Toronto (CA)

1389/2/26

• BBC (UK)• Talis (UK)• Garlik (UK)• OpenLink (UK)• Thomson Reuters (US)• Zitgist (US)• Mondeca (FR)• Cyc Foundation (US)

Page 26: مقدمه ای بر داده های پيوندی

26

1389/2/26

Page 27: مقدمه ای بر داده های پيوندی

27

DBPediaفرايند ساخت

1389/2/26

مثال ديگر: شهر برلين•

Page 28: مقدمه ای بر داده های پيوندی

28

DBPediaفرايند ساخت

1389/2/26

Page 29: مقدمه ای بر داده های پيوندی

29

DBPediaفرايند دسترسی به

1389/2/26

Semantic Web browsers Disco Tabulator OpenLink Data Web Browser

Semantic Web crawlers SWSE Swoogle

Semantic Web query Semantic Web Client Library SemWeb client

Page 30: مقدمه ای بر داده های پيوندی

30

Geonames

1389/2/26

Page 31: مقدمه ای بر داده های پيوندی

31

May 2007در ماه

1389/2/26

Page 32: مقدمه ای بر داده های پيوندی

32

July 2007در

1389/2/26

Page 33: مقدمه ای بر داده های پيوندی

33

August 2007در

1389/2/26

Page 34: مقدمه ای بر داده های پيوندی

34

November 2007در

1389/2/26

Page 35: مقدمه ای بر داده های پيوندی

35

Feb 2008در

1389/2/26

Page 36: مقدمه ای بر داده های پيوندی

36

Sep 2008در

1389/2/26

Page 37: مقدمه ای بر داده های پيوندی

37

2009در سال

1389/2/26

Page 38: مقدمه ای بر داده های پيوندی

38

LOD DataSet

1389/2/26

Page 39: مقدمه ای بر داده های پيوندی

39

Linked Set in LOD

1389/2/26

Page 40: مقدمه ای بر داده های پيوندی

40

مرحله اساسی برای انتشار داده های پيوندی5

(Linked Data Principles فهم اصول انتشار داده ها )1.

شناخت داده هايي که می بايست انتشار يابند2.

برای موجوديت ها در داده هاURI انتخاب 3.

ايجاد زيرساختار 4.

پيوند )لينک( با ديگر داده ها 5.

1389/2/26

Page 41: مقدمه ای بر داده های پيوندی

41

1 .Linked Data Principles

Use URIs as names for things anything, not just documents you are not your homepage information resources and non-information resources

Use HTTP URIs globally unique names, distributed ownership allows people to look up those names

Provide useful information in RDF when someone looks up a URI

Include RDF links to other URIs to enable discovery of related information

1389/2/26

Page 42: مقدمه ای بر داده های پيوندی

42

. فهم داده ها2

موجوديت های اساسي در داده ها را شناسايي کنيد•

افراد•مکانها•عکس ها•فيلم ها•کتابها•مفاهيم•نظرات•مرورها•موسيقی ••....

1389/2/26

Page 43: مقدمه ای بر داده های پيوندی

43

. فهم داده ها2

از چه واژه نامه ای برای توصيف اين داده ها استفاده شود•اصل•

تا حد ممکن استفاده مجدد شود، در صورت نياز مجدد تعريف شود.•

آنتولوژي های ممکن که می توانند مورد استفاده قرار گيرند••Geo•FOAF•GoodRelations•Review•SIOC•SKOS•Dbpedia•RDFS•

1389/2/26

Page 44: مقدمه ای بر داده های پيوندی

44

برای موجوديت های شناسايي URI. انتخاب 3

• http://dbpedia.org/resource/New_York_City ← Thing• http://dbpedia.org/data/New_York_City ← RDF data• http://dbpedia.org/page/New_York_City ← HTML page

• http://kmi.open.ac.uk/people/tom/ ← Thing• http://kmi.open.ac.uk/people/tom/rdf ← RDF data• http://kmi.open.ac.uk/people/tom/html ← HTML page

1389/2/26

Page 45: مقدمه ای بر داده های پيوندی

45

. لينک به ديگر داده ها4 تعدادی ازpredicateهای معروف برای لينک دادن

owl:sameAs

foaf:homepage

foaf:topic

foaf:based_near

foaf:maker/foaf:made

foaf:depiction

foaf:primaryTopic

rdfs:seeAlso

1389/2/26

Page 46: مقدمه ای بر داده های پيوندی

46

. لينک دادن به مجموعه داده های ديگر4

الگوريتم های لينک دهی•(String Matchingتطابق رشته ای )•

تطابق مبتنی بر کليد مشترک• UNSPSC و ISBNمثال •

تطابق مبتنی بر خصوصيات•اگر دو موجوديت دارای برچسب يکسان، نوع يکسان و ... يکسان •

باشند

1389/2/26

Page 47: مقدمه ای بر داده های پيوندی

47

چرا داده های پيوندی انتشار يابند؟

سادگی يافتن•

سادگی مصرف•اشتراک داده به صورت استاندارد•

کاهش تکرار•

ارزش افزوده•

1389/2/26

Page 48: مقدمه ای بر داده های پيوندی

48

مزايای داده های پيوندی

(Publishing Dataروش برای انتشار داده ها بر روی وب )•

استفاده مجدد را باال می برد•

تکرار را کاهش می دهد.•

سادگي مصرف، اشتراک داده به صورت استاندارد•

اتصاالت داخلی را افزايش می دهد.•

باعث افزايش ارزش برای داده ها می شود.•

1389/2/26

Page 49: مقدمه ای بر داده های پيوندی

49 1389/2/26

Linked Data Applications

Page 50: مقدمه ای بر داده های پيوندی

50

تعدادی از برنامه های که از داده های پيوندی استفاده می کنند

1389/2/26

Page 51: مقدمه ای بر داده های پيوندی

51

تعدادی از ابزارهای توسعه يافته شده

مرورگرها••Marbles & DBPedia Mobile

جستجو•Falconsبا استفاده از •

•Mashup• Revyu ، BBC Music

1389/2/26

Page 52: مقدمه ای بر داده های پيوندی

52

SPARQL و RDFa،GRDDLاليه اول :

•RDFa

1389/2/26

Page 53: مقدمه ای بر داده های پيوندی

53

RDFaتوصيف يک مقاله با استفاده از

1389/2/26

Page 54: مقدمه ای بر داده های پيوندی

54

RDFaبا استفاده از توصيف يک عکس

1389/2/26

Page 55: مقدمه ای بر داده های پيوندی

55

RDFaتوصيف يک شخص در سند با استفاده از

1389/2/26

Page 56: مقدمه ای بر داده های پيوندی

56

آينده داده های پيوندی

همه گير شدن استفاده از تکنولوژی نياز به زمان و شرايط محيطی دارد.•

داده های پيوندی در حوزه های دولتی و سازمانی اعمال خواهد 2010در سال •شد

ابزارها و کتابخانه های داده های پيوندی همه گير خواهد شد. 2011 در سال • در برنامه هايشان همچون يک پايگاه داده محلی استفاده LODبرنامه نويسان از

می کنند.

به وجود خواهد آمد. و مسايل LOD هزاران مجموعه داده 2012در سال • و مجموعه داده های پويا حل خواهد شد. Provananceمربوط به

•Special Issue of Web Semantic Journal Sep 2010

راه حلهای مبتنی بر داده های پيوندی به عنوان راه حلهايي 2013در سال •SOA.سازمانها خواهد شد

داده های پيوندی همچون يک درس ابتدايي خواهد شد. 2014در سال •بازی تمام شده است•1389/2/26معما چو حل گشت آسان شود.•

Page 57: مقدمه ای بر داده های پيوندی

57

؟

1389/2/26

Page 58: مقدمه ای بر داده های پيوندی

58/

با تشکر از حoسن توجه شما

1389/2/26

Page 59: مقدمه ای بر داده های پيوندی

59

رتبه بندی در داده های پيوندی موتورهای جستجو در وب سنتی دارای بخشي برای رتبه بندی هستند

،هدف اصلي رتبه بندی اسناد است در وب ستنی

.در وب جديد، هدف اصلی رتبه بندی موجوديت ها است

هر چقدر لينک به يک موجوديت بيشتر شود احتماال آن موجوديت در بين موجوديت های مشابه خودش دارای اعتبار بيشتری است.

عالوه بر تعداد لينک به يک داده در اين ساختار، معيارهای ديگری نيز الزم است اين که يک داده چقدر اعتبار دارد، چفدر به روز است، منشا آن مدنظر قرار گيرند.

تواند در رتبه کجاست و مفاهيم ديگری که همگی مرتبط با کيفيت داده است میبندی مفاهيم مدنظر باشد.

1389/2/26

Page 60: مقدمه ای بر داده های پيوندی

60 1389/2/26

موتور جستجوی مبتنی بر داده های پيوندی