כמקרה מבחן dbpedia פרסום אונטולוגיות ונתונים מקושרים

Post on 12-Jul-2015

86 Views

Category:

Internet

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

DBPEDIA

and how to publish

ontologies and linked data

on the web

שלדרכי הפרסום מהן

נתונים מקושריםואונטולוגיות

ברשת

כמקרה מבחן DBpedia

וובארכיטקטורת

בוובפרסום

שלההפרסוםודרכיאונטולוגיה

שלהםפרסוםודרכימקושריםנתונים

DBpedia

ראשי פרקים

ארכיטקטורת ווב

ווב קלאסי שואף להיותווב סמנטי

HTTP

URI

HTML XMLRDF

RDFSOWL

שפה טבעית

מבניות ברמה

של מסמך

מבניות ברמה

של פריט מידע

מושגים

מוגדרים

לכל פריט

נתונים

לכל /לכל מסמך

קבוצת מסמכים

מידע העשיר

סמנטית

קישוריות בין

מסמכים

קישוריות בין

פריטי נתונים

גם אלה

הממוקמים

בשרתי ווב

שונים

גם אלה

הממוקמים

במערכי

נתונים שונים

פרסום בווב

"פרסום בווב"אין הגדרה אחידה למושג •

אך יש מספר פעילויות שניתן לראות אותן כפירסום •

:אחת מהן, או כהפצה במובן המשפטי

אם,קובץמארחשרת–(Hosting',אירוח')איחסון

הקובץאתיוצראובדיסקאותומאחסןהוא

.מאחסןשהואמהנתונים

Publishing and Linking on the Web: מתוך

?מה זה

:הגישה לעמודים המאוחסנים בשרת

דפדפן שולח בקשה לשרת המארח לקבל את הקובץ

שהדפדפן מציג למשתמש, השרת מגיב עם התוכן של הקובץ

Publishing and Linking on the Web: מתוך

:סמנטילפרסוםשונותגישות2לפחותיש

מיוחדנתוניםמודללפי,נתוניםכאובייקטיומידעמסמכיםפרסום1.

.הסמנטיהוובשל(בשפותקידוד)הפורמטובאמצעות

.יקרהיותרגישה.אונטולוגיותפיתוחגםמצריך

שלבפורמט,קיימיםנתוניםלבסיסיאולמסמכיםהערותהוספת2.

,RDFa,microdata)הסמנטיהוובשלדטאמטא

microformats).

Pollock, J. T. (2009).Semantic web for dummies: מתוך

פרסום סמנטי

אונטולוגיה ודרכי הפרסום שלה

מרכיבי האונטולוגיה

OWL <----- RDFS <----- RDF/XML <----- RDF

:שרעיונותעלשמתבססנתוניםמודל

(URI)ייחודיוובמזההלהיותצריךנתוניםפריטלכל-

ניתןעצמולקשרכאשר,אחרנתוניםפריטלכלמקושרלהיותיכולנתוניםפריטכל-

(URI)ייחודיוובמזהה

לקובץיRDF-ההגרףמרכיבילכתיבתביותרהנפוץתחביר

אונטולוגיהלתיאורהבסיסייםהאלמנטיםאתמספקת

יותררבהההבעהיכולתבעלתשפה .Pollock, J. T. (2009): מתוךSemantic web for dummies

מרכיביה אלה בעצם

מאפשרים את

פירסומה הסמנטי

עלדטאמטאשלוגם,האונטולוגיהשלמבנהותוכןלבטאיש•

.RDFנתוניםמודלידיעל,האונטולוגיה

המושגיםביןקשרלכלוגםבאונטולוגיהמושגלכללתתיש•

.URI–ייחודימזהה

כלשהוRDFתחבירלפיתוויםשלכסדרהRDFגרףלקודדיש•

(לקובץהגרףכתיבת)

שרתדרך,באתראלהקבציםפירסוםHTTPהגדרותמצריך)רגיל

(השרתבצדישירותאואונטולוגיהקבצילתקייתוהוספתוhtaccess.קובץכתיבת–השרתעבורמיוחדות

שרתידרךאלהקבציםפירסוםRDFמיוחדים(Virtuoso)

לאונטולוגיותבספריותפירסום(BioPortal)

Quick Guide to Publishing a Thesaurus on the Semantic Web: מתוך (2005)

הדרך לפרסום האונטולוגיה וסוגי פרסום שונים

לאדםהקריאתוכןלספקלשרתאומרותאלההגדרות

דפדפן/תוכנהלדרישתבהתאם,למחשבהקריאתוכןאו

אליוהפונים

(PURL-בלהיעזר)יציבURI-בפרסום1.

דטאומטא(בונכוןלשימושודוגמאותמושגלכלמדוייקותהגדרותלספק)תיעוד2.

דוגמא.אנושילמשתמשהקריאים

אנושילמשתמשהקריאכקובץוהןלמחשבהקריאכקובץזמינות3.

contentמנגוןידיעלהמתאפשרת negotiationבמפרטהמוגדרHTTP.

להמציאבמקום,בהןשהוגדרובמושגיםשימושידיעלאחרותלאונטולוגיותקישור4.

מחדש

(יוצריםזכויות)רצוייםרשיוןפרטיציון5.

Daniel Garijo. How to (properly) publish a vocabulary or ontology in the web (2013): מתוך

:מצריך גם עמידה בתנאים הבאים, פרסום אונטולוגיה כהלכה

Persistent uniform resource locator.

Registered user can get persistent URI

.כלשהונתוןURIלבקשתבתגובהמשאבתיאורשלשונותגרסאותלהגישמאפשרהמנגנון

(htaccess.קובץבהגדרותתלויהרגילHTTPבשרתפעילותו)

Dereference the vocabulary URI, requesting HTML content(Redirect the client to current HTML documentation for the vocabulary.)

Dereference the vocabulary URI (hash namespace)(Serve the RDF description of the vocabulary, encoded as RDF/XML.)

Best Practice Recipes for Publishing RDF Vocabularies (2008): מתוך

חזור לשקף קודם

של אונטולוגיה' RDFהגשת תיאור

של האונטולוגיה' HTMLהפניית דפדפן לתיעוד

content negotiationהמחשת פעילות המנגנון

נתונים מקושרים ודרכי פרסום שלהם

שיטה לפרסום נתונים מובנים–? מה זה נתונים מקושרים

,מקושריםנתוניםשלפרטימקרהבעצםהיא,כהלכההמפורסמתאונטולוגיה

:הםשעיקרונותיהם

אובייקטים/מושגיםשלכשמותURI-בשימוש1)

,משאבתיאורלאחזרהמאפשר,HTTPפרוטוקולדרךURI-בשימוש2)

(dereferention)זהURIידיעלהמזוהה

contentבעזרתתיאוריםמספראו negotiation

וקישוריותהנתוניםמבניותלהסדרת(האפשרויותכאחת)RDF/XML-וRDF-בשימוש3)

נתוןנתוניםמערךבתוךשלהם

למערכי נתונים אחרים בוובRDF-קביעת קישורי4)

קישורי יחסים

קישורי זהות

כולל מיפוי מונחים, קישורי אוצר מלים

Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך

אחד הקריא למחשבים*

אחד הקריא לבני אדם*

במערכישנמצאים,קשוריםנתוניםפרטיעלמצביעים–יחסיםקישורי•

.אחריםנתונים

ניתן,מישהושללידהמקום:הואנתוןבמערךנתוניםפריטכאשרלמשל

רקעמידעישבואחרנתוניםלמערך,יחסיקישורשיהיה,קישורלעשות

.זהמקוםעל

נתוניםבמערכיהמגדיריםתוכןספקימספרלהיותיכולים–זהותקישורי•

.היישויותאותןאתהמזהיםURIישכלומר–היישויותאותןאתשלהם

מערכיישנםכיהיודעספק.שוניםיהיויישותאותהלגביהמידע/ההגדרות

ידיעלבינהןלקשריכול,היישותאותהאתהמגדיריםנוספיםנתונים

owl#sameAs,שניכילצייןובכךURIהמשאבלאותומתייחסים.

מונחיםשללהגדרותנתוניםמפריטימצביעים–מליםאוצרקישורי•

.נתוניםפרטיאותםלייצוגהמשמשים(אונטולוגיה/מיליםבאוצר)

Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך

קצת יותר על סוגי הקישורים

נתונים סטאטיים

בפורמטים

שונים

המרה לפורמט RDF

-איחסון בRDF STORE

ממשק נתונים

מקושרים

(Virtuoso)

נתונים סטאטיים

בפורמט

RDF

-איחסון בRDF STORE

ממשק נתונים

מקושרים

(Virtuoso)

קבצי

סטאטיים RDF

שרת ווב קלאסי

(Apache)

מסד נתונים

יחסיים

שרת היוצר

מעטפת

ומפרסם תצוגת

נתונים מקושרים

מעל מסד

נתונים יחסיים

)D2R(

הכנת נתונים

אחסון נתונים

פרסום נתונים

סוג נתונים

נתונים מובנים

Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך

מספר אפשרויות פרסום של נתונים מקושרים

(LOD graph)גרף נתונים מקושרים

DBpedia

?Dbpediaמה היא

(crowdsourcing)קהילתיכמאמץומתוחזקשנוצרפרוייקט•

בוובאותוולפרסםWikipediaמתוךמובנהמידעלאחזר–מטרתו•

DBpediaכןועל,המקושריםהנתוניםעקרונותלפיהואהפירסום•

מערכישלמערכתנכוןיותר)מקושרנתוניםמערךבעצםהיא

.(במספר69מעל,מקושריםנתונים

,מושגיםמיליוניעבורמקושריםנתוניםשלURIמגדירהוהיאמאחר•

,אליהשלהםנתוניםממערכיRDFקישורייצרושוניםמידעספקי

.נתוניםוובבתוךהמרכזייםהמוקדיםלאחדאותההפכוובכך

DBpediaקצת נתונים על תוכן מערכי נתונים של

מזההיURI(יחדהשפותבכל)יישויותמיליון24.9עבור

נוספותשפות119+אנגלית

4נתוניםמערךשלהאנגליתבגרסהמתואריםמליוןDBpedia

,Dbpediaאונטולוגייתידיעלמסווגיםמיליון3.2מתוכם•

מקומות639,000-ואנשים832,000כולל•

מידעפרטימיליארד2.46כ"בסה(שלשותRDF)

24.6לתמונותקישוריםמיליון

27.6חיצונייםרלוונטייםוובלדפיקישוריםמיליון

45חיצונייםנתוניםלמערכיקישוריםמיליון

קטגוריזציות

67ויקיפדיהלקטגוריותקישוריםמיליון

41.2לקטגוריותקישוריםמיליוןYAGO(לקטגוריותויקיפדיהנתוניאיחודwordnet)

529באונטולוגייתמאפיינים2333ידיעלהמתוארותמחלקותDbpedia

מצבורי ויקיפדיה

איחזור נתונים בשיטות שונות

RDFשלשות

אונטולוגיה בהם , מערכי נתונים

ליישות יש דף ויקיפדיה

תואם באנגלית

בהם , מערכי נתונים

ליישות אין דף ויקיפדיה

תואם באנגלית

ה

מ

ר

ה

Virtuoso (RDF STORE)

העלאה ואיחסון

http://dbpedia.org/data/Name

http://dbpedia.org/page/NameSPARQL

endpoint

RDFתיאורהמשאבשל

HTMLתיאורהמשאבשל

RDFקבצי של מערכי הנתונים

Berlinשל המשאב HTMLתיאור (http://dbpedia.org/resource/ Berlin )

abstract:מאפייןDBpediaבאונטולוגייתשהוגדר

URI שניתן לתיאורHTMLי זה

קישורי זהות

Dbpediaעם מערכי נתונים של בשפות אחרות

עם מערכי נתונים חיצוניים

Berlinשל המשאב RDFתיאור (http://dbpedia.org/resource/ Berlin )

,http://dbpedia.org/data/Berlin,זהמשאבשליRDFלתיאורשניתןURIהקלדת1.

<? "xml:<?xml version="1.0" encoding="utf-8קובץלהורדתמביאההקלאסיבדפדפן<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:owl="http://www.w3.org/2002/07/owl#"xmlns:dbpprop="http://dbpedia.org/property/"xmlns:dcterms="http://purl.org/dc/terms/"xmlns:ns5="http://dbpedia.org/ontology/PopulatedPlace/"xmlns:dbpedia-owl="http://dbpedia.org/ontology/"xmlns:foaf="http://xmlns.com/foaf/0.1/"xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"xmlns:ns9="http://www.w3.org/ns/prov#"xmlns:grs="http://www.georss.org/georss/" >

<rdf:Description rdf:about="http://dbpedia.org/resource/1906_German_football_championship"><dbpprop:location rdf:resource="http://dbpedia.org/resource/Berlin" />

</rdf:Description><rdf:Description rdf:about="http://dbpedia.org/resource/1959_German_football_championship">

<dbpedia-owl:city rdf:resource="http://dbpedia.org/resource/Berlin" /><dbpprop:city rdf:resource="http://dbpedia.org/resource/Berlin" />

</rdf:Description>...<owl:sameAs rdf:resource="http://pl.dbpedia.org/resource/Berlin" /><owl:sameAs rdf:resource="http://el.dbpedia.org/resource/Βερολίνο" /><owl:sameAs rdf:resource="http://it.dbpedia.org/resource/Berlino" /><owl:sameAs rdf:resource="http://yago-knowledge.org/resource/Berlin" /><owl:sameAs rdf:resource="http://es.dbpedia.org/resource/Berlín" />

Berlinשל המשאב RDFתיאור (http://dbpedia.org/resource/ Berlin )

,http://dbpedia.org/data/Berlin,זהמשאבשליRDFלתיאורשניתןURIהקלדת.2

:שלשותשלזוובינהן,שונותתצוגותלקבלמאפשר,למשל,Virtuosoשלהסמנטיהוובבדפדפן

top related