כמקרה מבחן dbpedia פרסום אונטולוגיות ונתונים מקושרים
TRANSCRIPT
DBPEDIA
and how to publish
ontologies and linked data
on the web
שלדרכי הפרסום מהן
נתונים מקושריםואונטולוגיות
ברשת
כמקרה מבחן DBpedia
וובארכיטקטורת
בוובפרסום
שלההפרסוםודרכיאונטולוגיה
שלהםפרסוםודרכימקושריםנתונים
DBpedia
ראשי פרקים
ארכיטקטורת ווב
ווב קלאסי שואף להיותווב סמנטי
HTTP
URI
HTML XMLRDF
RDFSOWL
שפה טבעית
מבניות ברמה
של מסמך
מבניות ברמה
של פריט מידע
מושגים
מוגדרים
לכל פריט
נתונים
לכל /לכל מסמך
קבוצת מסמכים
מידע העשיר
סמנטית
קישוריות בין
מסמכים
קישוריות בין
פריטי נתונים
גם אלה
הממוקמים
בשרתי ווב
שונים
גם אלה
הממוקמים
במערכי
נתונים שונים
פרסום בווב
"פרסום בווב"אין הגדרה אחידה למושג •
אך יש מספר פעילויות שניתן לראות אותן כפירסום •
:אחת מהן, או כהפצה במובן המשפטי
אם,קובץמארחשרת–(Hosting',אירוח')איחסון
הקובץאתיוצראובדיסקאותומאחסןהוא
.מאחסןשהואמהנתונים
Publishing and Linking on the Web: מתוך
?מה זה
:הגישה לעמודים המאוחסנים בשרת
דפדפן שולח בקשה לשרת המארח לקבל את הקובץ
שהדפדפן מציג למשתמש, השרת מגיב עם התוכן של הקובץ
Publishing and Linking on the Web: מתוך
:סמנטילפרסוםשונותגישות2לפחותיש
מיוחדנתוניםמודללפי,נתוניםכאובייקטיומידעמסמכיםפרסום1.
.הסמנטיהוובשל(בשפותקידוד)הפורמטובאמצעות
.יקרהיותרגישה.אונטולוגיותפיתוחגםמצריך
שלבפורמט,קיימיםנתוניםלבסיסיאולמסמכיםהערותהוספת2.
,RDFa,microdata)הסמנטיהוובשלדטאמטא
microformats).
Pollock, J. T. (2009).Semantic web for dummies: מתוך
פרסום סמנטי
אונטולוגיה ודרכי הפרסום שלה
מרכיבי האונטולוגיה
OWL <----- RDFS <----- RDF/XML <----- RDF
:שרעיונותעלשמתבססנתוניםמודל
(URI)ייחודיוובמזההלהיותצריךנתוניםפריטלכל-
ניתןעצמולקשרכאשר,אחרנתוניםפריטלכלמקושרלהיותיכולנתוניםפריטכל-
(URI)ייחודיוובמזהה
לקובץיRDF-ההגרףמרכיבילכתיבתביותרהנפוץתחביר
אונטולוגיהלתיאורהבסיסייםהאלמנטיםאתמספקת
יותררבהההבעהיכולתבעלתשפה .Pollock, J. T. (2009): מתוךSemantic web for dummies
מרכיביה אלה בעצם
מאפשרים את
פירסומה הסמנטי
עלדטאמטאשלוגם,האונטולוגיהשלמבנהותוכןלבטאיש•
.RDFנתוניםמודלידיעל,האונטולוגיה
המושגיםביןקשרלכלוגםבאונטולוגיהמושגלכללתתיש•
.URI–ייחודימזהה
כלשהוRDFתחבירלפיתוויםשלכסדרהRDFגרףלקודדיש•
(לקובץהגרףכתיבת)
שרתדרך,באתראלהקבציםפירסוםHTTPהגדרותמצריך)רגיל
(השרתבצדישירותאואונטולוגיהקבצילתקייתוהוספתוhtaccess.קובץכתיבת–השרתעבורמיוחדות
שרתידרךאלהקבציםפירסוםRDFמיוחדים(Virtuoso)
לאונטולוגיותבספריותפירסום(BioPortal)
Quick Guide to Publishing a Thesaurus on the Semantic Web: מתוך (2005)
הדרך לפרסום האונטולוגיה וסוגי פרסום שונים
לאדםהקריאתוכןלספקלשרתאומרותאלההגדרות
דפדפן/תוכנהלדרישתבהתאם,למחשבהקריאתוכןאו
אליוהפונים
(PURL-בלהיעזר)יציבURI-בפרסום1.
דטאומטא(בונכוןלשימושודוגמאותמושגלכלמדוייקותהגדרותלספק)תיעוד2.
דוגמא.אנושילמשתמשהקריאים
אנושילמשתמשהקריאכקובץוהןלמחשבהקריאכקובץזמינות3.
contentמנגוןידיעלהמתאפשרת negotiationבמפרטהמוגדרHTTP.
להמציאבמקום,בהןשהוגדרובמושגיםשימושידיעלאחרותלאונטולוגיותקישור4.
מחדש
(יוצריםזכויות)רצוייםרשיוןפרטיציון5.
Daniel Garijo. How to (properly) publish a vocabulary or ontology in the web (2013): מתוך
:מצריך גם עמידה בתנאים הבאים, פרסום אונטולוגיה כהלכה
Persistent uniform resource locator.
Registered user can get persistent URI
.כלשהונתוןURIלבקשתבתגובהמשאבתיאורשלשונותגרסאותלהגישמאפשרהמנגנון
(htaccess.קובץבהגדרותתלויהרגילHTTPבשרתפעילותו)
Dereference the vocabulary URI, requesting HTML content(Redirect the client to current HTML documentation for the vocabulary.)
Dereference the vocabulary URI (hash namespace)(Serve the RDF description of the vocabulary, encoded as RDF/XML.)
Best Practice Recipes for Publishing RDF Vocabularies (2008): מתוך
חזור לשקף קודם
של אונטולוגיה' RDFהגשת תיאור
של האונטולוגיה' HTMLהפניית דפדפן לתיעוד
content negotiationהמחשת פעילות המנגנון
נתונים מקושרים ודרכי פרסום שלהם
שיטה לפרסום נתונים מובנים–? מה זה נתונים מקושרים
,מקושריםנתוניםשלפרטימקרהבעצםהיא,כהלכההמפורסמתאונטולוגיה
:הםשעיקרונותיהם
אובייקטים/מושגיםשלכשמותURI-בשימוש1)
,משאבתיאורלאחזרהמאפשר,HTTPפרוטוקולדרךURI-בשימוש2)
(dereferention)זהURIידיעלהמזוהה
contentבעזרתתיאוריםמספראו negotiation
וקישוריותהנתוניםמבניותלהסדרת(האפשרויותכאחת)RDF/XML-וRDF-בשימוש3)
נתוןנתוניםמערךבתוךשלהם
למערכי נתונים אחרים בוובRDF-קביעת קישורי4)
קישורי יחסים
קישורי זהות
כולל מיפוי מונחים, קישורי אוצר מלים
Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך
אחד הקריא למחשבים*
אחד הקריא לבני אדם*
במערכישנמצאים,קשוריםנתוניםפרטיעלמצביעים–יחסיםקישורי•
.אחריםנתונים
ניתן,מישהושללידהמקום:הואנתוןבמערךנתוניםפריטכאשרלמשל
רקעמידעישבואחרנתוניםלמערך,יחסיקישורשיהיה,קישורלעשות
.זהמקוםעל
נתוניםבמערכיהמגדיריםתוכןספקימספרלהיותיכולים–זהותקישורי•
.היישויותאותןאתהמזהיםURIישכלומר–היישויותאותןאתשלהם
מערכיישנםכיהיודעספק.שוניםיהיויישותאותהלגביהמידע/ההגדרות
ידיעלבינהןלקשריכול,היישותאותהאתהמגדיריםנוספיםנתונים
owl#sameAs,שניכילצייןובכךURIהמשאבלאותומתייחסים.
מונחיםשללהגדרותנתוניםמפריטימצביעים–מליםאוצרקישורי•
.נתוניםפרטיאותםלייצוגהמשמשים(אונטולוגיה/מיליםבאוצר)
Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך
קצת יותר על סוגי הקישורים
נתונים סטאטיים
בפורמטים
שונים
המרה לפורמט RDF
-איחסון בRDF STORE
ממשק נתונים
מקושרים
(Virtuoso)
נתונים סטאטיים
בפורמט
RDF
-איחסון בRDF STORE
ממשק נתונים
מקושרים
(Virtuoso)
קבצי
סטאטיים RDF
שרת ווב קלאסי
(Apache)
מסד נתונים
יחסיים
שרת היוצר
מעטפת
ומפרסם תצוגת
נתונים מקושרים
מעל מסד
נתונים יחסיים
)D2R(
הכנת נתונים
אחסון נתונים
פרסום נתונים
סוג נתונים
נתונים מובנים
Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך
מספר אפשרויות פרסום של נתונים מקושרים
(LOD graph)גרף נתונים מקושרים
DBpedia
?Dbpediaמה היא
(crowdsourcing)קהילתיכמאמץומתוחזקשנוצרפרוייקט•
בוובאותוולפרסםWikipediaמתוךמובנהמידעלאחזר–מטרתו•
DBpediaכןועל,המקושריםהנתוניםעקרונותלפיהואהפירסום•
מערכישלמערכתנכוןיותר)מקושרנתוניםמערךבעצםהיא
.(במספר69מעל,מקושריםנתונים
,מושגיםמיליוניעבורמקושריםנתוניםשלURIמגדירהוהיאמאחר•
,אליהשלהםנתוניםממערכיRDFקישורייצרושוניםמידעספקי
.נתוניםוובבתוךהמרכזייםהמוקדיםלאחדאותההפכוובכך
DBpediaקצת נתונים על תוכן מערכי נתונים של
מזההיURI(יחדהשפותבכל)יישויותמיליון24.9עבור
נוספותשפות119+אנגלית
4נתוניםמערךשלהאנגליתבגרסהמתואריםמליוןDBpedia
,Dbpediaאונטולוגייתידיעלמסווגיםמיליון3.2מתוכם•
מקומות639,000-ואנשים832,000כולל•
מידעפרטימיליארד2.46כ"בסה(שלשותRDF)
24.6לתמונותקישוריםמיליון
27.6חיצונייםרלוונטייםוובלדפיקישוריםמיליון
45חיצונייםנתוניםלמערכיקישוריםמיליון
קטגוריזציות
67ויקיפדיהלקטגוריותקישוריםמיליון
41.2לקטגוריותקישוריםמיליוןYAGO(לקטגוריותויקיפדיהנתוניאיחודwordnet)
529באונטולוגייתמאפיינים2333ידיעלהמתוארותמחלקותDbpedia
מצבורי ויקיפדיה
איחזור נתונים בשיטות שונות
RDFשלשות
אונטולוגיה בהם , מערכי נתונים
ליישות יש דף ויקיפדיה
תואם באנגלית
בהם , מערכי נתונים
ליישות אין דף ויקיפדיה
תואם באנגלית
ה
מ
ר
ה
Virtuoso (RDF STORE)
העלאה ואיחסון
http://dbpedia.org/data/Name
http://dbpedia.org/page/NameSPARQL
endpoint
RDFתיאורהמשאבשל
HTMLתיאורהמשאבשל
RDFקבצי של מערכי הנתונים
Berlinשל המשאב HTMLתיאור (http://dbpedia.org/resource/ Berlin )
abstract:מאפייןDBpediaבאונטולוגייתשהוגדר
URI שניתן לתיאורHTMLי זה
קישורי זהות
Dbpediaעם מערכי נתונים של בשפות אחרות
עם מערכי נתונים חיצוניים
Berlinשל המשאב RDFתיאור (http://dbpedia.org/resource/ Berlin )
,http://dbpedia.org/data/Berlin,זהמשאבשליRDFלתיאורשניתןURIהקלדת1.
<? "xml:<?xml version="1.0" encoding="utf-8קובץלהורדתמביאההקלאסיבדפדפן<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:owl="http://www.w3.org/2002/07/owl#"xmlns:dbpprop="http://dbpedia.org/property/"xmlns:dcterms="http://purl.org/dc/terms/"xmlns:ns5="http://dbpedia.org/ontology/PopulatedPlace/"xmlns:dbpedia-owl="http://dbpedia.org/ontology/"xmlns:foaf="http://xmlns.com/foaf/0.1/"xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"xmlns:ns9="http://www.w3.org/ns/prov#"xmlns:grs="http://www.georss.org/georss/" >
<rdf:Description rdf:about="http://dbpedia.org/resource/1906_German_football_championship"><dbpprop:location rdf:resource="http://dbpedia.org/resource/Berlin" />
</rdf:Description><rdf:Description rdf:about="http://dbpedia.org/resource/1959_German_football_championship">
<dbpedia-owl:city rdf:resource="http://dbpedia.org/resource/Berlin" /><dbpprop:city rdf:resource="http://dbpedia.org/resource/Berlin" />
</rdf:Description>...<owl:sameAs rdf:resource="http://pl.dbpedia.org/resource/Berlin" /><owl:sameAs rdf:resource="http://el.dbpedia.org/resource/Βερολίνο" /><owl:sameAs rdf:resource="http://it.dbpedia.org/resource/Berlino" /><owl:sameAs rdf:resource="http://yago-knowledge.org/resource/Berlin" /><owl:sameAs rdf:resource="http://es.dbpedia.org/resource/Berlín" />
Berlinשל המשאב RDFתיאור (http://dbpedia.org/resource/ Berlin )
,http://dbpedia.org/data/Berlin,זהמשאבשליRDFלתיאורשניתןURIהקלדת.2
:שלשותשלזוובינהן,שונותתצוגותלקבלמאפשר,למשל,Virtuosoשלהסמנטיהוובבדפדפן