constructing the ontology of digital 2 0 1 4 d a d h...linked open data (lod) sig ontologies...
TRANSCRIPT
建構數位藝術史的知識本體:對應方法研究
Constructing the Ontology of Digital Art History: A Mapping Study
陳淑君、凌苡家Sophy S.J.Chen, Y.J. Ling
中央研究院臺灣史研究所Institute of Taiwan History, Academia Sinica
第五屆數位典藏與數位人文國際研討會台北: 中央研究院
2014/12/01
2 0 1 4 D A D H
研究藍圖與目的
Digital Humanities
藝術史數位研究環境
LODLinked OpenData
Text/ImageAnnotation
Digital Publishing
Discussion Forum
Timeline Builder
Bibliography Builder
Text/ImageComparison
GIS
Global Outlook::Digital Humanities(GO::DH) SIGGeoHumanities SIG
Linked Open Data (LOD) SIG
Ontologies 知識本體
URIs (Uniform Resource Identifiers) Design
RDF (Resource Description Framework) triples
Applications (e.g. relationship finder)
研究計畫日本 LODAC Museum: Linked Open Data for Academia英國 OpenART: Open Metadata for Art Research at the Tate英國 Yale Center for British Art英國 British Museum美國 Getty LOD美國 Linked Open Data and American Art方法
Form Datasets/Metadata to OntologiesBy Semantic Mapping
Digital Art History Linked Open Data Ontologies (CIDOC CRM) Metadata Datasets
2 0 1 4 D A D H
知識本體(ontology)意指一個領域內共享概念化的正式而明確的規範, 以讓系統與系統之間,具
備更好的溝通,並可達到整合知識與自動推論.
2 0 1 4 D A D H
International Committee for Documentation, Conceptual Reference Model (CIDOC CRM)國際文獻工作委員會概念參考模型
以事件(event)為中心的
知識本體
• 89個概念類別(Entities)
• 152個概念屬性
(Properties)
2 0 1 4 D A D H
研究對象以日治時期的台灣畫家陳澄波為核心的人、時、事、地、物與主題等不同類型的資料集,總計759筆記錄為基礎
2 0 1 4 D A D H
研擬藝術史的學習者或研究者可能感興趣的問題,目標是讓知識本體有能力回答該問題
「畫家陳澄波有那些以西湖為場景的不同創作階段之作品及其相關檔案?其中
入選台展的是那幾幅?入選帝展的是那幾幅?」Which work in different stages of
creation or related file of painter Chen Cheng-po that portrays West Lake? Among these works, which one
was selected for the Taiwan Art Exhibition (Taiten)? Which one was selected for the Imperial Art Exhibition
(Teiten)?”
列舉查詢問句
創作
作品
西湖 West Lake
速寫sketch
完稿
相關檔案相同畫面明信片
…
陳澄波 Chen Cheng-po台展 Taiten
帝展 Teiten
+ 入
選
=
=
?
?
2 0 1 4 D A D H
識別相關資訊以搜尋法與瀏覽法地毯式識別出資料集可以滿足此查詢問句的相關(relevance)資料內容
資料類型 編號. 資料內容畫作 1. 清流
2. 西湖(橋)3. 西湖春色 [1933]
(未有畫作,圖片取自陳澄波照片)
4. 西湖春色 [1934]
(未有畫作,圖片取自明信片圖案)
5. 杭州-SB19:34
6. 杭州古厝書信往來(明信片)
7. 林玉山寄給陳澄波的明信片8. 吳文龍寄給陳澄波的明信片9. 石川欽一郎寄給陳澄波的明信片10. 陳澄波寄給石川一水的明信片(陳澄波《西湖春色》1934)
照片 11. 陳澄波與《西湖春色》合影(陳澄波《西湖春色》1933)12. 陳澄波攝於上海
展覽會 13. 台灣美術展覽會14. 帝國美術展覽會
地點 15. 西湖人物 16. 陳澄波
2 0 1 4 D A D H
相同物作的中英文版本的資料混雜在搜尋結果中, 並未
建立語意連結關係
分析資料集語意化問題
觀察目前的資料集應用於「從北緯23.5° 出發:陳澄波」主題網站:
如: 語意關係建立不完整,而產生不應出現或必需再區分的物件資
料
2 0 1 4 D A D H
對應後設資料標準基於各種國際通用的Metadata格式與標準進行研究實作,藉此觀察與分析不同Metadata標準對應至原始資料集,及隱藏的語意關係之滿足程度
AAT ULAN TGN
CDWA
CONA
+三大類標準: 資料結構, 資料內容 & 控制詞彙
=
Data-set Metadata Std.
Events Exhibition/Loan History (CDWA)
Title or Name
第一屆全國美術展覽會(1st National Fine Art Exhibition)
第三屆台灣美術展覽會(3rd Taiwan Art Exhibition)
Venue-Place
上海Shanghai
台灣Taiwan
Venue-Dates
1929 1929
2 0 1 4 D A D H
原資料集欄位 欄位語意分析 Subject欄位關鍵詞
Subject
1描述畫作畫面
古宅●船舶●湖泊●荷葉●船舶●湖泊●拱橋●雪●電線桿●一河兩岸●廟宇●飛簷●陽台●屋頂●欄杆●晾衣架●盆栽●草坪●拱廊●校園●教會學校
2畫作所描述的地點
杭州●西湖●斷橋●嘉義●溫陵媽祖廟●國華街●新樓●長榮女中●臺南
3畫作主題類型
風景畫●點景人物
4畫作所參與過的展覽
總督府美術展覽會(府展)
問題討論1:傳統資料集對應到後設資料標準,經常面臨語意模糊問題
對應後設資料標準
傳統資料集
欄位內容語意分析
資料集的Subject欄位內容,
應可再細分為:
(1)描述畫作畫面的詞彙
(2)畫作所描繪的地點
(3)畫作主題類型
(4)畫作所參與過的展覽
以上四種不同類型的語意關係。
需進行欄位內容語意分析
2 0 1 4 D A D H
問題討論2:各種資料類型的後設資料之語意對應問題
對應後設資料標準
Q: 物件資料如何對應至適當的後設資
料格式?
以「畫作」類型為例:
1. 原畫作的數位檔
2. 經由明信片複製而成的畫作數
位檔(postcard)
3. 只有畫作的相關檔案資料
(photo)
1.
2.
3.
2 0 1 4 D A D H
Q:同一創作者的不同作品可能具有相同品名,其語意關係的釐清?所衍生的作品與其相關檔案之間的語意關係也需要被適時考量與設計。
《西湖春色》
陳澄波與《西湖春色》合影
林玉山寄給陳澄波的明信片
1933
1934
原作圖像 相關檔案(照片,明信片)
入選第7回臺展
入選第15回帝展
事件
《西湖春色》
2 0 1 4 D A D H
對應知識本體標準以《西湖春色》1934作品為例,呈現本研究從後設資料標準對應至知識本體的細節
原資料集Subject欄位語意不清,經
分析後,利用CIDOC CRM可描述更
清楚語意關係
From Dataset to Metadata Stds.
2畫作所描述的地點
都柏林核心集(Dublin Core)
Coverage.spatial
skos:exactMatch(精準等同關係)
E84 Informatin Carrier →P138 has representation
→E38 Image →P62 depicts
→E27 Site
From Metadata Stds.to the ontology
2 0 1 4 D A D H
OriginalDataset
Metadata(Dublin Core)
Ontology(CIDOC CRM)
From the Dataset to Ontology畫作<清流>的描繪地點是”西湖”
Work subject畫作主題<清流> “西湖”
Work coverage-spatial
畫作空間範圍<清流> “西湖”
Work depict site畫作描繪地點<清流> “西湖”
Creator: Chen Cheng-poTitle: Stream 1929 Materials & Techniques:Oil on canvas Dimension:72.5x60.5 cm Private Collection
2 0 1 4 D A D H
本研究知識本體之示意圖: 以CIDOC CRM為基礎之研究實作範例
畫家陳澄波有那些以西湖為場景的不同創作階段之作品及其相關檔案?其中入選台展的是那幾幅?入選帝展的是那幾幅?
2 0 1 4 D A D H
CIDOC CRM路徑正規描述
同一作品有不同創作階段
作者為陳澄波的畫作
以西湖為描繪內容的畫作
入選展覽的作品
作品的相關檔案
陳澄波以西湖為場景的畫作有:《杭州古厝》、《清流》、《西湖(橋)》、《西湖春色》1933、《西湖春色》1934等5幅
有一速寫《杭州SB19:34》 ,經畫面辨識為《西湖春色》, 1934之草稿,在此處之將其解析為創作過程中《杭州SB19:34》此草稿影響了畫作完成。
《西湖春色》1933有相關物件《陳澄波與《西湖春色》合影;《西湖春色》1934有相關物件《陳澄波寄給石川一水的明信片》其明信片圖案為《西湖春色》1934,另有《吳文龍寄給陳澄波的明信片》、《石川欽一郎寄給陳澄波的明信片》、《林玉山寄給陳澄波的明信片》其內容皆為祝賀《西湖春色》1934入選帝展。
《清流》入選第三回台灣美術展覽會;《西湖春色》1933入選第七回台灣美術展覽會;《西湖春色》1934入選第十五回帝國美術院展覽會。
2 0 1 4 D A D H
建立知識本體的應用工具
本研究以史丹佛大學所開發的Protégé 4.3版進行前述知識本體的研究實作
Class
Property
Individuals
Individuals
內容編輯Individuals
property 聲明
2 0 1 4 D A D H
• 以本研究設定問句中的「以西湖為場景的畫作」為例,進行查詢後,可得到6筆結果:
1. 創作《清流》2. 創作《西湖(橋)》3. 創作《西湖春色1933》4. 創作《西湖春色1934》5. 創作《杭州-SB19:34》6. 創作《杭州古厝》
等6個創作事件
創作事件Extend
可由以西湖為中心的創作
事件,推論到作者(陳澄波)、
其創作的畫作,畫作創作
時間、畫作參展資訊…等,
藉此可發現以人工方式未
能發掘的隱性關係
地點class與其individuals 西湖
6
12
3
54
作者陳澄波
畫作《西湖春色》1934
畫作參與展覽 - 第十五回帝展展覽時間1934年
展覽地點東京美術館
主題西湖
《西湖春色》1934創作事件
2 0 1 4 D A D H
結論
• 藉由知識本體的建置,改善目前資料庫系統在回應查詢問句時,無法將
資訊之間的語意關係完善地呈現之情形
• 本研究檢視目前發展的知識本體應用於語意檢索的可行性,初步結果顯
示欄位式資料集轉換為語意化的知識本體模型後,可以回答本研究最初
設計的語意查詢問句
• 為數位藝術史領域的知識本體建構,提供一個以事件本體論的實作範例
• 為藝術史資料庫的資料語意化研究提供有可行的步驟模組
2 0 1 4 D A D H
未來應用與研究工作
European Commission
• 持續擴充以語意關係為核心的人時事地物之後設資料記錄,
• 進行統一資源標識符(Uniform Resource Identifier, URI)研究目前
2 0 1 4 D A D H
Metadata
ontology
subjecet
object
subjecet
object
object
object
predicate
Triples
• 進行與美術史相關的各種類型事件、畫家之間的人際網絡近期
未來
• 運用其知識本體作為轉換各類後設資料為RDF Triples時之建立關
連依據,發布Linked Open Data,開放資料於公眾使用,強化藝
術史的數位研究環境2 0 1 4 D A D H
Thanks for your
attention2 0 1 4 D A D H