constructing the ontology of digital 2 0 1 4 d a d h...linked open data (lod) sig ontologies...

22
建構數位藝術史的知識本體: 對應方法研究 Constructing the Ontology of Digital Art History: A Mapping Study 陳淑君、凌苡家 Sophy S.J.Chen, Y.J. Ling 中央研究院臺灣史研究所 Institute of Taiwan History, Academia Sinica 第五屆數位典藏與數位人文國際研討會 台北: 中央研究院 2014/12/01 2 0 1 4 D A D H

Upload: others

Post on 26-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

建構數位藝術史的知識本體:對應方法研究

Constructing the Ontology of Digital Art History: A Mapping Study

陳淑君、凌苡家Sophy S.J.Chen, Y.J. Ling

中央研究院臺灣史研究所Institute of Taiwan History, Academia Sinica

第五屆數位典藏與數位人文國際研討會台北: 中央研究院

2014/12/01

2 0 1 4 D A D H

Page 2: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

研究藍圖與目的

Digital Humanities

藝術史數位研究環境

LODLinked OpenData

Text/ImageAnnotation

Digital Publishing

Discussion Forum

Timeline Builder

Bibliography Builder

Text/ImageComparison

GIS

Global Outlook::Digital Humanities(GO::DH) SIGGeoHumanities SIG

Linked Open Data (LOD) SIG

Ontologies 知識本體

URIs (Uniform Resource Identifiers) Design

RDF (Resource Description Framework) triples

Applications (e.g. relationship finder)

研究計畫日本 LODAC Museum: Linked Open Data for Academia英國 OpenART: Open Metadata for Art Research at the Tate英國 Yale Center for British Art英國 British Museum美國 Getty LOD美國 Linked Open Data and American Art方法

Form Datasets/Metadata to OntologiesBy Semantic Mapping

Digital Art History Linked Open Data Ontologies (CIDOC CRM) Metadata Datasets

2 0 1 4 D A D H

Page 3: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

知識本體(ontology)意指一個領域內共享概念化的正式而明確的規範, 以讓系統與系統之間,具

備更好的溝通,並可達到整合知識與自動推論.

2 0 1 4 D A D H

Page 4: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

International Committee for Documentation, Conceptual Reference Model (CIDOC CRM)國際文獻工作委員會概念參考模型

以事件(event)為中心的

知識本體

• 89個概念類別(Entities)

• 152個概念屬性

(Properties)

2 0 1 4 D A D H

Page 5: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

研究對象以日治時期的台灣畫家陳澄波為核心的人、時、事、地、物與主題等不同類型的資料集,總計759筆記錄為基礎

2 0 1 4 D A D H

Page 6: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

研擬藝術史的學習者或研究者可能感興趣的問題,目標是讓知識本體有能力回答該問題

「畫家陳澄波有那些以西湖為場景的不同創作階段之作品及其相關檔案?其中

入選台展的是那幾幅?入選帝展的是那幾幅?」Which work in different stages of

creation or related file of painter Chen Cheng-po that portrays West Lake? Among these works, which one

was selected for the Taiwan Art Exhibition (Taiten)? Which one was selected for the Imperial Art Exhibition

(Teiten)?”

列舉查詢問句

創作

作品

西湖 West Lake

速寫sketch

完稿

相關檔案相同畫面明信片

陳澄波 Chen Cheng-po台展 Taiten

帝展 Teiten

+ 入

=

=

2 0 1 4 D A D H

Page 7: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

識別相關資訊以搜尋法與瀏覽法地毯式識別出資料集可以滿足此查詢問句的相關(relevance)資料內容

資料類型 編號. 資料內容畫作 1. 清流

2. 西湖(橋)3. 西湖春色 [1933]

(未有畫作,圖片取自陳澄波照片)

4. 西湖春色 [1934]

(未有畫作,圖片取自明信片圖案)

5. 杭州-SB19:34

6. 杭州古厝書信往來(明信片)

7. 林玉山寄給陳澄波的明信片8. 吳文龍寄給陳澄波的明信片9. 石川欽一郎寄給陳澄波的明信片10. 陳澄波寄給石川一水的明信片(陳澄波《西湖春色》1934)

照片 11. 陳澄波與《西湖春色》合影(陳澄波《西湖春色》1933)12. 陳澄波攝於上海

展覽會 13. 台灣美術展覽會14. 帝國美術展覽會

地點 15. 西湖人物 16. 陳澄波

2 0 1 4 D A D H

Page 8: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

相同物作的中英文版本的資料混雜在搜尋結果中, 並未

建立語意連結關係

分析資料集語意化問題

觀察目前的資料集應用於「從北緯23.5° 出發:陳澄波」主題網站:

如: 語意關係建立不完整,而產生不應出現或必需再區分的物件資

2 0 1 4 D A D H

Page 9: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

對應後設資料標準基於各種國際通用的Metadata格式與標準進行研究實作,藉此觀察與分析不同Metadata標準對應至原始資料集,及隱藏的語意關係之滿足程度

AAT ULAN TGN

CDWA

CONA

+三大類標準: 資料結構, 資料內容 & 控制詞彙

=

Data-set Metadata Std.

Events Exhibition/Loan History (CDWA)

Title or Name

第一屆全國美術展覽會(1st National Fine Art Exhibition)

第三屆台灣美術展覽會(3rd Taiwan Art Exhibition)

Venue-Place

上海Shanghai

台灣Taiwan

Venue-Dates

1929 1929

2 0 1 4 D A D H

Page 10: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

原資料集欄位 欄位語意分析 Subject欄位關鍵詞

Subject

1描述畫作畫面

古宅●船舶●湖泊●荷葉●船舶●湖泊●拱橋●雪●電線桿●一河兩岸●廟宇●飛簷●陽台●屋頂●欄杆●晾衣架●盆栽●草坪●拱廊●校園●教會學校

2畫作所描述的地點

杭州●西湖●斷橋●嘉義●溫陵媽祖廟●國華街●新樓●長榮女中●臺南

3畫作主題類型

風景畫●點景人物

4畫作所參與過的展覽

總督府美術展覽會(府展)

問題討論1:傳統資料集對應到後設資料標準,經常面臨語意模糊問題

對應後設資料標準

傳統資料集

欄位內容語意分析

資料集的Subject欄位內容,

應可再細分為:

(1)描述畫作畫面的詞彙

(2)畫作所描繪的地點

(3)畫作主題類型

(4)畫作所參與過的展覽

以上四種不同類型的語意關係。

需進行欄位內容語意分析

2 0 1 4 D A D H

Page 11: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

問題討論2:各種資料類型的後設資料之語意對應問題

對應後設資料標準

Q: 物件資料如何對應至適當的後設資

料格式?

以「畫作」類型為例:

1. 原畫作的數位檔

2. 經由明信片複製而成的畫作數

位檔(postcard)

3. 只有畫作的相關檔案資料

(photo)

1.

2.

3.

2 0 1 4 D A D H

Page 12: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

Q:同一創作者的不同作品可能具有相同品名,其語意關係的釐清?所衍生的作品與其相關檔案之間的語意關係也需要被適時考量與設計。

《西湖春色》

陳澄波與《西湖春色》合影

林玉山寄給陳澄波的明信片

1933

1934

原作圖像 相關檔案(照片,明信片)

入選第7回臺展

入選第15回帝展

事件

《西湖春色》

2 0 1 4 D A D H

Page 13: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

對應知識本體標準以《西湖春色》1934作品為例,呈現本研究從後設資料標準對應至知識本體的細節

原資料集Subject欄位語意不清,經

分析後,利用CIDOC CRM可描述更

清楚語意關係

From Dataset to Metadata Stds.

2畫作所描述的地點

都柏林核心集(Dublin Core)

Coverage.spatial

skos:exactMatch(精準等同關係)

E84 Informatin Carrier →P138 has representation

→E38 Image →P62 depicts

→E27 Site

From Metadata Stds.to the ontology

2 0 1 4 D A D H

Page 14: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

OriginalDataset

Metadata(Dublin Core)

Ontology(CIDOC CRM)

From the Dataset to Ontology畫作<清流>的描繪地點是”西湖”

Work subject畫作主題<清流> “西湖”

Work coverage-spatial

畫作空間範圍<清流> “西湖”

Work depict site畫作描繪地點<清流> “西湖”

Creator: Chen Cheng-poTitle: Stream 1929 Materials & Techniques:Oil on canvas Dimension:72.5x60.5 cm Private Collection

2 0 1 4 D A D H

Page 15: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

本研究知識本體之示意圖: 以CIDOC CRM為基礎之研究實作範例

畫家陳澄波有那些以西湖為場景的不同創作階段之作品及其相關檔案?其中入選台展的是那幾幅?入選帝展的是那幾幅?

2 0 1 4 D A D H

Page 16: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

CIDOC CRM路徑正規描述

同一作品有不同創作階段

作者為陳澄波的畫作

以西湖為描繪內容的畫作

入選展覽的作品

作品的相關檔案

陳澄波以西湖為場景的畫作有:《杭州古厝》、《清流》、《西湖(橋)》、《西湖春色》1933、《西湖春色》1934等5幅

有一速寫《杭州SB19:34》 ,經畫面辨識為《西湖春色》, 1934之草稿,在此處之將其解析為創作過程中《杭州SB19:34》此草稿影響了畫作完成。

《西湖春色》1933有相關物件《陳澄波與《西湖春色》合影;《西湖春色》1934有相關物件《陳澄波寄給石川一水的明信片》其明信片圖案為《西湖春色》1934,另有《吳文龍寄給陳澄波的明信片》、《石川欽一郎寄給陳澄波的明信片》、《林玉山寄給陳澄波的明信片》其內容皆為祝賀《西湖春色》1934入選帝展。

《清流》入選第三回台灣美術展覽會;《西湖春色》1933入選第七回台灣美術展覽會;《西湖春色》1934入選第十五回帝國美術院展覽會。

2 0 1 4 D A D H

Page 17: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

建立知識本體的應用工具

本研究以史丹佛大學所開發的Protégé 4.3版進行前述知識本體的研究實作

Class

Property

Individuals

Individuals

內容編輯Individuals

property 聲明

2 0 1 4 D A D H

Page 18: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

• 以本研究設定問句中的「以西湖為場景的畫作」為例,進行查詢後,可得到6筆結果:

1. 創作《清流》2. 創作《西湖(橋)》3. 創作《西湖春色1933》4. 創作《西湖春色1934》5. 創作《杭州-SB19:34》6. 創作《杭州古厝》

等6個創作事件

創作事件Extend

可由以西湖為中心的創作

事件,推論到作者(陳澄波)、

其創作的畫作,畫作創作

時間、畫作參展資訊…等,

藉此可發現以人工方式未

能發掘的隱性關係

地點class與其individuals 西湖

6

12

3

54

作者陳澄波

畫作《西湖春色》1934

畫作參與展覽 - 第十五回帝展展覽時間1934年

展覽地點東京美術館

主題西湖

《西湖春色》1934創作事件

2 0 1 4 D A D H

Page 19: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

結論

• 藉由知識本體的建置,改善目前資料庫系統在回應查詢問句時,無法將

資訊之間的語意關係完善地呈現之情形

• 本研究檢視目前發展的知識本體應用於語意檢索的可行性,初步結果顯

示欄位式資料集轉換為語意化的知識本體模型後,可以回答本研究最初

設計的語意查詢問句

• 為數位藝術史領域的知識本體建構,提供一個以事件本體論的實作範例

• 為藝術史資料庫的資料語意化研究提供有可行的步驟模組

2 0 1 4 D A D H

Page 20: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

未來應用與研究工作

European Commission

• 持續擴充以語意關係為核心的人時事地物之後設資料記錄,

• 進行統一資源標識符(Uniform Resource Identifier, URI)研究目前

2 0 1 4 D A D H

Page 21: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

Metadata

ontology

subjecet

object

subjecet

object

object

object

predicate

Triples

• 進行與美術史相關的各種類型事件、畫家之間的人際網絡近期

未來

• 運用其知識本體作為轉換各類後設資料為RDF Triples時之建立關

連依據,發布Linked Open Data,開放資料於公眾使用,強化藝

術史的數位研究環境2 0 1 4 D A D H

Page 22: Constructing the Ontology of Digital 2 0 1 4 D A D H...Linked Open Data (LOD) SIG Ontologies 知識本體 URIs (Uniform Resource Identifiers) Design RDF (Resource Description Framework)

Thanks for your

attention2 0 1 4 D A D H