Технологии «семантической паутины»(Semantic Web)
Сергей ГоршковЦентр информационных технологий index.art – проект Бизнес-Семантика
Что такое семантические технологии?
«Семантическая паутина» (Semantic Web) –один из путей дальнейшего развития Интернета.
Основатель: Tim Berners-LeeСтандартизация: W3C
Что такое семантические технологии?
Современные информационные системыинформация представляется • в реляционной форме (таблицы)• в поточной (гипертекст, видео и т.д.)
Такая форма записи называется триплетом.
Семантические технологииинформацию выражается в виде набора фактов, записываемых в форме
«подлежащее – сказуемое – определение»
Что такое семантические технологии?
Онтология - «словарь терминов», в котором определены все возможные виды объектов и связей между ними.
Примеры стандартных онтологий:• «Дублинское ядро» (Dublin Core)• микроформаты (μF)
Простой пример
И.И. Иванов родился 01.01.1970
Содержание онтологии:«человек»
«имеет имя»«родился»
Выбор: использовать стандартную онтологию (foaf), или создать свою.
#Иванов имеет имя «И.И. Иванов»
#Иванов родился «1970-01-01»
#Иванов – уникальный идентификатор объекта, URI
Об уникальных идентификаторах(URI) будет рассказано чуть позже
Что хорошего в семантических технологиях?
МикроформатыВозможность искать структурированную информацию.
Магазины должны представлять информацию в семантической форме!
Или вот так:
Как больше вероятность найти нужный товар?
Вот так:
Что такое семантические технологии?
• В семантической форме можно записать любую информацию.
• Чем сложнее информация, тем более развитой будет онтология.
Что такое семантические технологии?
Информацию, записанную в семантической форме, удобно визуально представить в виде математического графа.
Иванов И.И. Петрова С.С.дружит с
добавилафото
Иванов, Петрова, фото – объекты (вершины графа).«Дружит с», «добавила» - связи (ребра графа).
нравитсяфото!
Семенов В.В.добавил комментарий к фото
дружит с
дружит с
Лучшим примером такого графа будет социальная сеть
Что такое семантические технологии?
Все связи, существующие в социальной сети,можно представить в виде графа гигантских размеров, содержащего миллиарды узлов.
Цукерберг: между миллиардом пользователей соцсети установлено свыше триллиона связей, а на серверах компании хранится более 240 миллиардов фотографий.
Graph Search в Facebook
В январе 2013 года Facebook представил Graph Search – инструмент поиска по информационному графу, которым является социальная сеть.
Цукерберг: «Система не просто выдает набор ссылок, как Google или Yelp, а сразу отвечает на поставленные вопросы, например: "фотографии, которые мне нравятся", "города, в которых побывали члены моей семьи", или "рестораны в Лондоне, где бывали мои друзья».
Отличие семантического поиска от обычного состоит в том, что поисковая машина учитывает смысл информации, а не просто ищет ключевые слова
Перейдем к технологиям
Каждый факт – ребро графа – называется «триплетом».
RDFS – средство записи схемы RDF (онтологии).
OWL – еще один язык записи онтологий.
SPARQL - язык запросов к данным, представленнымв виде триплетов.
RDF – язык записи триплетов. RDF можно записывать с помощью разных синтаксисов: Turtle, XML и т.д.
Перейдем к технологиям
foaf – одна из универсальных отнологий
Пример SPARQL-запроса
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name ?email
WHERE {
?person a foaf:Person.
?person foaf:name ?name.
?person foaf:mbox ?email.
}
Приведенный запрос вернет имена и e-mail’ы каждого человека в мире
Спасибо за внимание!Вопросы?
Также можно обсудить в ЖЖ:
http://serge-index.livejournal.com
Проект «Бизнес Семантика»:
http://www.business-semantic.ru