романова дина иерархическая система тегирования
TRANSCRIPT
![Page 1: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/1.jpg)
Романова Романова ДинаДина
Институт Систем Информатики СО РАНИнститут Систем Информатики СО РАННовосибирскНовосибирск
![Page 2: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/2.jpg)
Способы структуризации информацииТаксономия Фолксономия
![Page 3: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/3.jpg)
Тег – это метка, ключевое слово, идентификатор для категоризации, описания, поиска данных и задания внутренней структуры
Понятие тега
Облако тегов – это визуальное представление тегов, в котором размер шрифта тем больше, чем больше встречаемость тега
![Page 4: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/4.jpg)
Статистика использования доменов первого уровня в виде облака тегов
![Page 5: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/5.jpg)
Системы тегированияСервисы в сети Интернет:FlickrDelicousTechnorati
Программы, работающие в файловой системе:Tag2FindTaggToolTaggedFrogQuicksilver
Поиск с динамически изменяющимся облаком тегов:QuinturaSearch Cloudlet
![Page 6: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/6.jpg)
Иерархическое тегирование
многопользовательская системаобщая структура ++ личное пространствовозможность ведения параллельных классификацийтегирование на основе онтологии
Таксономия (иерархия) ++ Фолксономия (теги)
Иерархическая система тегирования
![Page 7: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/7.jpg)
Схема системы тегирования
БД
Impo
rt
Онтология
Файловаясистема
Иерархическая система
тегирования
У каждого пользовател
я есть личное
пространство
![Page 8: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/8.jpg)
![Page 9: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/9.jpg)
ТегированиеПосле загрузки документа пользователь
описывает его, используя форматкласс -> подкласс -> элемент : свойство1 = значение & свойство2
Любой тег может быть помечен как личный
:competitions -> Olympic Games: year = 2010 & city = Vancouver
Система тегирован
ия
![Page 10: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/10.jpg)
Многообразие тегов
Использование свойств уменьшает количество неструктурированных тегов
В систему автоматически вносятся параметры документа (тип, размер, дата добавления, автор) => все документы доступны
При задании тега пользователю предлагаются близкие существующие теги=> уменьшается количество одинаковых слов
![Page 11: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/11.jpg)
Анализ введенных данныхСтепень похожести тегов определяется как величина, обратно пропорциональная масштабированному расстоянию между словами, и измеряется в процентах.
Два тега считаются похожими, если нашлось слово A, принадлежащее первому тегу и слово B, принадлежащее второму тегу, такие что для них выполняется условие:
![Page 12: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/12.jpg)
OWL
БД
parser
Система
тегирования
классы экземпляры классов
свойства классов
Система позволяет импортировать элементы онтологии и использовать их в качестве тегов
Структура тегов по онтологии
![Page 13: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/13.jpg)
Структура тегов по онтологии
Ограничения на импорт онтологии:Онтология должна быть в формате OWL с синтаксисом
RDF/XMLИзвлекаются только классы, экземпляры классов и
datatype-свойстваСвойства импортируются без учета иерархии и
характеристикАксиомы и ограничения на классы и свойства при
импорте не учитываются
![Page 14: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/14.jpg)
<?xml version= “1.0” ?><rdf:RDF><owl:Ontology rdf:about= “”><rdfs:comment>Онтология фигурного катания</rdfs:comment></owl:Ontology><owl:Class rdf:ID= “Elements”><rdfs:subClassOf rdf:resource= “http://www.w3.org/2002/07/owl#Thing” /><rdfs:label xml:lang=“ru”>Элементы</rdfs:label></owl:Class><owl:Class rdf:ID= “Jumps”> <owl:disjointWith> <owl:Class rdf:ID="#Spins"/> </owl:disjointWith>
<rdfs:subClassOf rdf:resource = “#Elements” /><rdfs:label xml:lang=“ru”>Прыжки</rdfs:label>
</owl:Class><owl:Class rdf:about= “Spins”>
<rdfs:subClassOf rdf:resource = “#Elements” /><rdfs:label xml:lang=“ru”>Вращения</rdfs:label>
</owl:Class><Jumps rdf:ID = “Axel” /><Jumps rdf:ID = “Lutz” /><Spins rdf:ID = “Layback” /><Spins rdf:ID = “SitSpin” /><owl:DatatypeProperty rdf:ID = “level”>
<rdfs:domain rdf:resource = “#Jumps” /><rdfs:range rdf:resource = “http://www.w3.org/2001/XMLSchema#float” /></owl:DatatypeProperty></rdf:RDF>
Elements Jumps
Axel Lutz
Spins Layback SitSpin
![Page 15: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/15.jpg)
Навигация и поискОсновное преимущество иерархической системы
тегирования – быстрый доступ к документам по ключевым словам
Возможности поиска в иерархической системе тегирования:
Навигация по дереву теговРасширенный поиск, включающий в себя
поиск по названию документа, по тегам, по свойствам, по параметрам документа (тип, размер, дата добавления, автор)
![Page 16: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/16.jpg)
Навигация и поиск
![Page 17: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/17.jpg)
РезультатыПредложено:
новый подход к систематизации документов новый формат ввода тегов модель отображения онтологии в систему
тегирования
Реализовано: хранилище документов с авторизованным доступом многопользовательская иерархическая система
тегирования модуль, извлекающий классы, экземпляры,
свойства из документа OWL
![Page 18: романова дина иерархическая система тегирования](https://reader036.vdocuments.mx/reader036/viewer/2022062405/557ec8e9d8b42ae27f8b487b/html5/thumbnails/18.jpg)