code4lib2013.09.01 fujiwara

20
連想検索(association search)へのユー ザー目的モデルの追加と、「連想ストー リー」のパッケージ化の試み 言語の経験空間の動的モデル化に向けて 藤原剛 (Takeshi FUJIWARA) 所属:DAYPLA株式会社 2013.8.31 9.1 Code4Lib JAPAN カンファレンス2013 @南三陸プラザ(宮城県南三陸町) ライトニングトーク(5)http://wiki.code4lib.jp/wiki/C4ljp2013/presentation#fujiwara 1

Upload: takeshi-fujiwara

Post on 26-Jan-2015

453 views

Category:

Technology


0 download

DESCRIPTION

2013.8.31 – 9.1 Code4Lib JAPAN カンファレンス2013 @南三陸プラザ(宮城県南三陸町) ライトニングトーク(5分)用 のプレゼンです。 http://wiki.code4lib.jp/wiki/C4ljp2013/presentation#fujiwara 現在案件が進行中で、可能ならばCode4Lib JAPAN カンファレンス2014 で近況をアップデートしたいと思います。

TRANSCRIPT

Page 1: Code4lib2013.09.01 fujiwara

連想検索(association search)へのユー

ザー目的モデルの追加と、「連想ストーリー」のパッケージ化の試み

― 言語の経験空間の動的モデル化に向けて ―

藤原剛 (Takeshi FUJIWARA)

所属:DAYPLA株式会社

2013.8.31 – 9.1 Code4Lib JAPAN カンファレンス2013 @南三陸プラザ(宮城県南三陸町)

ライトニングトーク(5分)用

http://wiki.code4lib.jp/wiki/C4ljp2013/presentation#fujiwara 1

Page 2: Code4lib2013.09.01 fujiwara

はじめに・・・連想検索とは?

• 「連想検索とは、文書と文書の言葉の重なり具合をもとに、ある文書(検索条件)に近い文書(検索結果)を探し出す検索技術です。」(Webcat Plusの説明から引用)

検索条件(文書) 検索結果(文書) 2

Page 3: Code4lib2013.09.01 fujiwara

今回の取り組みは • 検索技術にユーザーの経験的(明示的・非明示的)な目的

またそのフィードバックを変数化し、対象となる文書空間に加えて計算するといった、検索技術において広くかつ多様に取り組まれている試みを、

SEARCH QUERY

TEXT.. space Structured

or not

schemed QUERY

TEXT.. Space / corpus

Feedback

To user(s) or artificial

user models

information filtering systems, machine learning, HCI, personalization, profiling, behavioral targeting, collaborative filtering, recommender systems …etc.

Information retrieval

Feedback to Search query and/or Interface UX

MY/OUR KNOWN OR UNKNOWN

GOAL

3

Page 4: Code4lib2013.09.01 fujiwara

今回の取り組みは

• この連想検索に適用し、

• また、フリーソフトのアプリケーションGETAssoc を活用します

• 検索技術にユーザーの経験的(明示的・非明示的)な目的

またそのフィードバックを変数化し、対象となる文書空間に加えて計算するといった、検索技術において広くかつ多様に取り組まれている試みを、

http://getassoc.cs.nii.ac.jp/

4

Page 5: Code4lib2013.09.01 fujiwara

参考事例として、 • 書籍を対象としたWebcat Plusの連想検索に

おいては、すでに、フリーテキストからの検索結果の書籍に関連する「連想ワード」のうち「行為」の属性のある語を、分類(クラスタ表示)するファセットナビゲーションがあります。

http://webcatplus.nii.ac.jp/ • (http://webcatplus.nii.ac.jp/faq_001.html#pid001)から引用 「Webcat Plusは、国立情報学研究所(NII)が提供する無料の情報サービスで、江戸期前から現代までに出版された膨大な書物を対象に、そこに記憶された知の集積を自由に探索できる思索空間の実現を目指しています。」

5

Page 6: Code4lib2013.09.01 fujiwara

参考事例、Webcat Plusの場合

検索結果1

関連するキーワード

「連想ワード」で絞り込みを 提供

検索結果2(絞り込み)

※上記例の場合、正確には、文書中の語につけられた「行為」のメタ情報であり、ユーザーの目的とするゴールと一致するとは限らない。他方、ユーザーに対し、視座の要素を提案するファセットであり、情報探索の目的との親和性がある。

ファセット

6 ①と② http://webcatplus.nii.ac.jp/ から ※キャプチャー画面引用の明確性区別

① ②

Page 7: Code4lib2013.09.01 fujiwara

今回の試みは、「連想ストーリー」のパッケージ化

• 今回の試みは、イメージとしてはこのようなファセットナビゲーションに、

より可変的な粒度での、ユーザーの「目的」を仮定的に付加し、

および情報サービス提供者側(例:教育目的や事実や研究探索上の構成的な情報探索)の提案する「目的」を考慮し、

情報の体験空間にツアー的なシークエンスを持たせ、また、

そこからの行動計測から、

仮定された目的が、ユーザーと情報サービス提供者間で、マッチングしやすいようなフィードバックを行います。

7

Page 8: Code4lib2013.09.01 fujiwara

より具体的には、

• より具体的には、文書DBとなるコーパスファイルにユーザの目的を表すデータを仮定的に含め、

• 「目的」を連想計算に含めたベクトル空間モデルを形成します。

• バリエーションのある語用空間のモデル(プロファイル辞書)を連想計算用に作成し、

• それをユーザにフィードバックします。

8

Page 9: Code4lib2013.09.01 fujiwara

今回の試みは、

• 「連想ストーリー」のパッケージ化(シークエンスのハードコーディングの段階から次のアルゴリズム化の追求を視野に)とも表現できます 9

Page 10: Code4lib2013.09.01 fujiwara

映画には、ストーリー(物語)とシナリオ(脚本)がある

ストーリー → 観客、制作者それぞれイメージ

すること、期待することの

シークエンス (顛末)

シナリオ → その記述

10

Page 11: Code4lib2013.09.01 fujiwara

情報検索にも、ストーリー(イメージ)とシナリオ(記述)がある

• 連想出版様の「連想ストーリー」設計の例

11 「連想検索について-コンテンツ提供側から見た連想検索-」2010/11/16連想出版 青木隆平様の資料 から使用許諾済み

Page 12: Code4lib2013.09.01 fujiwara

12 「連想検索について-コンテンツ提供側から見た連想検索-」2010/11/16連想出版 青木隆平様の資料 から使用許諾済み

Page 13: Code4lib2013.09.01 fujiwara

連想ストーリー: インタラクションによる探索行動

• ユーザの手動アクションを 織り込むことにより)によってずれが小さくなっていくことは、連想検索のコンセプト

• 連想検索を用いれば,目的の検索結果に少しずつ近づいていく 連想された

事柄を次々と巡ることで,いつのまにか利用者が思いもしなかった事柄へと興味が移ろいゆく (*1)

• 理解の深まりを対話的に支援

• ファセット絞り込みは手動要素が多い

現在→ ユーザーの自発的なインタラクティブ行動を前提 将来→ ユーザーが逐次に自発的に働きかけなくとも、インタラクティブな(オートマトン的な)探索支援ができるようにする目標

13 *1 「連想検索について-コンテンツ提供側から見た連想検索-」2010/11/16連想出版 青木隆平様の資料 から使用許諾済み

Page 14: Code4lib2013.09.01 fujiwara

実装に向けた構成(説明省略)

14

Page 15: Code4lib2013.09.01 fujiwara

実装応用例(説明省略)

15

Page 16: Code4lib2013.09.01 fujiwara

実装応用例(説明省略)

16

Page 17: Code4lib2013.09.01 fujiwara

初期実装とサービス実験

• なお、初回実装とサービス実験を予定していますが、最初は書籍関連ではない一般的なサービス企業のサイトへの適用となる見込みです。

• そののち、書籍・図書館関連を視野に!

17

Page 18: Code4lib2013.09.01 fujiwara

可能性・メリット

[発展性・応用性]

• ドキュメント・図書・書籍の探索補助として、ユーザ目的辞書の形成や、目的に適合しやすいリコメンドシナリオ型のファセットナビゲーション。

• Webブラウズ時の関連情報の補助ツールとして提供することで、Linked Dataの前処理としての、統制タギングを促す。

• 情報アーカイブの空間探索用ツールとして提供することで、多様な経験空間を纏まりとして追体験、また視座を発見することを促す。

{{Information |Description= Class diagram for the LOD datasets |Source=http://umbel.org/lod_constellation.html |Date=2008-10-10 |Author=Michael K. Bergman |other_versions= }}

18

Page 19: Code4lib2013.09.01 fujiwara

謝辞 Special Thanks! to …

※50音順

青木 隆平 様 (NPO法人連想出版),

高木 祐介 様 (株式会社自動処理),

日高 崇 様 (有限会社スタジオ・ポットSD)

他、多数の皆さま

19

Page 20: Code4lib2013.09.01 fujiwara

会場の皆さま、 ご清聴・ご清覧の皆さま、

Code4Lib JAPAN2013の皆さま、

Thank You!

20