第40回ディジタル図書館ワークショップ 発表資料
DESCRIPTION
TRANSCRIPT
マイニング探検会の知見
東京大学情報基盤センター
学術情報研究部門 特任講師/
株式会社リッテル
取締役・最高技術責任者
清田陽司
2011年3月10日 第40回ディジタル図書館ワークショップ@筑波大学東京キャンパス
マイニング探検会
• 図書館の「未来」を探る勉強会
• 2010年4月より、月1回のペースで開催
• 主な参加者層
大学図書館、公共図書館関係者
NDL、NII、JST出版関係者
http://www.mi-tan.jp/ http://wiki.mi-tan.jp/
マイニング探検会
• 図書館の「未来」を探る勉強会
• 2010年4月より、月1回のペースで開催
• 主な参加者層
大学図書館、公共図書館関係者
NDL、NII、JST出版関係者
http://www.mi-tan.jp/ http://wiki.mi-tan.jp/
主なトピック
• ライブラリアン自身がアプリを開発
cf. 図書系職員のためのアプリケーション開発講習会@東京大学情報基盤センター(mbc)
• OPACログデータの活用
• 連想検索を利用したサービス
• 機関横断型メタデータWiki
システムライブラリアンに求められる考え方
• 組織の壁にとらわれない
• 本来のミッションに立ち返ってみる
– ルールとガイドライン (cf. Wikipediaコミュニティ)
• コンピュータを活用する目的を意識する
– 人間の強みを活かすには?
Wikipediaコミュニティのあり方
• オンライン百科事典を構築するというミッションに沿って組織運営
• 役割分担
• ガイドライン(≠ルール)の運用
– パーフェクトは求めない
– 間違いがあっても迅速に修正できる仕組み
定型処理と非定型処理
• 定型処理
– 給与計算、売上集計、伝票処理など
– 人間が介在しない完全な自動化が可能
– 厳密さが求められる
– データ量はせいぜいGbytesオーダー
• 非定型処理
– 統計データ作成、検索、データ・マイニングなど
– 人間の介在が必要
– 厳密さよりカバレッジ重視 (データ量が重要)
– データ量はTbytes~Pbytesオーダーになり得る