データサイエンス・アドベンチャー杯2015 開催概要

25
All Analytics Championship ~データサイエンス・アドベンチャー杯~ に挑戦しよう! エントリー期間:2014年9月16日(火)-12月12日(金) 作品提出締切:2015年1月30日(金) Copyright © Japan Science and Technology Agency JST. All Rights Reserved 主催 プラチナスポンサー コンテンツプロバイダー 後援 (成果公開パートナー) 協賛

Upload: analytics2014

Post on 26-May-2015

12.079 views

Category:

Business


2 download

DESCRIPTION

2015年3月7日(土)開催! 主催 独立行政法人科学技術振興機構

TRANSCRIPT

Page 1: データサイエンス・アドベンチャー杯2015 開催概要

All Analytics Championship ~データサイエンス・アドベンチャー杯~

に挑戦しよう! エントリー期間:2014年9月16日(火)-12月12日(金)

作品提出締切:2015年1月30日(金)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved

主催

プラチナスポンサー

コンテンツプロバイダー

後援 (成果公開パートナー)

協賛

Page 2: データサイエンス・アドベンチャー杯2015 開催概要

データサイエンス・アドベンチャー杯とは?

未来を担う“データ・サイエンティスト” のための 統計・データ分析・言語処理コンテストです。

データ・サイエンティスト

統計解析やデータ分析、言語処理等に関する高度な知識を持ち、 情報を正確かつ効果的に分析することで、ビジネスに役立つ 洞察や課題解決のための有効な知見を見出すことができる人

Hal R. Varian(Google Chief Economist )

今後10年で最もセクシーな仕事は統計分析だろう “I keep saying that the sexy job in the next 10 years will be statisticians” 引用:McKinsey Quarterly, January 2009(http://www.mckinsey.com/insights/innovation/hal_varian_on_how_the_web_challenges_managers)

写真:http://www.googleventures.com/team/hal-varian

アイディア・スキル・得られた成果の優劣を競います。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 2

Page 3: データサイエンス・アドベンチャー杯2015 開催概要

誰が応募できるの?

高校生以上で、学校や企業等の組織に所属する方であればどなたでも※1)応募することができます。

※1) プラチナスポンサーやコンテンツプロバイダー競合会社様からのご応募はお断りさせていただく場合がございます。 詳しくは運営事務局までお問合せください。

エントリーはチームとして応募してください(チーム構成は1名※2)でも構いません)。

※2) 学生の方が応募される場合は、必ず指導教員の方と一緒にご参加ください

日々の業務等で統計解析や情報・データの分析、言語処理や科学技術政策に携わっている社会人・大学等の研究者の皆さま、統計学や情報学一般、言語処理に関心のある大学生・高校生の皆さまからの応募を歓迎します。

参加費は無料です。 分析に必要なパソコンにつきましてはご自身でご用意 ください。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 3

学生の方は、必ず指導教員の方と一緒に応募してください。

Page 4: データサイエンス・アドベンチャー杯2015 開催概要

部門について

★一般部門★

JSTの科学技術データや新聞・雑誌記事を利用して、柔軟な発想でテーマを設定し、統計・データ分析等を行って下さい。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 4

★言語部門★

主に語彙・キーワード・その他言語処理に着目した作品が対象となります。科学技術文献データ(タイトル・抄録)や新聞・雑誌記事データを利用して、新たな知見を生み出してください。またJSTシソーラスや辞書データを利用することも歓迎いたします。

作品提出時に、どちらかにご応募いただきます。

※どちらの部門もいずれかのJSTの科学技術データの利用が必須となります。 今年度新たに利用可能となりました、2010-2012年の新聞・雑誌記事データ、 論文抄録データ、SAS®University Editionも是非有効活用してください。 データ、ツールの詳細は14p以降をご覧下さい。

Page 5: データサイエンス・アドベンチャー杯2015 開催概要

各賞の紹介

優秀者には以下の賞金が授与されます。

賞 金:部門毎にそれぞれ決定 最優秀賞 ¥100,000 (一般部門/言語部門) 優秀賞 ¥50,000 (一般部門/言語部門) 各部門共通: プラチナスポンサー賞 ¥50,000 コンテンツプロバイダー賞 ¥50,000 U18賞(18歳未満の参加者が対象) ¥50,000 の各賞※を授与予定 ※審査の結果「該当者無し」となる場合があります。

他、本選進出者のうち受賞者以外のチームには記念品を贈呈します。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 5

Page 6: データサイエンス・アドベンチャー杯2015 開催概要

何を提出すればいいの?

分析テーマ、分析手法および分析結果を下記2点の資料に まとめたものが応募作品となります。

※但し、個人又は企業を中傷するような内容はご遠慮ください。 また分析結果に個人名や企業名が含まれる場合、審査員または運営事務局の判断により 分析結果の公開時に匿名化をお願いする場合があります。

応募作品

① 分析概要(400字程度) - 指定書式有り

② プレゼンテーション資料(PowerPoint形式) - 本選進出時にはこの資料をもとに15分間の発表を していただきます。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 6

Page 7: データサイエンス・アドベンチャー杯2015 開催概要

例えば・・・(一般部門)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 7

例)埼玉県立熊谷女子高校の作品より 大学のそこんところ

~おカネと人と論文と~

近年の大学の実態について、論文数から分析。論文数に関わる条件を挙げ、それぞれの条件が論文数にどのように関わるのか調査し、高校生 なりの視点で考察。 ※昨年度の作品については、公式HPにて ご確認ください。

Page 8: データサイエンス・アドベンチャー杯2015 開催概要

8

例えば・・・(言語部門)

専門用語と一般用語の融合辞書

専門家によって論文から 抽出された専門用語

Hybrid辞書の実現

JSTシソーラス JST大規模辞書

JST科学技術データ

記事をテキストマイニングして用語切り出し

記事データ

分析

テキストマイニングによって切り出した一般用語

Page 9: データサイエンス・アドベンチャー杯2015 開催概要

例えば・・・(言語部門)

世の中と研究世界には どれくらいズレがあるか?

ローデータから抽出した専門用語の出現頻度

分析

JST科学技術データ

新聞・雑誌記事データ 公に利用可能なデータ

文献タイトル等から切り出した語が、 一般社会ではいつ使用されたのかを 年次別に比較し、世の中と研究世界 におけるトレンドの差を検証する。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 9

キーワード利用推移

「公に利用可能なデータ」おすすめサイト: 政府統計の総合窓口e-Stat

http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do

Page 10: データサイエンス・アドベンチャー杯2015 開催概要

どうやって応募すればいいの?

日 程: <エントリー開始> 2014年 9月16日(火) <エントリー締切> 2014年 12月12日(金) <応募作品締切> 2015年 1月30日(金) <予選(非公開)> 2015年 2月16日(月) <本選出場者発表> 2015年 2月20日(金) <本選(公開)> 2015年 3月 7日(土)

まずは12月12日(金)までにコンテスト参加登録(エントリー)を完了してください。

エントリー受付後、「データの利用に係る誓約書」の締結が終わった方から、順次データが貸与され、分析開始となります。

また、ツールにつきましては、「SAS®University Edition」を是非ご利用ください。

応募作品は、2015年1月30日(金)までに 運営事務局 Mail:info-aac☆sascom.jp へ 提出してください (☆を@に変更してください)。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 10

Page 11: データサイエンス・アドベンチャー杯2015 開催概要

応募区分

「一般」部門での応募となります。

応募者の方全員が高校生以上かつ学校や 企業等の組織に所属していますか。

提供するデータや資料が貴組織の営利活動に密接に関係していますか。

大変恐れ入りますが、応募していただくことができません。

作品のメインの部分はキーワード・語彙・言語処理に関する分析ですか。

「言語」部門での応募となります。

YES

NO

関係していない

NO

関係し ている

YES

フローチャートで、参加資格・応募部門※1)を確認しましょう。

※1) 応募部門は、応募作品提出時までに決定してください。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 11

応募者全員が18歳未満の場合は U-18賞候補の対象となります。

内容によっては、審査委員長の判断によって、異なる部門で審査・受賞となる場合があります。

運営事務局までご相談ください。 応募できない場合があります。

Page 12: データサイエンス・アドベンチャー杯2015 開催概要

審査委員長: 長尾 真 氏(JST科学技術情報特別主監, 京都大学名誉教授)

審査委員(50音順): 大向 一輝 氏 (国立情報学研究所 コンテンツ科学研究系准教授) 小町 守氏 (首都大学東京システムデザイン学部 准教授) 福本文代氏 (山梨大学 大学院 医学工学総合研究部教授) 宿久 洋氏 (同志社大学 文化情報学部教授) ※他数名を委嘱手続中

どのような審査が行われるの?①

審査方法: 予選と本選の2段階審査で行います。

<予選> 非公開での書類選考を実施 <本選> プレゼンテーションによる公開審査を実施

予選・本選ともに有識者により構成された審査委員会にて厳正な審査を実施します。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 12

Page 13: データサイエンス・アドベンチャー杯2015 開催概要

① JST科学技術データ※1) (必須)を使用した最良の活用 アイデアが示されているか

② 実用化、産業化につながる視点が織り交ぜられているか

③ 分析が適切に行われ、分析結果が効果的なプレゼンテー ション資料としてまとめられているか

どのような審査が行われるの?②

下記3つの審査基準をもとに審査が行われます。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 13

※1) JST科学技術データ:JSTが保有する科学技術文献書誌データを基軸とした各種データ 「http://www.jst.go.jp/seika/03/seika.html」 ・ 国内資料:12,000誌、国外資料:4,700誌を収集 ・ 約3,000万論文の書誌情報を蓄積し我が国の主要な研究成果を網羅 ・ その他、300万件以上の化学物質の情報や100万語以上の科学技術・特許用語の体系等を整備している

Page 14: データサイエンス・アドベンチャー杯2015 開催概要

何を使えばいいの?

データはJST科学技術データ(全部または一部)を必ず使用して下さい。また、必要に応じて、新聞・雑誌記事データやSASソフトウェアを使うことを推奨いたします。

自己保有のデータや、他のオープンデータ※1) 、ツールを併用しても問題ありません。

使用必須 使用推奨

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 14

政府統計の総合窓口e-Stat(http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do)

DATA.GO.JP (http://www.data.go.jp/)

Open DATA METI (http://datameti.go.jp/)

JST科学技術データ 新聞・雑誌記事データ 分析ツール

使用推奨

使用歓迎

オープンデータ(例)

応募作品

※1) オープンデータ:公に利用可能なデータ。自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのこと 従うべき決まりは「作者のクレジットを残す」、「同じ条件で配布する」程度である(Open Definition 「http://opendefinition.org/」定義より)

一見関係のないデータ・情報相互間に、目に見えぬこんな関係性が あったのか、という予想できない楽しい発見も期待しています。

Page 15: データサイエンス・アドベンチャー杯2015 開催概要

何を使えばいいの? -データ編①-

参加者全員にDVDにてお貸しします(要返却・終了後データ破棄要)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 15

■初心者ガイドおよびデベロッパーガイド※1)

■一次加工データ ・対象年:1981年-2012年(文献が収録された資料の発行年)

◎ 分野分類の統計データ(国内・海外文献別) - 科学技術文献データに索引されたJST分類コード24分野の年次別索引頻度。 (1つの文献に複数のコードが索引されることもあるため延べ数) ◎ シソーラス用語※2)の統計データ(国内・海外文献別) - 科学技術文献データに索引されたシソーラス用語の年次別索引頻度 ◎ 化学物質の統計データ(国内・海外文献別) - 科学技術文献データに索引された化学物質の年次別索引頻度と最初に索引された年

■ローデータ※3) 及びローデータのサンプルデータ

◎ 科学技術文献データ(書誌情報): 約1,000万件※4)

対象年:2003年-2012年(文献が収録された資料の発行年) ◎ 科学技術文献データ(抄録情報): 約300万件※5)

対象年:2010年-2012年(文献が収録された資料の発行年) ◎ 資料名データ:約20万件 ◎ 分野分類データ:約4,000件 ◎ 人名名寄せデータ:約4,000万件 ◎ 機関名データ:約30万件 ◎ 科学技術用語シソーラス:約4万件 ◎ 同義語・異表記辞書データ: 約70万件 ◎ 化学物質データ:約300万件

JST科学技術データ

※1) 貸与データを読解するための全体概要やデータ定義を記載したガイド ※2) その文献のテーマ(主題)を表すのに適した言葉。主要な科学技術用語を概念で整理し、同義関係や意味上の類似関係、階層関係などによって体系的整理した用語集(JST科学技術用語シソーラス)から選択して付与されます。 ※3) データ容量が非常に大きいため、テキストエディタや表計算ソフトではデータの閲覧ができない場合があります。 ※4) JSTPlusファイルおよびJMEDPlusファイルの文献書誌データ 各ファイルの説明:http://jdream3.com/service/jdream.html ※5) 昨年のアドベンチャーカップではデータとしてだしておりません。株式会社ジー・サーチの協力のもと、今年度初めて提供いたします。

Page 16: データサイエンス・アドベンチャー杯2015 開催概要

何を使えばいいの? -データ編①-

前のページにある、科学技術文献データ(書誌情報)とは、左図のような科学技術分野の論文や学術記事の概要をコンパクトにまとめた情報のことを指します。

2010年~2012年については、抄録データも提供致します。

各データの詳細については、ダウンロードページで取得できる初心者ガイドおよびデベロッパーガイドをご参照ください。

JST 文献データの例※ ※J-GLOBALより抜粋:http://jglobal.jst.go.jp/detail.php?JGLOBAL_ID=200902201201154615&q=%E3%81%95%E3%82%93%E3%81%BE&t=2

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 16

Page 17: データサイエンス・アドベンチャー杯2015 開催概要

何を使えばいいの? -データ編②-

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 17

■新聞記事データ ・対象年:2010年-2012年に新聞に掲載された記事

主に下記のデータより成り立っています。※1) ・掲載年月日・掲載ページ・記事区分・記事番号 ・ヘッドライン・抄録文・記事本文・キーワード

日刊工業新聞社のデータ

※1)TSV形式で提供されます。

データ例※

参加者全員にDVDにてお貸しします(要返却・終了後データ破棄要)

Page 18: データサイエンス・アドベンチャー杯2015 開催概要

何を使えばいいの? -データ編③-

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 18

■雑誌記事データ ・対象年:2010年-2012年に雑誌に掲載された記事

・日経ビジネス・日経コンピュータ・日経エレクトロニクス・日経メディカル ・日経パソコン・日経情報ストラテジー・日経コミュニケーション・日経アーキテクチュア ・日経ヘルス・日経TRENDY 主に下記のデータより成り立っています。※1) 雑誌名・タイトル・出版日・要約・記事本文・企業情報・業種情報 など

日経BP社のデータ

※1)TSV形式で提供されます。

データ提供予定誌

参加者全員にDVDにてお貸しします(要返却・終了後データ破棄要)

Page 19: データサイエンス・アドベンチャー杯2015 開催概要

データ利用上の注意は必ずお守りください。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 19

データの目的外利用は禁止しております。

貸与したDVDは必ず事務局までご返却ください。

アドベンチャー杯終了後、PC内のデータは確実に破棄してください。

Page 20: データサイエンス・アドベンチャー杯2015 開催概要

何を使えばいいの?-分析ツール編-

下記の分析ツール(SASソフトウェア)等を利用することを推奨いたします。

SAS®University Edition (日本語ダウンロードページ)

http://www.sas.com/ja_jp/software/university-edition.html

(解説ページ) http://www.sas.com/offices/asiapacific/japan/promotions/14_sas-analytics-u/overview.html

(Facebookページ) https://www.facebook.com/SASAnalyticsU

SAS University Editionご利用時にはインストール可能なPC(64bit)をご用意ください。 ※ご参考「SAS® University Edition for VMware Playerのインストール方法」Scientific-Global.net

http://scientific-global.net/sas-university-edition-for-vmware-player%E3%81%AE%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB%E6%96%B9%E6%B3%95/

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 20

Page 21: データサイエンス・アドベンチャー杯2015 開催概要

応募作品や成果の取り扱いはどのようになっているの?

応募作品の著作権は応募者に帰属します。

但し、応募者が応募作品ならびにアドベンチャー杯による成果を アドベンチャー杯以外の場(個人のWebサイトや所属機関内での 発表も含む)で発表する場合には、下記が必要となります。

① JSTへの事前確認(運営事務局経由)※1)および ② 出典にアドベンチャー杯での成果であることの明記 ※1) 事前確認のための申請書を用意しております。詳細は運営事務局にお問い合わせください。

応募作品名とチーム名はアドベンチャー杯の公式Webサイトにて 公開される場合があります。 また、JSTまたは共催者・スポンサーのWebサイトや広告物への掲載 など、当該機関の事業活動において応募作品を無償で利用させていた だく場合があります。

受賞作品につきましては、原則としてアドベンチャー杯の公式Webサイトや、民間団体と経済産業省が共同で検討中の「オープンデータナレッジ・バンク(仮称)※2) 」に登録(無償で公開※3))される予定です。

※2)オープンデータを活用したイベントの成果を集約するとともに、アイディアやアプリを創出した人材とビジネスパートナーとの マッチングを支援するwebサイト ※3)分析結果に個人名や企業名が含まれる場合、審査員または運営事務局の判断により分析結果の公開時に匿名化をお願いする場合があります。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 21

Page 22: データサイエンス・アドベンチャー杯2015 開催概要

本選(公開審査)はいつ・どこで行われるの?

日時:2014年3月7日(土)13時~18時 - 予選審査を通過した8チーム(予定)によるプレゼンテーション (1チーム15分間の発表+5分間の質疑応答) - 審査および結果発表

会場:独立行政法人科学技術振興機構(JST) 東京本部別館 (K’s五番町)1階ホール アクセス:http://www.jst.go.jp/koutsu.html

本選出場者にはJSTの規定に基づいた交通費を支給します。

本選の見学はどなたでも可能です(公式Webサイトからの事前申込制。希望者多数の場合抽選)。

なお、当日はメディアによる取材・撮影が入る予定です。

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 22

Page 23: データサイエンス・アドベンチャー杯2015 開催概要

様々な皆様のご応募をお待ちしています。

現在研究している方法を応用すると、こんな良いアイディアになりそうだ!

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 23

コンテストの内容を基礎として論文につなげられるかも!

将来本格的に、統計分析や言語処理をやってみたい!

全国のライバルとアイディアを競ってみたい! 今研究していることの

幅が広がるかも!

Page 24: データサイエンス・アドベンチャー杯2015 開催概要

(参考)アドベンチャー杯後の研究継続について

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 24

JSTは、50年以上の蓄積を誇る情報資産のオープン化を推進し、

研究者の皆様へ貸与いたします。

研究者にとってのメリット

JST情報資産というツールを利用した研究飛躍の可能性

書誌

抄録(※1)

索引(※2)

同義語・異表記 辞書データ

人名名寄せデータ 機関名データ

分野分類データ

資料名データ

化学物質データ

科学技術用語 シソーラス

科学技術文献データ (書誌情報)

※1 ※2 ジー・サーチにて有償販売中のため、文献情報に含まれる抄録と索引データのお渡しはジー・サーチの承認が必要です。

公開できるJST情報資産について(イメージ) ※原則として研究成果のJSTへのフィードバックが必要となります。詳細はJSTまでお問い合わせ下さい。営利目的の場合は貸与でなく有償販売となります。

Page 25: データサイエンス・アドベンチャー杯2015 開催概要

www.sascom.jp/AAC/

データサイエンス・アドベンチャー杯 公式Webサイト

アドベンチャー杯 運営事務局 Mail:info-aac☆sascom.jp

(☆を@に変更してください)

Copyright © Japan Science and Technology Agency (JST). All Rights Reserved 25