滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計...

21
滋賀大学におけるデータサイエンス教育 平成301027サイエンティフィック・システム研究会 『拡がるデータサイエンス教育-高校から大学まで-滋賀大学 データサイエンス学部 高田聖治

Upload: others

Post on 22-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

滋賀大学におけるデータサイエンス教育

平成30年10月27日サイエンティフィック・システム研究会

『拡がるデータサイエンス教育-高校から大学まで-』

滋賀大学 データサイエンス学部

高田聖治

Page 2: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

1.データサイエンティストへの社会的ニーズ

2.滋賀大学データサイエンス学部の目指すもの

3.滋賀大学データサイエンス学部のカリキュラム

4.企業との連携

5.大学院データサイエンス研究科の設立

項目

Page 3: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

滋賀大学の改革構想―文理融合大学への変革

1.データサイエンティストへの社会的ニーズ

「ビッグデータ時代に対応する人材の育成 」(平成26年9月 日本学術会議 情報学委員会E-サイエンス・データ中心科学分科会、北川源四郎委員長)

・ビッグデータ活用の重要性とデータサイエンティスト育成の必要性を指摘

・データ中心科学を専門とする教育組織の設置を提言

データサイエンス分野への社会的ニーズ

3

Page 4: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

滋賀大学の改革構想―文理融合大学への変革

政府でもデータサイエンティストの育成の重要性を認識

• 「ビッグデータ時代を迎え、データの利活用により付加価値を生み出す新事業・新サービスの創出が重要、第4次産業革命を支える基盤技術:AI、ビッグデータ、IoTなど」 (日本再興戦略2016等)

• 「欧米等と比較し、データ分析のスキルを有する人材や統計科学を専攻する人材が極めて少ないという危機的状況」 (科学技術イノベーション総合戦略2015)

現実にはこの分野で日本は著しく立ち遅れ← 一つの要因として、大学に統計学部・学科がなかった

4

Page 5: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

• 専任教員15名、特別招聘等8名でスタート

数理統計学、計算機科学、応用領域(行政、防災、交通、経済、医学、品質管理等)を幅広くカバー→現在では専任教員18、助教10、特別招聘等8に

• 募集定員は1学年100名

• 男子:女子=8:3

• 文理融合 理系:文系=6:4

• 北海道から鹿児島まで、幅広い地域から進学

平成29年4月 日本初の「データサイエンス学部」滋賀大学に誕生

Page 6: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

2.滋賀大学データサイエンス学部の目指すもの

価値の発見・創造データ

分析・解析

(データアナリシス)

データ収集・

加工・処理(データ

エンジニアリング)

理系的

理系的

文系的

統計学と情報学の統合+人文知との融合

データサイエンス

(価値創造)

文理融合 6

Page 7: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

データサイエンスに必要なスキル

©Drew Conway Data Consulting

データサイエンティストは、理系のスキルと文系のマインドを持った人材。

滋賀大学データサイエンス学部の新入生も4割が文系。

Page 8: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

大規模データを加工・処理するための専門的知識とスキル(情報工学・コンピュータ科学)

大規模データを分析・解析するための専門的知識とスキル

(統計学)

ビジネスや政策などの領域で課題を読み取り、データエンジニアリングとデータアナリシスによる知見を

現場の意思決定に生かして、価値を創造する(演習:領域分野での成功体験)

新たな知見

データサイエンスの滋賀大モデル

滋賀大学の目指す育成人材像

8

Page 9: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

文理融合 逆Π型 人材

価値創造の経験とノウハウ

&領域における専門知識

データアナリシス大規模データの分析・解析

専門知識とスキル(統計学)

データエンジニアリング大規模データを加工・研磨・処理専門知識とスキル

(情報学・コンピュータ科学)

《多様な価値創造のフィールド》• マーケティング• ファイナンス、保険• 企業会計• ビジネスエコノミクス• 医療・健康・福祉• バイオ、製薬• 環境、防災、気象• 教育• 公的統計• 社会心理• 地域文化情報

データサイエンスの専門知識とスキル

理系的

文系的

データサイエンスの専門知識とスキル

領域を複数経験

領域①

価値創造の経験

とノウハウ

領域②

価値創造の経験

とノウハウ

文理融合は、進路指導の高校の先生には好まれない!

データサイエンス学部における育成人材像

9

Page 10: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

3.滋賀大学データサイエンス学部のカリキュラム(1)滋賀大学のカリキュラム構成

• データ分析スキルの取得

– データを処理・加工する情報スキル

– データ分析を行うための統計スキル

• 文理融合人材の育成

– 応用分野の多くは人文科学分野

• 各分野の知識や分野特有の事情に対する理解

• 他分野の人とのコミュニケーション力

• 他分野の人に対するプレゼンテーション力

• データ分析の経験を積む

– 実務家によるデータサイエンスの実例紹介

– 企業のデータを用いた課題演習

10

Page 11: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

統計学、コンピュータ科学・情報工学から構成

相対的に統計分析によるアナリシスを重視

汎用解析ソフトの利用・訓練

ビッグデータ解析のための発展的科目データマイニング、テキストマイニング、機械学習、ベイズ理論、最適化など

文理融合の実践を重視

データサイエンスを応用する多様な領域を準備

• マーケティング• ファイナンス• 会計• 医療・健康・福祉• ビジネスエコノミクス• 環境• 教育• 保険・リスク• 公的統計• 心理• 地域文化情報

本学DSプログラムの真骨頂―現場のデータを利用した価値創造PBL演習での成功体験

DS教育研究センターにおける価値創造プロジェクトが企業、自治体、非営利団体等の現場とデータを提供

外部に開かれた実践の場でのコミュニケーション力やチームワーク形成力の鍛錬11

カリキュラムのコンセプト

Page 12: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

データサイエンスフィールドワーク演習

データサイエンス入門演習

データサイエンス入門

計算機利用基礎

基礎情報活用演習A

基礎情報活用演習B

情報活用演習A

情報活用演習B

プログラミングI プログラミングII

プログラミングIII

ビジュアルプログラミング

情報科学概論データ構造と

アルゴリズムデータベース

プログラミング設計

1年生 2年生 3年生 4年生1セメスター 2セメスター 3セメスター 4セメスター 5セメスター 6セメスター 7セメスター 8セメスター

情報ネットワーク

情報セキュリティ

基礎データ分析

統計学要論

統計数学

回帰分析多変量解析入門

解析学線形代数

多変量解析

応用数学

最適化理論 確率論

時系列解析入門 時系列解析

質的データ解析入門ノンパラメトリック

解析入門機械学習入門

質的データ解析ノンパラメトリック解析

機械学習

生存時間解析

ベイズ理論シミュレーショ ン技

社会調査法I 社会調査実践演習

標本調査法

実験計画法テキストマイニン

グ品質管理

プレゼンテーション論

データサイエンス実践価値創造演習I・II

データサイエンス上級実践価値創造卒業演習I・II

空間統計

統計学特論A

統計学特論B

統計学特論C

統計学特論D

パターン認識総論

情報学特論(人工知能)情報学特論(モバイルコンピューティング)データマイニング総論

情報倫理

データサイエンス実践論A

データサイエンス実践論B

実践データ概論A 実践データ概論B

価値創造方法論価値創造実践論

価値創造各論(マーケティング論、ファイナンス論、財務諸表分析論、

ビジネスエコノミクス論、環境政策論、公的統計、保険戦略論、地域文化情報論、生命科学方法論、

教育社会論、心理分析論)

データアナリシス系科目(発展的科目)

データエンジニアリング系科目(発展的科目)

演 演 演演

大学入門科目

データ駆動型PBL演習

価値創造基礎・応用科目

DS専門科目(調査系科目)

DS基礎・専門科目(データエンジニアリング系科目)

DS基礎・専門科目(データアナリシス系科目・データ解析系科目)

メモ演:講義+演習がある科目赤字は必修科目

経済学部開講科目(ミクロ経済学A・B、マクロ経済学A・B,簿記会計A・B、経営学、財務会計総論I・II、管理会計総論I・II、証券分析とポートフォリオ・マネジメントI・II、計量経済学)

情報理論

社会調査法II

Page 13: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

充実した語学教育

13

第1外国語(必修)

第2外国語(必修)

第3外国語(必修)

English

Python:初学者にもとっつきやすいプログラミング言語ながら高度なこともできるのでGoogleやFacebookで採用。機械学習分野などではデファクトスタンダード化。

R:統計分析に強いフリーソフトウェア。世界中の研究者によって最新のデータ解析手法のパッケージが追加されており、データサイエンティストにとっては必須アイテム。

その他、必要に応じて、Java,C,JMP,SPSS,SASなども

Page 14: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

(2)課題解決型(PBL)演習

14

学生が、現実のデータを使って、自ら試行錯誤を繰り返しつつ、課題解決を目指す

・1年次から4年時まで繰り返し実施。本学の大きな特徴。・1-2年次では、各界のデータサイエンティストの成功体験を聞いて価値創造の実例を学ぶとともに、グループ演習によりデータ分析に取り組む。グループ演習:コミュニケーション力の育成

様々なアイデアの試行錯誤コンピュータープログラミングでの助け合い

・3-4年次では、研究室に配属され、企業との共同研究等を通じて、データによる価値創造に取り組む。

成功体験が不可欠!

Page 15: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

PBL演習の例①

15

・POSデータの分析会社と提携し、データを利用・「何が売れるか」(販売予測)、「どう売ればいいのか」(アソシエーション分析)、「顧客属性別の販売戦略」(クラスタリング)等・学生は自分のアイデアで販売戦略を立てる

・地域別分析/地域比較は、企業や自治体で必須のスキル。・各種統計を組み合わせ、データ分析を実施。・「なぜ滋賀県は健康寿命日本一か」など。

スーパーマーケットのPOSデータを用いた分析

都道府県/市町村別のデータの整理・分析

Page 16: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

PBL演習の例②

16

・大学の保健管理センターと協力し、学生の定期健診データ(匿名加工)を利用・「体格の経年変化」、「体格と留年率の関係の有無」等を分析

※「モバイル空間統計」は、株式会社NTTドコモの商標です。

・携帯電話の位置情報を用いて、「彦根駅前に、ある月の昼(ないし夜)の時間帯に、どのような属性の人が滞在しているか」を分析。(集計データを有償で購入)・彦根に来る人の特性を分析し、「彦根市の観光戦略」等を立案

健康診断データの分析

モバイル空間統計の分析

Page 17: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

PBL演習の例③

17

・Twitterで特定のキーワードがつぶやかれている回数等を集計(無料ソフトのIFTTTとGoogle Driveを連携させて集計)・「特定のキーワードをつぶやいている人の属性」「どのような言葉が同時につぶやかれているか」

・アンケート調査会社と提携し、消費者の購買記録情報を利用(オンラインの集計システムを利用)。・「S社のお茶とC社のお茶の購買層の違い」、「それを踏まえた販売戦略」等。

ソーシャルメディアデータの分析

購買記録データの分析

Page 18: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

(3)文理融合型カリキュラム

18

データエンジニアリング:コンピューター・・理系データアナリシス :数学・統計学 ・・理系価値創造 :各領域学問 ・・文系三位一体で、価値創造ができる人材を育成

価値創造科目

1-2年次:「データサイエンス実践論」「実践データ概論」第一線で活躍しているデータサイエンティストから、価値創造の実例を学ぶ

3年次 :価値創造各論(マーケティング論、財務諸表論、生命科学方法論、ビジネスエコノミクス論、etc.)各分野における基礎知識を学ぶとともに、演習により、データによる価値創造を実践。

Page 19: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

(4)データサイエンスによる価値創造

• 価値創造は講義では教えられない

• 現場のデータを利用した価値創造PBL演習での成功体験が重要

• DS教育研究センターにおける価値創造プロジェクトを通じて、企業・自治体等の現場とデータを提供

• 外部に開かれた実践の場でのコミュニケーション力やチームワーク形成力の鍛錬

19

多数の企業・自治体等との連携

Page 20: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

4.企業との連携

20

• 共同研究の推進

製造業、IT企業、金融業等、幅広い共同研究

• 企業における人材育成への協力企業研修への出講、研究指導研究生の受入れ大学院生としての企業派遣受け入れ

• 現役データサイエンティストによる本学学生への講義、教育用データの提供

Page 21: 滋賀大学におけるデータサイエンス教育 - ssken.gr.jp … · •公的統計 •社会心理 •地域文化情報 データサイエンスの専門知識とスキル

ビッグデータ解析等に基づく修士論文

アナリシス科目 エンジニアリング科目

価値創造科目

プロジェクトマネージメント特論 (必修)領域モデル実践論

課題研究1,2,3,4 (必修)

企業等との共同研究参加:〔学部新卒等入学者〕中期インターンシップ〔社会人入学者〕企業での具体的課題の解決

入 門 科 目モデリング概論 (人材像とそのレベルに達するためのステップ、そして基礎的概念)

モデリング科目(モデル化の方法論)

・教師あり学習 (必修)・同実践論・教師なし学習 (必修)・同実践論

・時系列モデリング・同実践論・統計的モデリング・同実践論

・強化学習・転移学習・同実践論・確率過程とその応用・同実践論

最先端の基盤技術を学び、実践する力を養う

自らモデルを立てるスキルを実践的に鍛錬・Webマイニング特論 (選択必修)・同実践論・サイバーフィジカル特論 (選択必修)・同実践論・マルチメディア特論 (選択必修)・同実践論

・欠測・外れ値対処法 (必修)・同実践論・モデリング基礎論 (必修)・同実践論・モデル評価論・同実践論

5.大学院データサイエンス研究科の設立

高度な能力を持つデータサイエンティストへの需要⇒平成31年春に大学院修士課程を設立