sg11 理学におけるデータ科学実践 機械学習で自然科学を読み解...
TRANSCRIPT
SG11 理学におけるデータ科学実践
機械学習で自然科学を読み解けるか
2019年度 MACS学生説明会 2019年4月12日
中野 直人 国際高等教育院附属 データ科学イノベーション教育研究センター 特定講師 理学研究科 連携講師
理学におけるデータ科学実践 機械学習で自然科学を読み解けるか
機械学習的手法の研究や応用の例が増えてきている特徴量を抽出して分類や予測 人の代わりにタスクを機械に実行させる
理学にもデータはいっぱい 研究にそういう手法は使えるのか?
自分で確かめてみるしかない
このSGでやること1. とにかく機械学習的手法を習得 2. 興味のある(研究で用いている)データに適用 3. 何か新しい発見があれば...
導入はどうすれば良い?
ツールと手法のチュートリアルはやります ~ Python + Jupyter Notebook~ scikit-learn, TensorFlow (機械学習ライブラリ) とりあえず慣れる あとは気合と根性
地磁気のデータ
バイオインフォマティクス
気象庁55年長期再解析
手書き文字認識でとにかく遊ぶ
モデルパラメタリゼーション
やれることの例
理学研究科附属地磁気世界資料解析センターご提供
Cancer Program Resource Gatewayから取れる
気象庁JRAプロジェクトのページ
MNIST
とにかくいろいろな回帰やニューラルネットワーク などもろもろの手法をためす
2018年度SGで実施のお手習いの内容多層パーセプトロン・手法と理論 決定木・ランダムフォレスト・手法と理論 AutoEncoder で次元縮約 Reservoir Computing で力学系の再現 強化学習・方策勾配法で迷路を解く 畳み込みニューラルネットワークで画像解析
問題点 手法だけ習い続けても,各自の問題への適用まで なかなか手が回らない
だから気合と根性
2019年度に代表教員がなんとなく やろうかなと思っている内容大気変動データで予測モデルを立てる
柿岡データからのパターン抽出
学習はうまくいく.しかし予測がうまくいかない 過学習なのか? それともデータの自由度が高すぎるのか?
良い予測モデルのための工夫は? その工夫と気象学との関係はあるか?
知られている波形パターンをノーヒント機械学習で 抽出できるか?それで新たな現象を発見できるか?
2019年度に代表教員がなんとなく やろうかなと思っている内容とりあえず強化学習 教師あり学習はとにかく正解データが必要 教師なし学習でやれることには限界がある
現象の「ルール」がはっきりしているなら 直感的な機械学習モデルを作ることができる 強化学習的なフィードバックをモデリングに用いる
その他もろもろ 実際のところ,ネタはあっても手が回らない
PCもちこみしてください
SGミーティングの曜時限
ペースは月1・2回くらい
実施要領
なくても大丈夫! 最悪スマホでもできる
なくても大丈夫! 理学部が貸してくれます
持ち帰って作業してもらいます
Google の Colaboratory
簡単な進捗報告と手法のチュートリアル
台数制限はアリ
たぶん火曜日午後遅め
取り組みたい問題があるなら,自分で積極的にどんどん進めよう
分野外の人とのつながりを強く持とう
他のSGも結構機械学習やっています
興味を持つ学生に勧めること
結局手を動かすのは自分です
アイディアはどこからやってくるかわかりません SG10のような自発的な活動をする SG も入ると良いです
目的や興味に応じて SG を選ぶと良いです
おまちしています