実験データー解析概論leeswijzer.org/r/nodai2014-7.pdf · 2016-04-21 ·...
TRANSCRIPT
![Page 1: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/1.jpg)
2014 年度・東京農業大学生物応用化学科(毎週金曜第 2限)三中信宏〈実験データー解析概論〉:2014年 4月~ 2014 年 9月
東京農業大学世田谷キャンパス 431番教室
実験データー解析概論— 統計学に基づく「よりよい推論」のために —
三中 信宏MINAKA Nobuhiro
独立行政法人 農業環境技術研究所 生態系計測研究領域 上席研究員[生物統計学]
東京大学大学院 農学生命科学研究科 生物・環境工学専攻 教授[生態系計測学]
東京農業大学大学院 農学研究科 客員教授[応用昆虫学]
mailto:[email protected] (メール)
http://twitter.com/leeswijzer/ (ツイッター)
http://cse.niaes.affrc.go.jp/minaka/ (ウェブサイト)
http://d.hatena.ne.jp/leeswijzer/ (ブログ)
![Page 2: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/2.jpg)
線形統計モデル(LM)への入り口モデルとデータの接点に触る
観察者
現象 データ
モデル×
統計的誤差
共通要因個別要因
パラメータ推定モデル選択アブダクション
![Page 3: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/3.jpg)
線形統計モデル(LM)への入り口モデルの構造とパラメータ
パラメータ推定問題
モデルの「構造」を固定
したとしても,パラメー
タ群の値は可変である.
どのような基準で最適な
パラメータ値を決定する
のか.
パラメータ群 ・手足の長さ ・関節の位置 ・屈曲の角度
計算すればなんとかなる
![Page 4: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/4.jpg)
線形統計モデル(LM)への入り口モデルの構造とパラメータ
モデル選択問題
モデルの基本となる「構
造」そのものをどのよう
な基準で決定すればいい
のか.モデル構造 ・ボディプラン ・手足の本数 やや難しいかも・・
・
![Page 5: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/5.jpg)
線形モデルを鍛えあげる
線形モデル(LM)
データ 総平均
処理効果 誤差項 誤差は正規分布をする
通常の「線形モデル」の仮定 ・処理効果はある実数(「パラメータ値」)である. ・誤差項は独立かつ同一の正規分布にしたがう. (「正規性」と「等分散性」)
これらの仮定を緩めよう(一般化)
![Page 6: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/6.jpg)
線形モデルを鍛えあげる
一般化線形モデル(GLM)
データ 総平均
処理効果 誤差項 誤差は正規分布をする
何が一般化されたのか? ・誤差項が正規分布でなくてもよい. ・データのある関数変換(「リンク関数」)が 線形モデルで記述できればよい
![Page 7: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/7.jpg)
線形モデルを鍛えあげる
一般化加法モデル(GAM)
データ 総平均
処理効果 誤差項 誤差は正規分布をする
さらなる一般化とは? ・予測関数は単一の式で表示される関数である必要 すらなく,スプライン関数によって区分的に構築 された任意に関数(ただし加法性はある)でもか まわない.
![Page 8: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/8.jpg)
線形モデルを鍛えあげる
混合効果モデル(mixed-effect model)
処理効果
要因の「処理効果」は,ある実数の「パラメータ値」という定数として「固定効果」(fixed effect)をもつと仮定してきた.しかし,その処理効果が別の確率分布にしたがう“変量”とみなして,「ランダム効果」をもつと仮定すれば,より細かい変動や個体差をもモデリングできるだろう.
![Page 9: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/9.jpg)
線形モデルを鍛えあげる
LM
GLM
GAM
非正規誤差リンク関数
経験的予測関数
LMM
GLMM
GAMM
混合効果線形モデル
一般化線形モデル
一般化加法モデル
混合効果モデル
![Page 10: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/10.jpg)
進化認知科学・連続セミナー・第4回(27 October 2004,東京大学)
三中信宏「シンプルって美しい:認知最節約化のための図像と概念」
Curve-fitting problem (2)
![Page 11: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/11.jpg)
第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法
![Page 12: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/12.jpg)
第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法
![Page 13: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/13.jpg)
第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法
![Page 14: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/14.jpg)
第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法
![Page 15: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/15.jpg)
第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法
![Page 16: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果](https://reader035.vdocuments.mx/reader035/viewer/2022062920/5f02bf217e708231d405ced4/html5/thumbnails/16.jpg)
第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法