原來量化研究的問卷與分析是這樣簡單-三星統計謝章升-20140721

三星統計諮詢顧問謝章升fega53@gmail.com版次:20140721三星課程網www.tutortristar.com

原來量化研究的問卷與分析是這樣簡單

1.統計學的故事

2.研究的基本概念

3.量化研究的問卷設計

4.網路問卷平台的使用

5.資料分析-第一代vs.第二代統計

課程大綱

回到1920年代末期的英國…

世界上首次的隨機對照實驗

回到1920年代末期的英國…

P value

<0.05 *

<0.01 **

<0.001 *** 英國皇家化學學會,2003

隨機對照實驗…

想研究肥料影響收穫量

但每塊地的排水,肥沃度,日照等因素都不同

1. 數學家

2. 大學教授

3. 統計學家

※美國職場調查網站CareerCast.com 2014年度調查報告

※該報告以工作環境、收入、職業遠景和壓力為評比標準

美2014年度最棒工作：數學家

預測分析

消費-哪些人會買

生活-交友網站

選舉-影響選民的方法

疾病-成因與解決方案

為什麼美國數學家最賺，臺灣?

他們的貢獻與情仇…

Karl Pearson

1857-1936

Sir Ronald Aylmer Fisher

1890－1962

1. 社會調查法

2. 流行病學與生物統計學

3. 心理統計學

4. 資料採礦

5. 文字探勘

6. 計量經濟學

統計學的6大領域

本應可以取得,但實際上卻沒能測得的資料

1.抽樣端-找不到人

2.問卷端-找不到答案

社會調查專家的挑戰-遺漏值

1.羅森斯德農業試驗所的隨機對照實驗

2.Gosset的迴歸模型

3.找出「原因」

流行病學與生物統計學家

1.斯皮爾曼（Charles Edward Spearman） vs. IQ vs. 因素分析

2.相關性

3.心靈及精神

4.工作價值vs. 工作動機 vs. 金錢

心理統計學

探索性因素分析(Exploratory factor analysis ;EFA)

XY1Z甲23乙丙

1. 樣本數建議200以上(Comrey,1973)

2. 數學原理是共變(covariance)

3. 針對變數(連續)分類 vs.集群分析(通常針對人)

4. 主要目的是將一組變數縮減成少數幾個因素

5. 因素一定要重新命名

1.抽象概念

2.訪問引導出詞彙

3.結合理論與類似研究

4.設計出第一版問卷

心理統計學

5.前測

6.項目分析

7.探索式因素分析

8.受訪者忘記後再測

9.科學量表

心理統計學

1.以因素結構為基礎算出得分代表抽象概念

2.最後用這個分數進行迴歸或其他統計分析

3.路徑分析

4.中介架構

5.干擾架構

心理統計學

1.科學量表

2.意見調查表

3.直接問句與情境式問句

4.請問您平常會不會打另一半

5.請問您平常會不會一天不見對方,就會心浮氣燥

心理統計學

項目分析

利用t檢定:

1.將所有連續尺度題目相加/題目數,按照大小排序,以27%和73%的樣本來做比對差異

2.找到極端組的切割點後分類為兩群,再利用獨立樣本t檢定檢測

3.如果達統計上的顯著水準,表示有顯著差異

4.CR值---鑑別度分析

項目分析

1.每一構念的題目分別加總或平均

項目分析

2.找出27及73分位數的值

2. 找出27及73分位數的值

項目分析

3.資料分成高分組與低分組兩組

項目分析

3.資料分成高分組與低分組兩組

3. 資料分成低分組及高分組兩組

項目分析

4.進行每一構面題目之兩組獨立t檢定

項目分析

5.平均數差異顯著表示題目具有鑑別力

項目分析-更快的方式

探索性因素分析

將所有與研究相關的連續尺度題目選入對話框

描述性統計量選擇

KMO與Bartlett的

球形檢定繼續

Bartlett檢定應該要

顯著

選項選擇

依據因素負荷量排序

隱藏較小的係數，改為.4

目的是讓較小的交叉負荷量

隱藏，使轉軸後的因素易於

觀察。

KMO愈大，愈適合執行因素分析，至少.7~.8還算適合；.8~.9適合；.9以上表非常適合。

從解說總變異量這張表可以看出分出幾個因素

探索性因素分析結果的應用

1. 因素命名是個重要的程序

2. 通常以負荷量較大的前幾個題目為主

3. 命名乃依據研究者的主觀認知

4. 構面分數主要以summate scale進行

信度檢定

皮爾森積差相關分析

“相關”是統計分析的基本概念之一

變數均為連續變數

變數之間的相關大部份最好在.3~.7之間。

皮爾森積差相關分析

相關（correlation）是用以檢驗兩個變項線性關係的統計技術，以相關係數（coefficient of correlation）來表示其相關程度。

皮爾森相關係數是一個標準化的關聯係數。其原理是先計算出兩個變項的共變量，再除去兩個變項的標準差，加以標準化，得到的一個去除單位的標準化分數。

相關係數介於-1至1之間。

迴歸分析(Regression)

基本條件: 連續變項之間的關係

線性關係 (linear relationship) ，指兩個變項的關係可以被一條最具代表性的直線來表達之時，所存在的關連情形。

迴歸分析的結果無法證明 x 和 y 之間有因果關係存在。

因果關係須滿足三個條件：1. 除了評估變數之外，其餘變數保持不變；2. x、y 有顯著相關；3. 因(x)必發生在果(y)之前。

迴歸方程式

迴歸分析(Regression)

統計量選擇部份與偏相關及共線性診斷

1.依照模型反覆嘗試與修正問項

2.生物統計學-NO

3.心理統計學-Yes

生物統計學 vs. 心理統計學

1.利用迴歸分析驗證每條路徑

2.不能證實所選模型是否最佳模型

其他領域對路徑分析的批評

1.日本常用的田中比奈式測驗

2.原本目的是為找出學習能力落後的同齡小孩

3.卻誤用為得高分便是天才兒童

4.原始定義與量表用途須一致

對IQ的批評

1.資料採礦(炫)

2.Big Data(炫)

3.巨量資料(炫)

4.神經網路(炫)

5.他們都叫統計學(不炫)

商業色彩的資料採礦 (Data mining)

1.購物籃分析

2.相關分析比購物籃分析佳(Sergey Brin)

3.分析彙總表採用卡方分析

4. Amazon網站的商品推薦

1.目標是以預測為主

2.預測顧客會購買的商品

3.預測哪些顧客會被搶走

4.與迴歸分析相比,準確度多出幾個百分點

5.營業額高時適合用

1.運用統計分析自然語言的文章

2.自然語言=英文,日文,中文….

3.莎士比亞真有其人?

4.型態分析

5.目前停留在單詞層次

6.文學,史學,社會學,商學

文字採礦

1. 型態分析(Morphological Analysis)

2.目前停留在單詞層次

3.文學,史學,社會學,商學

4.社群網路服務的新世界

5.網路口碑與選情走向分析

文字採礦

1. 對於交互作用的變數,選擇上更嚴謹

2.會先考慮X跟Y之間是否可能存在曲線關係

3.例如收入與滿足感

4.偏好使用概率回歸方法

計量經濟學

1.是否有研究主題?

2.研究架構?

3.研究構念?

4.找不到相符的資料庫?

思考一下什麼情況需要問卷

原始資料-Raw Data

原始資料-Covariance Matrix

次級資料

1. 政府,第三方機構統計資料

2. 學術期刊的Covariance Matrix(較適用SEM Paper,PLS不適用)

3. 其他學者合作資料

4. 常見問題-去哪找我的領域可用的資料庫?

又稱構面,為一個想像的抽象名詞,

目的是建立研究的基礎

研究的基本名詞-構念(construct)

變數是量化研究方法中的必要組成因素,

目的是讓構面可以操作

研究的基本名詞-變數(Variable)

為研究構面之間的關係的描述,

會形成我們的研究架構

研究的基本名詞-命題 (Proposition)

為各變數之間的對應關係,是研究問題的暫時性答案,只有經過統計估計/檢定,才能判定其為真實

研究的基本名詞-假設 (Hypotheses)

研究假設

檢定平均數相等-t檢定,ANOVA,時間序列,重複測量

檢定斜率為0

-相關,迴歸,路徑分析,獨立性檢定

檢定變異數箱等-同質性檢定,適合度檢定

研究的基本名詞-檢定與估計

將抽象的概念用相關,具體,

可觀察並可衡量的事物展現

組織承諾-離職率,請假次數

憂鬱程度-睡眠狀況,參與社交活動狀況

研究的基本名詞-操作型定義

研究架構

形成型指標vs.反映型指標

反映型指標

形成型指標

形成型指標vs.反映型指標

1. 因果關係必需是構面到觀察變數(Churchill,1979)；

2. 測量誤差在觀察變數；

3. 觀察變數需具有內部一致性

(Fornell & Bookstein,1982)；

4. 觀察變數需具有中高度相關

(Fornell & Bookstein,1982)；

5. 一個構面至少需具有3個觀察變數

(Bollen, 1989)；

反映型指標特性(Jarvis et al. 2003; MacKenzie et al. 2005)

6. 觀察變數具可交換性(Nunnally & Bernstein, 1994.)；

7. 移除構面中的某特定觀察變數，不會影響構面的意義(Bollen & Lennox, 1991; Nunnally & Bernstein, 1994;

Jarvis et al. 2003) 。

8. 潛在構面要符合單一構面原則，即要有較低的交叉負荷量 (Kline, 2011)

9. 構面需具有數字的敏感性，高低需具有意義 (DeVellis,

2003)。

形成型指標特性

1. 因果方向由測量變數到潛在變數

2. 沒理由相信測量變數之間有中高度相關，

因此沒有內部一致性的問題

3. 拿掉一個變數會改變構面的意義

4. 測量誤差在構面層級

5. 觀察變數定義潛在變數的意義

形成型指標特性

6. 觀察變數不能互相取代

7. 觀察變數不一定要有相似的內容,相關可以為負

8. 一個觀察變數改變不一定會改變其它的變數

9. 觀察變數不一定要有相同的影響變數或結果

1. 單選題

2. 複選題

3. 同意度類型題

4. 文字輸入題型

問卷題型

善用網路問卷平台

1.引述前人研究相關題目

2.採用封閉式的題型

3.明確

4.簡短

5.不要反向題

6.建議7尺度

7.一個構念不要超過7題

問卷設計原則

1.具體且直覺

2.避免受訪者不熟悉的用詞

3.避免一個問題問兩件事

4.避免明示與暗示的建議

5.不要侵犯隱私

措詞用字原則

1.為什麼不能用反向題?

2.可以一個構面合併兩個學者設計的問卷嗎?

3.知名學者的問卷題目,我真的統計分析後可以刪除嗎?

4.我過程都有照標準流程,為什麼分析的時候還是一團糟?

常見的問題排行榜

掌握三關鍵-分析沒煩惱

樣本數問題

題目數問題

尺度與指標問題

是否

尺度建議為

連續尺度較彈性

SPSS,SEM,PLS皆可分析

分析較受限

目前只有SEM中的

MPlus軟體有演算法

反映型指標

(Reflective)

SEM(CB-SEM)

PLS(VB-SEM)

形成型指標

(Formative) SPSS-主成分分析,典型相關

PLS(VB-SEM)N/A

掌握三關鍵-尺度與指標問題

確認您的X與Y

前導觀念

關鍵句:

平均數有沒有

意義

Excemple:

姓別

Excemple:

學生成績

X不連續 X 連續Y連續

Y不連續

X不連續 X 連續

敘述統計卡方分析

區別分析 Logistic迴歸

Y連續

Y不連續

多變量變異數分析MANOVA

單變量變異數分析ANOVA

T檢定

迴歸分析偏最小平方迴歸路徑分析相關分析

量化研究的相關概念-四種測量尺度

名目尺度類別尺度

順序尺度次序尺度

區間尺度等距尺度

等比尺度比例尺度

• 人口統計變項中的性別、

職業別、宗教別……..名目尺度

• 冠軍、亞軍、季軍

第一、第二、第三順序尺度

• 溫度、滿意度、

態度區間尺度

• 年齡、身高、體重等比尺度

樣本量建議方案

100以下1.質性研究

2.PLS-可接受小樣本,但有限制條件

100-200 PLS

SPSS與SEM可能模型不佳

200-500 SPSS (樣本數影響顯著性)

SEM (樣本數不影響顯著性,但為基本要求)

500以上 SPSS

SEM(可隨機分組,驗證模型效度)

樣本數問題

樣本量建議方案

2題以下 PLS-最低可接受1題(反映與形成指標皆可)

3題以上 SEM的基本要求

5-7題 SEM學者的建議設計數量

7題以上 PLS

過多題目與構面在SEM分析中易形成型一錯誤

題目數問題

SmartPLS 3.0

http://www.smartpls.com/

以產出為導向-碩士論文

前面的流程跑對,

模型幾乎會過關

1.建議盡量蒐集連續尺度2.反應與形成型指標皆可

研究架構

1.資料庫2.問卷對象3.網路問卷

第二代統計學題目數是關鍵

1.傳統的方法易受樣本影響2.樣本過少-PLS

以產出為導向-投期刊

PLS定位為探索,

SEM定位為驗證

從尺度與指標找題目

發展研究架構

1.資料庫2.問卷對象3.網路問卷

題目數

樣本數

補充說明-第四章怎麼寫才會快

完成第四章,依此變成習慣的良性循環

表格先轉Excel

發展研究架構

1.選擇圖形介面的軟體2.SPSS,Amos,PLS,

表格與Office相容

統計描述內容參考國外paper寫自己的一個版本

再轉Word與PPT

Thank you

1. 歡迎有問題時,利用mail或APP聯繫

2. 我們會在能力範圍內盡量回覆您

三星課程網

www.tutortristar.com

原來量化研究的問卷與分析是這樣簡單-三星統計謝章升-20140721

Education

dr.hsieh -謝明浚

it19 20140721 linked data personal perspective

論《巴黎‧德州》中照片的多重詮釋 ·...

20140721 공유허브세미나 1 2...

ch10 文字的領域謝宛芸_謝翊心

為什麼我們這樣生活,那樣工作? i

Ульяновск 20140721 72

一樣的南仁山 . 不一樣的蟲蟲

10.1 隨機抽樣

六級四三二一樣錯樣...

20140721 공유허브세미나 2 3...

코플 사업소개서 20140721

20140721 공유허브세미나 1 3...

謝儒生龐繼元謝崇文謝正裕鄭瑛彬賴慧明...

20160109 設計師順手這樣做，工程師感謝你

11108138 謝欣穎

樣本 - ephhk.popularworldhk.com

ch 12 點估計與抽樣分配. 本章大綱抽樣的概念...

謝謝您 ! 每天照顧我

b360 20140721-gw-nieuwsbrief fiscaal juli2014