topic - essentialoil.wu.ac.th · regression analysis regression analysis applies to paired data...
TRANSCRIPT
AG060-310 Applied Statistics for Ago-Industry
Topic
Correlation and Regression
By
Associate Professor Dr. Narumol Matan
Food Science and Technology School of Agricultural Technology
Walailak University 1/2019
Correlation and Regression Distinguished It should be apparent that correlation and regression procedures have some features in common and as a result are often confused. The classic regression situation involves one dependent variable and one or more independent variable. The independent variable is the variable that is controlled or manipulated by a researcher so that its effect on a dependent variable can be determined.
Figure 1 Scatterplots illustrating various degrees of correlation ที่มา: https://www.mathsisfun.com/data/correlation.html Various schemes have been suggested to help students interpret correlation coefficients. A common but misleading scheme is the classification of certain r values as “very high” (r0.90), “high” (r=0.70-0.89), “medium” (r=0.30-0.69) or “low” (r=0.30). This will be illustrated for the concepts of reliability and validity, two desirable characteristics of psychological test. One type of reliability, called test-retest reliability, is determined by administering a test to a group of participants, waiting a suitable period of time and then readministering the test to the same participants. A nonzero correlation coefficient simply means that there is a concomitant relationship between X and Y that is variation in one variable is associated in some way with variation in the other. In addition, a different correlation measure called correlation ration have been developed for determining the strength of association between nonlinearly related variable
Example 1 Compute scatterplots and r use (Weight) and (ac: arm circumference) Ho: Ha: 1. Open the file below
Click--- Graphs—legacy dialogs—scatter
Weight Arm
Output
…………………………………………………………………………………………………………………………………………………………
Simple Scatter
add weight into Y Axis and arm circumference into X Axis--OK
………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… 2. For Correlation Select Analyze—correlation—bivariate
Select---weight and arm circumference to Variables—select Options—select Means and standard deviations-Continue--OK
Select---Person (Quantitative data) Select--- Kendall’s Tau-b (Ordinal scale)
Select--- Spearman (Non-parametric) Output
Conclusion......................................................................................................................................................... ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… …………………………………………………………………………………………………………………………………………………………
r value
Regression analysis
Regression analysis applies to paired data (X1,Y1), where X is the independent variable with values X1 that are selected in advance, and Y is the dependent variable with values Y1 that are free to vary. However, regression procedures also are applicable when both X and Y are free to vary, as they are in correlation. For r+1 or -1, the dependent variable, denoted by Y, can be predicted from the independent variable, X, with perfect accuracy. If, however, r is equal to zero, a knowledge of X is useless in predicting Y. Although a correlation coefficient is indicative of our ability to predict, the actual predication is made using regression analysis. 1 Simple Regression Example 1 From correlation data Ho: Ha: Select---- Analyze—regression—Linear
Conclusion......................................................................................................................................................... ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………………… …………………………………………………………………………………………………………………………………………………………
Select--- arm circumference into Dependent and select Weight into Independent --OK
แบบฝึกหัด 1 จงหาค่า Correlation และสมการ Regression ระหว่างค่าของ mch (คือ ค่าเฉลี่ยของน ้าหนักฮีโมโกลบินที่มีอยู่ในเม็ดเลือดแดง มีหน่วยเป็นพิโคกรัม) และค่า mcv (ค่าเฉลี่ยของปริมาตรเม็ดเลือดแดงที่มีหน่วยเป็น เฟมโตลิตร) ที่วัดได้จากผู้ตอบแบบสอบถาม 2 จากสมการที่ได้จากข้อ 1 จงบอกสมการที่ใช้ท้านาย และจงบอกว่ามาว่าหากมีการวัดค่า mch ได้ 29.5 พิโคกรัม จงใช้สมการในการค้านวณค่า mcv ที่ได้จากสมการ และสมการดังกล่าวมีความถูกต้องมากน้อยเพียงใด 3 จงหาค่า Correlation และสมการ Regression ระหว่างค่าของ weight ค่า hip (ความยาวรอบสะโพกหน่วยเป็นเซนติเมตร) และค่า arm circumference ที่วัดได้จากผู้ตอบแบบสอบถาม 3 จากข้อ 3 จงอธิบายมาว่าสมการที่ได้จากวิธีการ Enter วิธี Backward วิธี Forward วิธี Stepwise มีความเหมือนแตกต่างกันหรือไม่อย่างไร
4 จากสมการได้จากข้อ 3 จงบอกสมการที่ใช้ท้านายค่า weight ที่ดีที่สุด และหากวัดค่า hip ได้ 101 และค่า arm circumference =31 จงท้านายค่า weight โดยใช้สมการดังกล่าว ทั งนี ค่าที่ค้านวณได้จากสมการมีความถูกต้องมากน้อยเพียงใด 5 จากข้อ 3 จงอธิบายมาว่าสมการที่ได้จากวิธีการ Enter วิธี Backward วิธี Forward วิธี Stepwise มีความเหมือนแตกต่างกันหรือไม่อย่างไร