Share PDF

Search documents:
  Report this document  
    Download as PDF   
      Share on Facebook

การวิเคราะห์การถดถอยและสหสัมพันธ์

(Regression and Correlation Analysis)

อ.นิลุบล ด้วงนิล

การวิเคราะห์การถดถอย

การวิเคราะห์การถดถอยแบบง่าย(Simple Regression Analysis)

การวิเคราะห์การถดถอยเชิงซ้อน(Multiple Regression Analysis)

การวิเคราะห์การถดถอยอย่างง่าย เ

นเ

คนิค นการ ร้างร แบบ

การเ

อหาควา

วแ

ร

า (Dependent Variable)

 

ว ก บ วแ รอิ(Independentระ

Variable)

ว ดย

วแ

ร

ง อง ้องเ น ้อ

เชิง

ริ

า

 

 

ตัวอย่างของการวิเคราะห์ด้วยการวิเคราะห์การถดถอย

ความดันโลหิตกับอายุ

มูลค่าการส่งออกสินค้ากับปริมาณการผลิต

ความสัมพันธ์ระหว่างค่าใช้จ่ายเพื่อการบริโภค

กับรายได้ เป็ นต้น

การวิเคราะห์การถดถอยจะเกี่ยวข้องกับการประมาณค่าหรือการ พยากรณ์ค่าของตัวแปรตาม เมื่อก าหนดค่าของตัวแปรอิสระโดยพยายาม ให้ค่าที่ประมาณหรือค่าที่พยากรณ์ได้มีความคลาดเคลื่อนน้อย หรือม

ใกล้เคียงกับความเป็ นจริงมากที่สุด

วัตถ ุประสงค์ในการวิเคราะห์การถดถอย

1. เป็ นการทดสอบทางสถิติว่าตัวแปรX มีอิทธิพลต่อตัวแปรY หรือไม่

2. หากพบว่าอิทธิพลมีนัยส าคัญทางสถิติแล้X มีผลต่อวY ในระดับและทิศทางอย่างไร เช่น หากX เพิ่มขึ1้นหน่วยY จะเพิ่มขึหรือลดลงในปริมาณเท่าใด้น

3. ผู้วิจัยต้องการสร้ างสมการท านายอย่างง่ายเพื่อน าไปใช้ในประชากร ซึ่งอยู่ในรูปY = a+bX

ร ูปกราฟของการถดถอย

Y

Regression line; Y = a + bX

X,Y

 

b or slope

Y-intercept

Regression coefficient

 

X

Simple Linear Regression

การวิเคราะห์การถดถอย(Regression Analysis) และการวิเคราะห์สหสัมพันธ์(Correlation Analysis)

•เป็ นการศึกษาเก่ียวกบความสัมพันธ์ของตัวแปรั

•วัตถุประสงค์หลักของการวิเคราะห์การถดถอยคือความต้องการประมาณค่าของตัวแปรตัวหนึ่ง

•ตัวแปรตาม (Dependent Variable) นิยมเขียนแทนด้วยY

•ตัวแปรอิสระ(Independent Variable) นิยมเขียนแทนด้วยX

•ถ้าใช้ตัวแปรX เพียงตัวแปรเดียวในการประมาณY และความสัมพันธ์ของY และ X เป็ นเชิง เส้นตรงเราเรียกวา่ การถดถอยเชิงเส้นอยางง่่าย (Simple Linear Regression)

การวิเคราะห์สหสัมพันธ์เป็นการศึกษาระดับ หรือขนาดของความสัมพันธ์เชิงเส้นตรงระหวางตัว่ แปรสองตัวแปรวามีมากน้อยเพียงใด่

•เครื่องมือที่ใช้วัดเรียกวา่ สัมประสิทธิ์สหสัมพันธ์(Correlation Coefficient) นิยมเขียนแทนด้วยr

•ตัวเลขที่มีค่าอยูระหว่าง่ -1 กบั 1

สัมประสิทธิ์สหสัมพันธ์r

• ถ้าr มีค่าใกล้1 แสดงวา่ ตัวแปรสองตัวนั้นมีความสัมพันธ์กนมากและมีทิศทางเดียวกันั

***ถ้าX มีค่ามากY จะมีค่ามากด้วย***

•ถ้าr มีค่าใกล้-1 แสดงว่า ตัวแปรสองตัวนั ้นมีความสัมพันธ์กันมากเช่นกันแต่มีทิศ

ทางตรงข้ามกัน

ถ้าX มีค่ามากY จะมีค่าน้อย

ถ้าX มีค่าน้อยY จะมีค่ามาก

• ถ้าr มีค่าเข้าใกล้0

ถ้าX และ Y มีความสัมพันธ์กันน้อย

สัมประสิทธิ์สหสัมพันธ์(Correlation Coefficient, Rxy)

•ระดับของความผันแปรร่วมกันของตัวแปรX และ Y เช่น ความสัมพันธ์ของ จ านวนนักศึกษากับจ านวนอาจารย์

•จ านวนนักศึกษากับจ านวนอาจารย์อาจมีความสัมพันธ์กัน แต่ไม่บอ อะไรเป็ นเหตุ อะไรเป็ นผล

•ความสัมพันธ์มีค่าตั-1้งแต่ถึง+1

<.20 ความสัมพันธ์น้อยมาก

.20-.40 ความสัมพันธ์น้อย

.40-.70 ความสัมพันธ์ปานกลาง

.70-.90 ความสัมพันธ์สูง > .90 ความสัมพันธ์สูงมาก

20

ตัวแบบการถดถอยเชิงเส้นอยางง่่าย (Simple Linear Regression Model)

Y และ X

Y =  + X +  . . . (1) ตัวแบบการถดถอยเชิงเส้นอยางง่่าย

โดยที่ และ  เรียกวา่ สัมประสิทธิ์การถดถอยของประชากร (Population Regression Coefficient)

การวิเคราะห์สหสัมพันธ์

r =

 

SXY

 

 

 

 

SXX SYY

 

 

 

 

่งเราสามารถแสดงึ ด้วา่ r = R2

เราสงสัยวาเกรดเฉลี่ยสะสม่ (G.P.A) เมื่อสาเร็จการศึกษา มันขึ้นอยูก่บั คะแนนสอบ คัดเลือก่อนที่จะเข้ามาเรียนหรือ ม่

•ตัวแปรเกรดเฉลี่ยสะสมหรือตัวแปรที่เราต้องการพยากรณ์คือตัวแปรตาม

•ตัวแปรคะแนนสอบคัดเลือกรียกวาตัวแปรอิสระ่

•เป็นข้อมูลเชิงปริมาณทั้งคู่

•สมมติวาเราทดสอบแล้วว่าตัวแปรทั่้งสองนี้มีความสัมพันธ์กนเชิงเส้นั

(คือมีความสัมพันธ์ในลักษณะเส้นตรง ่งข้อมูลสึ่วนใหญ่จะเป็นแบบนั้น) และหารูปแบบของ ความสัมพันธ์ ด้เป็ น

= . + .

GPA แทน เกรดเฉลี่ยสะสมเมื่อส าเร็จการศึกษา SCORE แทน คะแนนสอบคัดเลือก

หน้าตาของสมการจะเขียน ด้เป็ น

GPA = .257 + .04 Score

Ex. ดช.พาหุง สอบเข้ามา ด้ด้วยคะแนน76คะแนน

GPA = .257 + .04 Score

GPA=.257+.04(76)=3.30

แ ควา ด้ว่า ดช. าห งเ อ าเร การ ก า ะ ด้เกรดเ . ย ะ

เกรดเฉลี่ยสะสม(G.P.A) เมื่อส าเร็จการศึกษา มันขึ ้นอยู่กับ คะแนนสอบ คัดเลือกก่อนที่จะเข้ามาเรียนหรือไม่?

คน

GPA

.

.

.

.

.

.

.

.

.

.

SCORE

Analyze - Regression - Linear..

•

ากผ

์ ้าง

้น

ห้ด

 

าราง

ดCoefficient้าย าราง รงช่องt แ ะ ช่องSig.

วแScoreร

 

ซ งเ

นการ ด อบ

 

ิฐานว่า

Scoreวแ รก บ

วแ Gradeร

ควา

น ์ก นอย่าง

น

 

หร อ ?่

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

•

ค่าSig. น

ถ้า

ค่าน้อยกว่า ระด บน ย

 

าค ญ

ผ ้วิ ยก าหนด แ

ว่า วแ

ร

 

น

น t =ค่า15.538 แ

ะ ค่าSig. = .000 ซ งผ ้วิ

ยก าหนดระด บน ย

าค ญ องการ.05ซ

ดง อ

 

ค่าSig. < .05 แ ดงว่า

 

วแ Scoreร

ก บ

วแ Gradeร

ควา

น ์ก นเชิงเ ้น

ระด

 

น ย

าค.05ญ

ง า

ารถ

ร้าง

การถดถอยเ

อน า

ช้

านาย ด้ Unstandardizedห้ด ช่อง

 

 

Coefficients B (

ระ

ิ

ิ์

องการถดถอย)

 

 

 

 

 

 

 

 

•

 

การ ้นแบบค Ycอ = a + bx

(Y

น

น

gpaค อ, X น

น Scoreค อ

่วนค่าa หร อ

 

 

ด

ดแกนY ค อค่าคง(Constant))

 

 

 

 

 

 

 

 

 

•

 

ด งน

น การ

ยากร

์

GPAด้ค= .257อ

 

 

 

 

 

2

 

 

+ .04 Score ซึ่งสมการถดถอยนี ้ มีค่าR = .968

(ตารางผลลัพธ์ที่๒ตาราง Model Summary ช่องR square) แปลว่า ความผันแปรในเกรดเฉลี่ย สะสมเมื่อจบการศึกษา เป็ นผลเนื่องมาจาก คะแนนสอบเข้า ถึงร้๙๖อยละ.๘ ที่เหลืออีกร้ อยละ ๓.๒ เป็ นผลเนื่องมาจากสาเหตุอื่น แสดงว่าการใช้สมการถดถอยข้างต้นมีอ านาจในการท สูง ค่าที่ถูกท านายกับค่าที่เกิดขึ(Y-Yc) จะต่างกันไม่มาก้นจริง

Descriptive Statistics

 

Mean

Std. Deviation

N

 

 

 

 

 

Y

18.0000

4.16333

10

 

 

 

 

X

6.0000

2.26078

10

 

 

 

 

Model Summary

 

 

 

Adjusted R

Std. Error of the

 

 

 

Model

R

R Square

Square

Estimate

 

 

 

 

 

1

.933a

.870

.853

1.59398

a. Predictors: (Constant), X

 

 

 

 

 

ANOVAb

 

Model

 

Sum of Squares

df

Mean Square

F

Sig.

 

 

 

 

 

 

 

1

Regression

 

 

 

 

 

 

 

135.674

1

135.674

53.399

.000a

 

Residual

20.326

8

2.541

 

 

 

Total

156.000

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Coefficientsa

 

 

ในที่นี้จะ ด้สมการการถดถอย

Y = 7.696 + 1.717X

 

 

 

 

Standardized

 

 

 

 

 

 

Unstandardized Coefficients

Coefficients

 

 

95% Confidence Interval for B

 

 

 

 

 

 

 

 

 

Model

 

B

Std. Error

Beta

t

Sig.

Lower Bound

Upper Bound

 

 

 

 

 

 

 

 

1

(Constant)

 

 

 

 

 

 

 

7.696

1.497

 

5.139

.001

4.242

11.149

 

X

 

 

 

 

 

 

 

1.717

.235

.933

7.307

.000

1.175

2.259

ค่า b ในสมการการถดถอยในที่นี้คือ 1.717 จะบอกการเปลี่ยนแปลงของ Y เมื่อX เปลี่ยน ป1 หน่วย ในที่นี้หมายความวา่ ถ้าครัวเรือนมีราย ด้แตกต่างกนั 1000 บาท จะมี ค่าใช้จ่ายเก่ียวกบอาหารแตกตั่างกนประมาณั 171.7 บาท

Coefficient of Determination

R2 =

R2

1

SSR

(

) Coefficient of Determination

 

SST

 

 

 

X

Y

 

R2 = 87%

 

87% (total variation)

(Y) สามารถอธิบาย ด้ด้วยราย ด้ของครัวเรือน(X)

ˆ 

Y a  bX

Y

a = +

1

b = +

 

0

X

 

Y

 

 

a = +

3

 

b = -

 

 

 

 

X

0

 

 

 

ˆ 

Y a  bX

ร ูปกราฟของการถดถอยแบบต่างๆ

 

ˆ

 a  bX

Y

Y

 

 

a = -

2

b = +

 

0

X

 

Y

 

 

a = -

4

 

b = -

 

 

 

 

X

0

 

 

 

ˆ 

Y a  bX

Multiple regression analysis

เทคนิคเชิงสถิติที่ใช้วิเคราะห์ความสัมพันธ์ระห ตัวแปรตาม 1 ตัวกับตัวแปรท านายหลายตัว

Y = a + b1X1 +b2X2 + … + bnXn + e

32

u

33

O

34

ffici

i l

(

(

r

(

r i

(

r i q

(

r i

q

35

p

aP q r

36

O

aP q

bD

37

ica

(

i

r

aD.

38