Blog của Lê Văn Luật

Đời người thì có hạn mà sự học thì vô hạn!

Diễn giải hệ số tương quan – dễ sai lầm

Hệ số tương quan (r) đo lường mức độ quan hệ tuyến tính giữa hai biến số. Tuy nhiên, hệ số tương quan không cho biết biến nào là nguyên nhân và biến nào là kết quả. Do đó, việc diễn giải hệ số tương quan dễ bị lầm lẫn giữa nguyên nhân và kết quả.

Có hai biến X và Y, hệ số tương quan của X và Y là r:

r=\frac{S_{XY}}{S_xS_y}=\frac{\sum_{i=1}^{n}{x_iy_i-n\overline{x}.\overline{y}}}{\sqrt{(\sum_{i=1}^{n}{x_i^2-n\overline{x}^2})(\sum_{i=1}^{n}{y_i^2-n\overline{y}^2})}}

r > 0 cho biết mức độ quan hệ tuyến tính đồng biến và ngược lại,
r < 0 cho biết mức độ quan hệ tuyến tính nghịch biến.
|r| = 1 cho biết mối quan hệ giữa X và Y hoàn toàn chặt chẽ. r = 0 cho biết X và Y không có mối quan hệ.

Một ví dụ dựa trên một đoạn trong bài viết Student Ratings: Myths vs. Research Evidence của Michael Theall về mối quan hệ giữa đánh giá của sinh viên (về giáo viên) và kết quả học tập:

3. Are ratings related to learning? The most acceptable criterion for good teaching is student learning. There are consistently high correlations between student ratings of the “amount learned” in a course and students’ overall ratings of the teacher and the course. Even more telling are the studies in multisection courses that employed a common final exam. In general, student ratings were the highest for instructors whose students performed best on the exams. These studies are the strongest evidence for the validity of student ratings because they connect ratings with learning.

Theo trên, Theall cho rằng có tương quan chặt chẽ giữa đánh giá của sinh viên về lượng kiến thức học được và đánh giá chung về giáo viên và khóa học. Nói chung sinh viên đánh giá cao những giáo viên có sinh viên đạt kết quả thi tốt.

Ở đây ta thấy có hai biến:

+ Đánh giá của sinh viên (gọi là X)
+ Lượng kiến thức học được, mà theo Theall nó thể hiện qua kết quả kiểm tra (gọi là Y)

Và theo Theall ở trên, r(X,Y) → 1. Với đánh giá của Theall, ta có thể diễn giải r(X,Y) theo hai cách:

1/ Giáo viên được đánh giá cao tức là có chuyên môn và năng lực sư phạm tốt nên tác động tốt đến lượng kiến thức học được của sinh viên nên điểm cao (Y → X).

2/ Giáo viên cho điểm cao nên sinh viên thích và đánh giá cao giáo viên đó (X → Y).

Rõ ràng hai cách diễn giải trên khác nhau về bản chất và việc diễn giải theo cách này hay cách kia có thể dấn đến nhìn nhận sai thực tế và dễ dẫn đến các quyết định sai.

Thực ra, r không cho biết chiều tác động giữa hai biến nên cả hai cách diễn giải trên đều là võ đoán. Để xác định chiều tác động cần thêm những thông tin khác – mà thường là định tính – ví dụ như: Nếu ta khẳng định được rằng việc tổ  chức thi là đảm bảo khách quan, trung thực thì ta có thể diễn giải theo cách 1.

Nhu vậy, việc diễn giải hệ số tương quan không đơn giản và thường cần thêm các dữ liệu khác mới có thể diễn giải chính xác. Bản thân hệ số tương quan chỉ cho biết có mối quan hệ (đồng hoặc nghịch biến) giữa hai biến nào đó.

 

 

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

Information

This entry was posted on 11/11/2016 by in Nghiên cứu Khoa học.

Điều hướng

%d bloggers like this: