Bài giảng "Xác xuất thống kê (Phần 2: Lý thuyết thống kê) - Chương 8: Bài toán tương quan và hồi quy" cung cấp cho người học các kiến thức: Hệ số tương quan mẫu, sử dụng máy tính bỏ túi tìm đường hồi quy. . | Chương 8. Bài toán tương quan & Hồi quy 1. HỆ SỐ TƯƠNG QUAN MẪU . Định nghĩa • Hệ số tương quan mẫu r là số đo mức độ phụ thuộc tuyến tính giữa hai mẫu ngẫu nhiên cùng cỡ X và Y . • Giả sử ta có mẫu ngẫu nhiên cỡ n về vector ngẫu nhiên (X , Y ) là (xi , yi ); i 1; 2;.; n . Khi đó, hệ số tương quan mẫu r được tính theo công thức: r xy x .y ; xy ˆ ˆ sx .sy 1 n n i 1 x i yi . Chương 8. Bài toán tương quan & Hồi quy . Tính chất 1) 1 r 1. 2) Nếu r 0 thì X , Y không có quan hệ tuyến tính; Nếu r 1 thì X , Y có quan hệ tuyến tính tuyệt đối. 3) Nếu r 0 thì quan hệ giữa X , Y là giảm biến. 4) Nếu r 0 thì quan hệ giữa X , Y là đồng biến. VD 1. Kết quả đo lường độ cholesterol (Y) có trong máu của 10 đối tượng nam ở độ tuổi (X) như sau: X 20 52 30 57 28 43 57 63 40 49 Y 1,9 4,0 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4,0 Tính hệ số tương quan mẫu giữa X và Y . Chương 8. Bài toán tương quan & Hồi quy Giải. Từ số liệu ở bảng trên, ta tính được: 20 1, 9 . 49 4, 0 xy 167, 26 ; 10 n 1 ˆ x xi 43, 9 ; sx 13, 5385 ; ni 1 y 1 n n i 1 Vậy r yi ˆ 3, 56 ; sy xy x .y ˆ ˆ sx .sy 0, 8333 . 0, 9729 . Chương 8. Bài toán tương quan & Hồi quy 2. Đường hồi quy trung bình tuyến tính thực nghiệm • Từ mẫu thực nghiệm về vector ngẫu nhiên (X , Y ), ta biễu diễn các cặp điểm (xi , yi ) lên mpOxy . Khi đó, đường cong nối các điểm là đường cong phụ thuộc của Y theo X mà ta cần tìm (xem hình a), b)). Chương 8. Bài toán tương quan & Hồi quy Hình b Hình a • Đường thẳng là đường hồi quy thực nghiệm xấp xỉ tốt nhất các điểm mẫu đã cho, cũng là xấp xỉ đường cong cần tìm. Trong hình a) ta thấy xấp xỉ tốt (phụ thuộc tuyến tính chặt), hình b) xấp xỉ không .