Phân tích hồi qui tuyến tính (linear regression analysis) có lẽ là một trong những phương pháp phân tích số liệu thông dụng nhất trong thống kê học. Có người từng viết “Cho con người 3 vũ khí – hệ số tương quan, hồi qui tuyến tính và một cây bút, con người sẽ sử dụng cả ba”! Trong chương này, tôi sẽ giới thiệu cách sử dụng R để phân tích hồi qui tuyến tính và các phương pháp liên quan như hệ số tương quan và kiểm định giả thiết thống kê. . | Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R 10 Phân tích hồi qui tuyến tính Phân tích hồi qui tuyến tính linear regression analysis có lẽ là một trong những phương pháp phân tích số liệu thông dụng nhất trong thống kê học. Có người từng viết Cho con người 3 vũ khí - hệ số tương quan hồi qui tuyến tính và một cây bút con người sẽ sử dụng cả ba Trong chương này tôi sẽ giới thiệu cách sử dụng R để phân tích hồi qui tuyến tính và các phương pháp liên quan như hệ số tương quan và kiểm định giả thiết thống kê. Ví dụ 1. Để minh họa cho vấn đề chúng ta thử xem xét nghiên cứu sau đây mà trong đó nhà nghiên cứu đo lường độ cholestrol trong máu của 18 đối tượng nam. Tỉ trọng cơ thể body mass index cũng được ước tính cho mỗi đối tượng bằng công thức tính BMI là lấy trọng lượng tính bằng kg chia cho chiều cao bình phương m2 . Kết quả đo lường như sau Bảng 1. Độ tuổi tỉ trọng cơ thể và cholesterol Mã số ID id Độ tuổi age BMI bmi Cholesterol choi 1 46 2 20 3 52 4 30 5 57 Ể 25 7 28 8 36 9 22 lũ 43 11 57 12 33 13 22 Nhìn sơ qua số liệu chúng ta thấy người có độ tuổi càng cao độ cholesterol cũng càng cao. Chúng ta thử nhập số liệu này vào R và vẽ một biểu đồ tán xạ như sau age - c 46 20 52 30 57 25 28 36 22 43 57 33 22 63 40 48 28 49 bmi -c chol - c data - age bmi chol plot chol age pch 16