Vấn đề đặt ra cho các nghiên cứu dạng này là làm cách nào để ước tính độ tương quan (magnitude of association) giữa yếu tố nguy cơ và bệnh. Các phương pháp phân tích như mô hình hồi qui tuyến tính (linear regression model) không thể áp dụng được, bởi vì biến phụ thuộc (dependent variable) không phải là một biến liên tục, mà là biến nhị phân. | Phân tích hồi qui logistic Phân tích hồi qui logistic (logistic regression analysis) Nguyễn Văn Tuấn Nhiều nghiên cứu y khoa (và khoa học thực nghiệm nói chung) có mục tiêu chính là phân tích mối tương quan giữa một (hay nhiều) yếu tố nguy cơ và nguy cơ mắc bệnh. Chẳng hạn như đối với một nghiên cứu về mối tương quan giữa thói quen hút thuốc lá và ung thư phổi, thì yếu tố nguy cơ ở đây là thói quen hút thuốc lá và đối tượng phân tích là nguy cơ mắc ung thư phổi. Nói theo thuật ngữ dịch tễ học, yếu tố nguy cơ chính là risk factors, và đối tượng phân tích là outcome. Trong các nghiên cứu này, đối tượng phân tích thường được thể hiện qua các biến số nhị phân, tức là có/không, mắc bệnh/không mắc bệnh, chết/sống, xảy ra/không xảy ra, Yếu tố nguy cơ có thể là các biến số liên tục (như độ tuổi, áp suất máu, mật độ xương, ) hay các biến nhị phân (như giới tính) hay biến mang đặc tính thứ bậc (như tình trạng của bệnh dao động từ “nhẹ”, “trung bình” đến “nghiêm trọng”). Vấn đề đặt ra cho các nghiên cứu dạng này là làm cách nào để ước tính độ tương quan (magnitude of association) giữa yếu tố nguy cơ và bệnh. Các phương pháp phân tích như mô hình hồi qui tuyến tính (linear regression model) không thể áp dụng được, bởi vì biến phụ thuộc (dependent variable) không phải là một biến liên tục, mà là biến nhị phân. Vào thập niên 1970s nhà thống kê học David R. Cox phát triển một mô hình có tên là “logistic regression model” (mà tôi tạm dịch là “mô hình hồi qui logistic”) để phân tích các biến nhị phân. Tôi sẽ giải thích cách ứng dụng mô hình này qua một số ví dụ từ đơn giản đến phức tạp. Tôi sẽ không bàn đến các chi tiết toán học của mô hình hồi qui logistic, mà chỉ tập trung vào các khía cạnh thực tế và diễn dịch kết quả phân tích. I. Phân tích hồi qui logistic đơn giản cho nghiên cứu đối chứng Ví dụ 1: Nghiên cứu mối tương quan giữa phơi nhiễm chất độc da cam và ung thư tuyến tiền liệt. Giri và đồng nghiệp (2004) tiến hành