Trong các tập san y học, chúng ta thường thấy những cột số dưới hình thức x ± y, trong đó x là số trung bình, còn y thì có khi là độ lệch chuẩn (standard deviation – SD) hay sai số chuẩn (standard error – SE). Cũng có tác giả viết SEM (viết tắt từ cụm từ standard error of the mean). Cách trình bày như thế thông dụng đến nỗi một số chuyên gia và các ban biên tập tập san y học phải lên tiếng khuyến cáo. Theo khuyến cáo. | Lâm sàng thống kê Độ lệch chuẩn hay sai số chuẩn? Nguyễn Văn Tuấn Trong vài năm qua, tôi nhận khá nhiều email hỏi về những vấn đề căn bản trong thống kê sinh học và phương pháp dịch tễ học. Tôi có ý định mở mục Lâm sàng thống kê (Statistical Clinic) để trao đổi với bạn đọc về các vấn đề mà tôi thấy quan trọng này. Tôi hân hoan chào đón các câu hỏi của bạn đọc để có cảm hứng trả lời. Trong hàng trăm thư hỏi và tham vấn trong thời gian 3 năm qua, tôi đếm có đến 5 thư hỏi về vấn đề mà tôi lấy làm tựa đề cho bài viết này. Chẳng hạn như một bạn đọc ở Hà Nội viết email đến tôi hỏi: “Thưa thầy! Em đọc thấy trong các tập san y học người ta thường hay trình bày số trung bình kèm theo SEM, nhưng cũng có bài báo trình bày số trung bình kèm theo SD. Xin hỏi Thầy cách trình bày nào đúng?” Đây là một câu hỏi đơn giản nhưng tôi thấy có ý nghĩa ứng dụng khá rộng, nên muốn nhân cột báo Lâm sàng thống kê để trả lời bạn đọc. *** Trong các tập san y học, chúng ta thường thấy những cột số dưới hình thức x ± y, trong đó x là số trung bình, còn y thì có khi là độ lệch chuẩn (standard deviation – SD) hay sai số chuẩn (standard error – SE). Cũng có tác giả viết SEM (viết tắt từ cụm từ standard error of the mean). Cách trình bày như thế thông dụng đến nỗi một số chuyên gia và các ban biên tập tập san y học phải lên tiếng khuyến cáo. Theo khuyến cáo chung và cũng là qui ước nghiên cứu y học: để mô tả một biến số lâm sàng tuân theo luật phân phối chuẩn, các nhà nghiên cứu nên cách trình bày số trung bình và kèm độ lệch chuẩn (không phải sai số chuẩn; để mô tả một biến số lâm sàng không tuân theo luật phân phối chuẩn, nên trình bày số trung vị và số ở vị trí 25% và 75% (tức là interquartile range). Để hiểu qui ước này, chúng ta cần phải tìm hiểu ý nghĩa của độ lệch chuẩn và sai số chuẩn. Tôi thấy điều này cần thiết, bởi vì hầu hết sách giáo khoa thống kê (ngay cả sách giáo khoa do người Tây phương viết) đều không giải rõ những khác biệt về ý nghĩa của hai chỉ số thống kê này. Mô tả một biến số