Trong chương này, chúng ta sẽ sử dụng R cho mục đích phân tích thống kê mô tả. Nói đến thống kê mô tả là nói đến việc mô tả dữ liệu bằng các phép tính và chỉ số thống kê thông thường mà chúng ta đã làm quen qua từ thuở trung học như số trung bình (mean), số trung vị (median), phương sai (variance) độ lệch chuẩn (standard deviation) cho các biến số liên tục, và tỉ số (proportion) cho các biến số không liên tục. Nhưng trước khi hướng dẫn phân tích thống kê mô tả,. | Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R 9 Phân tích thống kê mô tả Trong chương này chúng ta sẽ sử dụng R cho mục đích phân tích thống kê mô tả. Nói đến thống kê mô tả là nói đến việc mô tả dữ liệu bằng các phép tính và chỉ số thống kê thông thường mà chúng ta đã làm quen qua từ thuở trung học như số trung bình mean số trung vị median phương sai variance độ lệch chuẩn standard deviation . cho các biến số liên tục và tỉ số proportion cho các biến số không liên tục. Nhưng trước khi hướng dẫn phân tích thống kê mô tả bạn đọc nên phân biệt hai khái niệm tổng thể population và mẫu sample . Khái niệm tổng thể population và mẫu sample Có thể nói mục tiêu của nghiên cứu khoa học thực nghiệm là nhằm tìm hiểu và khám phá những cái chưa được biết unknown trong đó bao gồm những qui luật hoạt động của tự nhiên. Để khám phá chúng ta sử dụng đến các phương pháp phân loại so sánh và phỏng đoán. Tất cả các phương pháp khoa học kể cả thống kê học được phát triển nhằm vào ba mục tiêu trên. Để phân loại chúng ta phải đo lường một yếu tố hay tiêu chí có liên quan đến vấn đề cần nghiên cứu. Để so sánh và phỏng đoán chúng ta cần đến các phương pháp kiểm định giả thiết và mô hình thống kê học. Cũng như bất cứ mô hình nào mô hình thống kê phải có thông số. Và muốn có thông số chúng ta trước hết phải tiến hành đo lường và sau đó là ước tính thông số từ đo lường. Chẳng hạn như để biết sinh viên nữ có chỉ số thông minh IQ bằng sinh viên nam hay không chúng ta có thể làm nghiên cứu theo hai phương án a. Một là lập danh sánh tất cả sinh viên nam và nữ trên toàn quốc rồi đo lường chỉ số IQ ở từng người và sau đó so sánh giữa hai nhóm b. Hai là chọn ngẫu nhiên một mẫu gồm n nam và m nữ sinh viên rồi đo lường chỉ số IQ ở từng người và sau đó so sánh giữa hai nhóm. Phương án a rất tốn kém và có thể nói là không thực tế vì chúng ta phải tập hợp tất cả sinh viên của cả nước một việc làm rất khó thực hiện được. Nhưng nếu chúng ta có thể làm được thì phương án này không cần đến thống kê .