Bài giảng Bài 3: Tóm tắt dữ liệu trình bày về thống kê, các cách thức tóm tắt và trình bày dữ liệu, định lý Chebyshev và quy tắc thực nghiệm. Bài giảng phục vụ cho các bạn chuyên ngành Toán học và những bạn quan tâm tới lĩnh vực này. | BÀI 3: TÓM TẮT DỮ LIỆU Thống kê Chúng ta thường đặt ra câu hỏi Thu thập dữ liệu như thế nào? Sau khi thu thập dữ liệu làm sao chúng ta có thể trình bày tập dữ liệu dưới một hình thức rõ ràng, có thể hiểu được, và dễ đọc? Chúng hỗ trợ gì cho việc ra quyết định? Thống kê là một khoa học & nghệ thuật về Thu thập Phân tích Trình bày Diễn giải dữ liệu Các cách thức tóm tắt và trình bày dữ liệu Bảng tần số Các tham số thống kê mô tả đo lường khuynh hướng trung tâm (Central Tendency) Mean Median Mode đo lường mức độ phân tán (Dispersion) hay độ biến thiên (variability) Min, Max, Range Standard Deviation Variance SE of mean Các thước đo về vị trí tương đối (measure of relative standing), hay giá trị phân vị (percentile values) Quartiles Percentile Các chỉ tiêu cho biến hình dạng phân phối (distribution) Skewness Kurtosis Bảng kết hợp Đồ thị ( Đồ thị hình tròn, Đồ thị thanh, Line, Histogram ) Bảng tần số Các tham số thống kê mô tả Phân phối lệch phải (Skewed right Distribution) Phân phối lệch phải khi µ > Me > Mo Phân phối lệch trái (Skewed left Distribution) Phân phối lệch trái khi µ Bảng kết hợp (Định tính) Bảng kết hợp (Định lượng) Đồ thị Tục ngữ: “một bức họa đáng giá cả ngàn từ” Đồ thị Định lý Chebyshev và quy tắc thực nghiệm Định lý Chebyshev: Với bất kỳ tập dữ liệu nào (mẫu, hay tổng thể) Ít nhất giá trị nằm trong khoảng +/- độ lệch chuẩn so với giá trị trung bình Ít nhất 75% giá trị nằm trong khoảng +/- 2 độ lệch chuẩn so với giá trị trung bình Ít nhất giá trị nằm trong khoảng +/- 3 độ lệch chuẩn so với giá trị trung bình Ít nhất (1-1/k^2)100% giá trị nằm trong khoảng +/- k độ lệch chuẩn so với giá trị trung bình, với k>1 Quy tắc thực nghiệm: Với một tổng thể có phân phối đối xứng có dạng hình chuông, ta có quy tắc sau đây Xấp xỉ 68% giá trị của các quan sát nằm trong khoảng +/- 1 độ lệch chuẩn so với giá trị trung bình Xấp xỉ 95% giá trị của các quan sát nằm trong khoảng +/- 2 độ lệch chuẩn so với giá trị trung bình Xấp xỉ 99% giá trị của các quan sát nằm trong khoảng +/- 3 độ lệch chuẩn so với giá trị trung bình | BÀI 3: TÓM TẮT DỮ LIỆU Thống kê Chúng ta thường đặt ra câu hỏi Thu thập dữ liệu như thế nào? Sau khi thu thập dữ liệu làm sao chúng ta có thể trình bày tập dữ liệu dưới một hình thức rõ ràng, có thể hiểu được, và dễ đọc? Chúng hỗ trợ gì cho việc ra quyết định? Thống kê là một khoa học & nghệ thuật về Thu thập Phân tích Trình bày Diễn giải dữ liệu Các cách thức tóm tắt và trình bày dữ liệu Bảng tần số Các tham số thống kê mô tả đo lường khuynh hướng trung tâm (Central Tendency) Mean Median Mode đo lường mức độ phân tán (Dispersion) hay độ biến thiên (variability) Min, Max, Range Standard Deviation Variance SE of mean Các thước đo về vị trí tương đối (measure of relative standing), hay giá trị phân vị (percentile values) Quartiles Percentile Các chỉ tiêu cho biến hình dạng phân phối (distribution) Skewness Kurtosis Bảng kết hợp Đồ thị ( Đồ thị hình tròn, Đồ thị thanh, Line, Histogram ) Bảng tần số Các tham số thống kê mô tả Phân phối lệch phải (Skewed .