Lịch sử khai phá dữ liệu

Bạn đọc chắc hẳn là một người rất thích thú với lĩnh vực ứng dụng khai phá dữ liệu vào thực tiễn. Nếu không thì bạn đã chẳng đọc cuốn sách này. Chúng ta đều biết hiện nay có rất nhiều cuốn sách viết về quá trình khai phá dữ liệu. Hầu hết các tài liệu này đều tập trung trình bày những đặc điểm, chức năng của các công cụ và giải thuật khai phá dữ liệu khác nhau. | Các kỹ thuật hồi quy logistic có thể tính toán cho sự kết hợp tác động qua lại giữa các yếu tố dự báo bởi hiệu quả của các chức năng vô tuyến mà xác định các biến thiên độc lập (Y). Tuy nhiên, vẫn còn nhiều hạn chế đáng kể cho các máy tuyến tính ( xem Minsky và Papert, 1969). Ngay cả hệ thống neuron và các cây quyết định cũng gặp vấn đề đó. 1 cách để thể hiện hạn chế là nhìn chúng theo “ giả thuyết không gian”. Giả thuyết không gian là xây dựng trong vòng 1 giải pháp được tìm thấy. Tuy nhiên các giải pháp có thể được ràng buộc cao hơn bởi các chức năng tuyến tính trong học thuyết thống kê cổ điển và các kỹ thuật học máy. Sự phức tạp vấn đề trong thế giới thật có thể yêu cầu nhiều học thuyến không gian mà có thể được cung cấp bởi các chức năng tuyến tính để diễn đạt rõ hơn ( Cristianini và Shawe-Taylor, 2000). Mạng lưới đa lớp neuron có thể chiếm nhiều hơn của các hiệu ứng vô tuyến bởi các hiệu quả nhà kỹ thuật mạng và kỹ nghệ giảm thiểu lỗi, ví dụ là sự lan truyền trở lại. Một cách giải quyết khác là sắp xếp các điểm dữ liệu vào các vectors ( như các hàng trong 1 mục lưu trữ khách hàng) . Rất nhiều vectors được tạo ra từ nhiều yếu tố ( một cho mỗi thuộc tính trong lưu trữ khách hàng). Vector không gian của các hàng dữ liệu khách hàng trong 1 database có thể được đặc điểm hóa , thuộc về nhận thức và toán học như là 1 không gian với N-thứ nguyên, mà N là số của thuộc tính khách hàng( các biến có thể dự đóan trước). Khi bạn xem dữ liệu của 1 lưu trữ khách hàng như 1 vector, bạn có thể tận dung khái niệm đại số tuyến tính, một trong các cách đó là bạn có thể biểu diễn trên các sự khác nhau giữa các thuộc tính của 2 lưu trữ khách hàng bằng cách tính dấu chấm sản phẩm ( hoặc sản phẩm bên trong)

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
272    24    1    02-12-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.