Hình học Fractal đã mở ra một hướng đi hoàn toàn mới về cách mô tả toán học cho các đối tượng phức tạp trong tự nhiên, trong bài báo này Fractal được ứng dụng vào việc mô tả cho các vùng văn bản hay đồ họa trong một ảnh tài liệu từ đó tìm ra được đặc trưng Fractal của nó để nhận dạng. Bài báo trình bày giải pháp sử dụng Fractal phân tích ảnh tài liệu đa cấp xám có nhiễu. | Nguyễn Văn Huy Tạp chí KHOA HỌC & CÔNG NGHỆ 61(12/2): 74 - 77 ỨNG DỤNG FRACTAL TRONG PHÂN TÍCH ẢNH TÀI LIỆU ĐA CẤP XÁM CÓ NHIỄU Nguyễn Văn Huy* Đại học Kỹ thuật công nghiệp - Đại học Thái Nguyên TÓM TẮT Hình học Fractal đã mở ra một hướng đi hoàn toàn mới về cách mô tả toán học cho các đối tượng phức tạp trong tự nhiên, trong bài báo này Fractal được ứng dụng vào việc mô tả cho các vùng văn bản hay đồ họa trong một ảnh tài liệu từ đó tìm ra được đặc trưng Fractal của nó để nhận dạng. Bài báo trình bày giải pháp sử dụng Fractal phân tích ảnh tài liệu đa cấp xám có nhiễu. Từ khóa: Hình học Fractal, Phân tích trang tài liệu, Phân tích cấu trúc hình học, top-down, bottom-up. MỞ ĐẦU Đã có nhiều thuật toán phân tích tài liệu như Top-down, Bottom-Up, Tuy nhiên tất cả chúng đều tồn tại những nhược điểm chính như sau: - Tốc độ thực hiện phụ thuộc vào độ phức tạp của ảnh - Kém hiệu quả với loại tài liệu có cấu trúc phức tạp - Kém hiệu quả với ảnh đa cấp xám - Kém hiệu quả với ảnh có nhiễu - Không thể làm việc với ảnh bị nghiêng, hay lại tài liệu có font chữ nghiêng hoặc có nhiều loại font chữ khác nhau Phương pháp Fractal Signature giải quyết tối đa các nhược điểm mà các phương pháp trên gặp phải và mục tiêu của bài báo này đi cài đặt phương pháp Fractal Signature nhằm phân tách vùng ảnh, vùng nền, vùng văn bản trên ảnh tài liệu đa cấp xám có cấu trúc phức tạp và tồn tại nhiễu. Cơ sở của thuật toán Fractal Ý tưởng chính của thuật toán chia trang tài liệu A thành các vùng có kích thước bằng nhau Bk (k=1,,n) sao cho Bk Є A. Sau đó tính FS cho mỗi vùng này, theo lý thuyết FS thì nếu có 3 vùng B1(giả thiết là vùng nền), B2(giả thiết là vùng chữ), B3(giả thiết là vùng đồ họa) thì luôn có FS(B1)