Improved OCR quality for smart scanned document management system