Thứ hai, 09/06/2025 11:09

OCR từ cổ điển đến hiện tại - Hành trình phát triển trong kỷ nguyên AI

Đây là chủ đề của Tọa đàm chuyên đề do Trường Công nghệ Thông tin và Truyền thông (Trường Đại học Công nghiệp Hà Nội) tổ chức, thu hút sự quan tâm của đông đảo giảng viên, nhà nghiên cứu và sinh viên ngành khoa học máy tính, trí tuệ nhân tạo (AI) và thị giác máy tính.

TS Đặng Trọng Hợp - Hiệu trưởng Trường Công nghệ Thông tin và Truyền thông cho biết, nhận dạng ký tự quang học (OCR - Optical character recognition) là một trong những ứng dụng đầu tiên và quan trọng nhất của thị giác máy tính, cho phép máy tính "đọc hiểu" nội dung văn bản, từ hình ảnh hoặc tài liệu được quét.

TS Đặng Trọng Hợp - Hiệu trưởng Trường Công nghệ Thông tin và Truyền thông phát biểu tại Tọa đàm.

Trước đây, phương pháp OCR cổ điển dựa trên đặc trưng thủ công và các thuật toán thống kê, nhưng trong kỷ nguyên AI hiện nay, việc xuất hiện của các mô hình học sâu, đặc biệt là các mạng nơ-ron tích chập, mạng hồi tiếp… đã mang đến bước đột phá trong việc xử lý dữ liệu ảnh và chuỗi ký tự. Hệ thống OCR hiện đại không chỉ có khả năng nhận dạng chữ in, chữ viết tay với độ chính xác cao, mà còn hiểu được cấu trúc và ngữ cảnh của tài liệu. Đặc biệt, kiến trúc tiên tiến nhất hiện nay là Vision Transformer (ViT) - một xu hướng đang chiếm lĩnh lĩnh vực thị giác máy tính. Với khả năng học ngữ cảnh sâu và biểu diễn toàn cục, ViT đã giúp OCR mở rộng phạm vi ứng dụng sang các loại tài liệu phức tạp, văn bản không theo cấu trúc và môi trường nhiễu loạn.

Tọa đàm: “OCR từ cổ điển đến hiện tại - Hành trình phát triển trong kỷ nguyên AI” không chỉ mang đến cái nhìn toàn diện về quá trình phát triển của công nghệ OCR, mà còn là diễn đàn học thuật giàu giá trị, khơi dậy đam mê nghiên cứu và khám phá ứng dụng AI trong xử lý ngôn ngữ và thị giác máy tính.

XD-TC

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)