Thị giác máy tính và các ứng dụng điển hình
Thị giác máy tính (Computer vision) là thiết bị quang học và máy móc sử dụng công nghệ có thể thu nhận và phân tích các dữ liệu trực quan sau đó sẽ tiến hành phân tích để đưa ra các quyết định về nó. Nói cách khác, đây là một công nghệ thuộc lĩnh vực AI và khoa học máy tính có thể thiết lập cho máy móc có khả năng quan sát thu thập dữ liệu, sau đó tiến hành xử lý và nhận dạng như con người. Ngày nay, dưới sự bùng nổ của các ngành khoa học và công nghệ nó đã được ứng dụng rộng rãi trên tất cả các lĩnh vực của đời sống xã hội, điển hình như:
Trong lĩnh vực sản xuất công nghiệp
Sử dụng thị giác máy tính để phát hiện ra lỗi của sản phẩm trong dây chuyền sản xuất tự động, từ đầu đến khi hoàn thiện sản phẩm trước khi đưa ra thị trường. Thay cho việc phát hiện ra các yếu tố bị lỗi thường được tiến hành bởi những người giám sát và kiểm tra sản phẩm, họ không thể nào kiểm soát được toàn bộ cả một dây chuyền tự động của hệ thống được. Với thị giác máy tính, chúng ta có thể kiểm tra tất cả các lỗi nhỏ nhất, từ vết nứt kim loại, lỗi sơn, bản in xấu, có kích thước nhỏ hơn 0,05 mm. Việc xử lý này nhanh và tốt hơn mắt thường của con người gấp nhiều lần.
Trong lĩnh vực giao thông vận tải
Được phát triển nhờ trí tuệ nhân tạo, thị giác máy tính là công nghệ nhận diện thông minh của máy tính được tạo ra để bắt chước con người trong việc nhìn và hiểu hình ảnh.
Thị giác máy tính bao gồm các hoạt động thu nhận, xử lý ảnh kỹ thuật số, phân tích, nhận dạng và hình thành các hình ảnh dữ liệu đa chiều từ thế giới thực để cho ra các thông tin số hoặc biểu tượng. Tại Việt Nam, thị giác máy tính thông minh được ứng dụng trong giao thông đường bộ chính thức vào năm 2015 tại các thành phố lớn và đến năm 2019, công nghệ này đã được phố biến rộng khắp trên hầu hết các tuyến đường của nước ta. Một trong những ứng dụng dễ thấy nhất của thị giác máy tính trong giao thông tại Việt Nam là hình thức “phạt nguội”, khi mà cảnh sát giao thông sẽ nhận diện và kiểm soát các phương tiện vi phạm bằng phần mềm máy tính và camera, từ đó trích xuất dữ liệu và gửi giấy phạt về nơi cư trú của người điều khiển phương tiện. Bằng phương pháp này, lực lượng chức năng vẫn có thể đảm bảo an ninh trật tự, an toàn giao thông mà không cần trực tiếp ra đường theo dõi hay bỏ sót trường hợp vi phạm nào. Ngoài ra, tại các bãi đỗ xe của trung tâm thương mại, thị giác máy tính được ứng dụng trong công nghệ hỗ trợ đếm lưu lượng xe, từ đó tính ra chỗ trống đỗ xe, công nghệ nhận diện biển số và gương mặt tài xế để đảm bảo an ninh.
Trong lĩnh vực an ninh - quốc phòng
Nhận diện khuôn mặt lập bản đồ và lưu trữ danh tính kỹ thuật số nhờ vào các thuật toán học sâu. Loại nhận dạng sinh trắc học này có thể được so sánh với các công nghệ nhận dạng giọng nói, mống mắt hoặc dấu vân tay hiện đang rất phổ biến.
Việc sử dụng rộng rãi và đa dạng thị giác máy tính cũng áp dụng cho các lĩnh vực an ninh. Máy bay không người lái có thể tận dụng các hệ thống thị giác máy tính để tăng cường khả năng phát hiện của con người trong việc phát hiện cháy rừng, sử dụng hình ảnh hồng ngoại (IR) như một phần của các giao thức giám sát cháy rừng. Các thuật toán nâng cao phân tích các đặc điểm hình ảnh video như chuyển động hoặc độ sáng để phát hiện lửa. Hệ thống đang thực hiện các trích xuất được nhắm mục tiêu để phát hiện dễ dàng các mẫu và tính toán cách để thấy sự khác biệt giữa các đám cháy và chuyển động thực tế có thể bị hiểu nhầm là hỏa hoạn.
Máy bay không người lái cũng có thể cải thiện an ninh và hiệu quả của hoạt động cứu hỏa bằng cách giám sát hoặc nghiên cứu các khu vực nguy hiểm. Nhân viên cứu hỏa có thể chạy các phân tích dựa trên thuật toán tiên tiến để kiểm tra khói và lửa, từ đó đánh giá rủi ro và đưa ra dự đoán về sự lan truyền lửa.
Trong lĩnh vực y tế
Những tiến bộ lớn liên tục xuất hiện trong các lĩnh vực nhận dạng mẫu và xử lý hình ảnh; đồng thời không có gì đáng ngạc nhiên khi cộng đồng y tế và các chuyên gia trong lĩnh vực chăm sóc sức khỏe cho rằng hình ảnh y khoa (kỹ thuật tạo hình ảnh trực quan về bên trong của cơ thể để phân tích lâm sàng và can thiệp y tế, cũng như biểu thị trực quan chức năng của một số cơ quan hoặc mô sinh lý học) đã trở thành một phần thiết yếu trong cách thức làm việc của họ, hướng đến các công cụ chẩn đoán tốt hơn và tăng đáng kể khả năng đưa ra các hành động hiệu quả hơn. Phân tích hình ảnh y khoa là một trợ giúp lớn cho phân tích dự đoán và trị liệu. Ví dụ, thị giác máy tính được áp dụng cho hình ảnh nội soi có thể làm tăng mức độ hợp lệ và đáng tin cậy của dữ liệu để giảm tỷ lệ tử vong liên quan đến ung thư đại trực tràng…
Trong lĩnh vực ngân hàng
Khi nói đến việc liên kết các công nghệ AI với ngân hàng, chúng ta chủ yếu nghĩ đến việc phát hiện gian lận. Mặc dù đó là một lĩnh vực tập trung đặc biệt cho công nghệ tiên tiến trong lĩnh vực này, thị giác máy tính có thể cải tiến nhiều thứ hơn nữa. Các ứng dụng nhận dạng hình ảnh sử dụng học máy để phân loại và trích xuất dữ liệu phục vụ cho việc giám sát quá trình xác thực các tài liệu như thẻ căn cước hoặc giấy phép lái xe có thể được sử dụng để cải thiện trải nghiệm của khách hàng từ xa và tăng cường bảo mật…
Trong lĩnh vực nông nghiệp
Công nghệ thị giác máy tính kết hợp với công nghệ thông minh như công nghệ học sâu đã được ứng dụng vào mọi khía cạnh của quản lý sản xuất nông nghiệp dựa trên bộ dữ liệu quy mô lớn, được sử dụng rộng rãi hơn để giải quyết các vấn đề nông nghiệp hiện nay, giúp cải thiện tốt hơn hiệu suất kinh tế. Sự mạnh mẽ của các hệ thống tự động hóa nông nghiệp đã thúc đẩy sự phát triển của các thiết bị và hệ thống tự động hóa nông nghiệp theo hướng thông minh hơn…
Tương lai của thị giác máy tính
Số liệu nghiên cứu cho thấy, đến năm 2023, thị trường thị giác máy tín toàn cầu dự kiến sẽ đạt 12,29 tỷ USD. Các động lực chính của sự tăng trưởng trong thị trường thị giác máy là nhu cầu kiểm tra chất lượng và tự động hóa bên trong các nhà máy. Nhu cầu ngày càng tăng đối với các hệ thống tích hợp AI và IoT phụ thuộc vào thị giác máy để cải thiện năng suất của rô bốt tự động hóa và các sáng kiến của chính phủ để hỗ trợ các nhà máy thông minh trên toàn cầu. Những năm gần đây, thị giác máy tính đang có một bước phát triển rõ rệt trong kỷ nguyên của cuộc cách mạng công nghiệp lần thứ 4. Với việc kết hợp với các dữ liệu từ máy tính học sâu thu thập được từ hoạt động sản xuất hàng ngày, thị giác máy tính hoàn toàn có những tiềm năng trở thành trợ thủ đắc lực của các nhà sản xuất, cung cấp sự hỗ trợ về mọi mặt trong nhà máy. Với tiềm năng phát triển không ngừng, thị giác máy tính kết hợp máy tính học sâu hoàn toàn có thể là tiền đề cho sự bùng nổ của trí tuệ nhân tạo mô phỏng tinh vi chính bộ não con người trong tương lai không xa. Tuy nhiên, nó cũng luôn là bài toán thách thức đối với các hệ thống mạng máy tính. Sử dụng mô hình học sâu và sức mạnh của các thuật toán học máy ngày càng lớn mạnh là nguyên nhân của những mối lo ngại liên tục gia tăng và những cuộc tấn công của tin tặc. Điều đó có nghĩa là mọi người sử dụng phải luôn có trách nhiệm và thị giác máy tính cần phải được giám sát bởi tất cả chúng ta trên toàn thế giới.
Có thể khẳng định, thị giác máy đang ngày càng khẳng định vị thế không thể thiếu của mình trong sự phát triển chung của xã hội. Trong tương lai không xa, đây sẽ là ứng dụng tiên phong, mở ra kỷ nguyên phát triển mới cho con người - kỷ nguyên của AI.
TÀI LIỆU THAM KHẢO
[1] www.ibm.com.
[2] Isikdogan, Leo (2018), "Computer Vision vs Image Processing", YouTube, September 15. Accessed 2019-05-28.
[3] Seif, George (2018), "How to do everything in Computer Vision", Towards Data Science, via Medium, December 13, Accessed 2019-05-28.