Để khắc phục hạn chế này, nhiều nhà nghiên cứu đã sử dụng máy ảnh để hỗ trợ đọc môi, thu thập cảnh quay video của mọi người. Thế nhưng, điều này có thể vi phạm về quyền riêng tư cá nhân vì chưa được sự đồng ý rõ ràng của người đối diện tham gia giao tiếp, đồng thời máy ảnh cũng không thể đọc môi khi người đối diện đeo khẩu trang. Mới đây, nhóm nghiên cứu của GS Muhammad Imran tại Đại học Glasgow (Anh) đã nghiên cứu công nghệ cảm biến tần số vô tuyến kết hợp với trí tuệ nhân tạo để phát triển một hệ thống trợ thính mới có khả năng đọc môi với độ chính xác cao, ngay cả khi người nói đeo khẩu trang. Hệ thống này thu thập các dữ liệu bằng cảm biến tần số vô tuyến.
Để phát triển hệ thống này, nhóm nghiên cứu đã yêu cầu các tình nguyện viên nam và nữ lặp lại 5 nguyên âm (A, E, I, O và U) trước và sau khi đeo mặt nạ. Khi các tình nguyện viên lặp lại các nguyên âm, khuôn mặt của họ được quét bằng tín hiệu tần số vô tuyến từ cảm biến radar chuyên dụng và bộ phát wifi. Khuôn mặt của họ cũng được quét trong khi đôi môi của họ vẫn giữ nguyên. Sau đó, các mẫu dữ liệu thu thập được trong quá trình quét được sử dụng để truyền đạt các thuật toán học máy và học sâu cách nhận ra các chuyển động môi và miệng, đặc trưng liên quan đến từng nguyên âm.
Nhóm nghiên cứu cho biết, hệ thống trợ thính này có khả năng đọc chính xác môi của các tình nguyện viên ngay cả khi họ đeo khẩu trang. Máy trợ thính này được thương mại hóa sẽ mang lại những lợi ích thiết thực cho nhiều người khiếm thính, cải thiện đáng kể chất lượng cuộc sống của họ.
Mai Văn Thủy (theo techxplore.com)