Thứ hai, 17/03/2025 08:59

Xây dựng nền tảng trí tuệ nhân tạo tại Việt Nam với dữ liệu tiếng Việt mã nguồn mở

Trung tâm Đổi mới sáng tạo Quốc gia đang phối hợp với Tập đoàn Meta và Tổ chức AI for Việt Nam xây dựng Dự án ViGen - mô hình trí tuệ nhân tạo (AI) hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóa tiềm năng các ứng dụng AI tại Việt Nam. Việc tập trung vào dữ liệu tiếng Việt mã nguồn mở sẽ đảm bảo AI được phát triển tại Việt Nam không chỉ tiên tiến về công nghệ mà còn phù hợp với văn hóa, ngôn ngữ và nhu cầu của người dân trong nước.

Họp báo giới thiệu Dự án ViGen (nguồn: Trung tâm Đổi mới sáng tạo Quốc gia).

Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Trung tâm Đổi mới sáng tạo Quốc gia đóng vai trò là đơn vị chủ quản, điều phối và đảm bảo Dự án phù hợp với các mục tiêu quốc gia. Bên cạnh đó, AI for Vietnam là đối tác triển khai Dự án, nhận được hỗ trợ kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược khác bao gồm NVIDIA, Viettel và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo quốc gia cho biết, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết số 57-NQ/TW ngày 22/12/2024  của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu.

Dự án ViGen là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóa tiềm năng các ứng dụng AI tại Việt Nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI. Dự án cũng chú trọng đến việc đảm bảo sự phát triển AI tại Việt Nam phù hợp với các giá trị văn hóa và tiêu chuẩn đạo đức, hướng tới xây dựng một hệ sinh thái AI mã nguồn mở, phù hợp với bối cảnh địa phương và có trách nhiệm.

PT

 

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)