Ra mắt DeepSeek V4 - Mô hình AI có chi phí thấp nhất thế giới
Ngày 24/4, DeepSeek vừa chính thức ra mắt mô hình trí tuệ nhân tạo thế hệ tiếp theo mang tên V4, sau thời gian dài được mong đợi. Theo tuyên bố của hãng, đây là mô hình mã nguồn mở có khả năng cạnh tranh trực tiếp với các hệ thống mã nguồn đóng hàng đầu đến từ OpenAI và Google DeepMind.

DeepSeek V4 có hai phiên bản được phát hành, bao gồm V4-Pro và V4-Flash. Trong đó, V4-Pro sở hữu tới 1.600 tỷ tham số - trở thành mô hình lớn nhất từ trước đến nay của startup có trụ sở tại Hàng Châu. Phiên bản nhỏ hơn, V4-Flash, có 284 tỷ tham số.
Cả hai đều được cung cấp cửa sổ ngữ cảnh lên tới 1 triệu token, cho phép xử lý lượng thông tin lớn, đồng thời có chi phí được DeepSeek mô tả là “thấp nhất thế giới”.
Mỗi phiên bản được tối ưu cho những mục đích khác nhau, đồng thời đều hướng tới khả năng vận hành trên chip nội địa. Điều này phản ánh xu hướng rõ rệt của các công ty AI Trung Quốc trong việc giảm phụ thuộc vào công nghệ nước ngoài.
V4-Pro: Hiệu năng tiệm cận các mô hình hàng đầu thế giới
DeepSeek cho biết V4-Pro có những cải tiến đáng kể về năng lực “Agent” - khả năng tự động thực hiện các tác vụ phức tạp. Trong các bài đánh giá lập trình theo hướng agentic, V4-Pro đạt mức cao nhất trong nhóm mã nguồn mở và thể hiện xuất sắc ở nhiều tiêu chí liên quan.
Đáng chú ý, mô hình này hiện đã được sử dụng nội bộ tại DeepSeek. Theo phản hồi đánh giá, trải nghiệm người dùng vượt qua Sonnet 4.5, trong khi chất lượng đầu ra ở chế độ không suy luận tiệm cận Opus 4.6, dù vẫn còn khoảng cách nhất định khi xử lý các tác vụ đòi hỏi suy luận sâu.
Về tri thức thế giới, V4-Pro vượt trội so với các mô hình mã nguồn mở khác và chỉ xếp sau một chút so với các hệ thống mã nguồn đóng hàng đầu như Gemini-Pro-3.1. Trong các bài kiểm tra về toán học, STEM và lập trình cấp độ thi đấu, mô hình này đạt hiệu năng ngang tầm các mô hình AI hàng đầu thế giới.
V4-Flash: Nhanh hơn, tiết kiệm hơn
Phiên bản V4-Flash được định vị là lựa chọn tối ưu về tốc độ và chi phí. Dù kém hơn đôi chút về tri thức so với V4-Pro, mô hình này vẫn duy trì năng lực suy luận gần tương đương. Nhờ số lượng tham số và kích hoạt nhỏ hơn, V4-Flash cung cấp dịch vụ API nhanh hơn và tiết kiệm hơn.
Trong các bài đánh giá về Agent, V4-Flash cho kết quả tương đương V4-Pro ở các tác vụ đơn giản, nhưng vẫn còn hạn chế khi xử lý những nhiệm vụ phức tạp.
Việc DeepSeek tung ra phiên bản V4 cho thấy cuộc cạnh tranh trong lĩnh vực AI ngày càng khốc liệt, đặc biệt khi các mô hình mã nguồn mở đang dần thu hẹp khoảng cách với những hệ thống độc quyền hàng đầu thế giới./.