Thứ năm, 03/07/2025 16:07

Centaur: Bước tiến mới trong mô phỏng hành vi con người bằng AI

Một công cụ AI mới mang tên Centaur vừa được giới thiệu với khả năng dự đoán hành vi con người trong nhiều tình huống khác nhau, thậm chí vượt trội hơn cả các lý thuyết tâm lý học kinh điển trong việc lý giải lựa chọn của con người. Mô hình này được tinh chỉnh từ một mô hình ngôn ngữ lớn (LLM), dựa trên dữ liệu thu thập từ 160 thí nghiệm tâm lý học, với hơn 10 triệu lựa chọn được thực hiện bởi 60.000 người tham gia ở nhiều loại nhiệm vụ khác nhau. Công trình nghiên cứu phát triển Centaur được công bố trên Tạp chí Nature.

Một công cụ AI mới có khả năng mô phỏng quá trình ra quyết định của con người trong nhiều loại nhiệm vụ khác nhau (nguồn: Jezperklauzen/Getty).

Khác với các mô hình truyền thống thường chỉ tập trung vào một tác vụ cụ thể, chẳng hạn như AlphaGo của Google DeepMind chỉ chơi được cờ vây, hay lý thuyết triển vọng (prospect theory) chỉ áp dụng cho việc dự đoán lựa chọn giữa rủi ro và lợi ích. Centaur có thể mô phỏng hành vi con người trong nhiều bối cảnh đa dạng như cá cược, trò chơi trí nhớ, giải quyết vấn đề, thậm chí dự đoán chính xác hành vi trong các nhiệm vụ mà nó chưa từng được huấn luyện trước đó.

Theo đồng tác giả nghiên cứu TS Marcel Binz (Munich, Đức), hệ thống này có tiềm năng trở thành một công cụ hữu ích cho lĩnh vực khoa học nhận thức. Ông cho biết, chúng ta gần như có thể thực hiện các phiên thí nghiệm trong môi trường mô phỏng, thay vì phải cần đến người tham gia thực tế. Cách tiếp cận này đặc biệt hiệu quả trong những trường hợp mà nghiên cứu truyền thống diễn ra quá chậm hoặc khó tuyển được đối tượng phù hợp, chẳng hạn như trẻ em hoặc người mắc rối loạn tâm thần.

Centaur: AI đầu tiên mô phỏng phổ hành vi con người trong nhiều nhiệm vụ cùng lúc

Từ lâu, các nhà khoa học đã gặp khó khăn trong việc mô phỏng các khía cạnh rộng của hành vi con người bằng các mô hình chỉ dành cho một nhiệm vụ cụ thể, bởi những công cụ này không thể khái quát hóa ra nhiều loại nhiệm vụ khác nhau. Để vượt qua giới hạn của các mô hình hiện tại, TS Marcel Binz cùng cộng sự đã dành 5 ngày tinh chỉnh Llama (một mô hình ngôn ngữ lớn do Tập đoàn Meta, California, Mỹ phát triển) bằng một bộ dữ liệu hành vi khổng lồ mang tên “Psych 101”.

Không chỉ dừng lại ở việc dự đoán hành vi trung bình trong từng nhiệm vụ, nhóm nghiên cứu còn huấn luyện Centaur để tái hiện toàn bộ phổ hành vi phổ biến trong cộng đồng. Sau đó, họ kiểm tra độ chính xác của mô hình bằng cách thử nghiệm trên những người không nằm trong tập dữ liệu huấn luyện ban đầu. Kết quả cho thấy, 31/32 nhiệm vụ Centaur vượt trội so với mô hình gốc Llama và 14 mô hình nhận thức học cũng như thống kê khác trong việc dự đoán lựa chọn của con người. Nhiệm vụ duy nhất mà Centaur không đạt kết quả tốt là bài kiểm tra yêu cầu người tham gia đánh giá tính đúng ngữ pháp của các câu văn.

Không chỉ vậy, Centaur còn duy trì hiệu suất cao khi được giao các phiên bản biến đổi của những nhiệm vụ đã được huấn luyện trước, cũng như các nhiệm vụ hoàn toàn mới, như suy luận logic - những tình huống không có trong dữ liệu gốc.

Theo GS Russell Poldrack - nhà thần kinh học nhận thức tại Đại học Stanford (Mỹ), kết quả này cho thấy, hành vi con người có một cấu trúc rất rõ ràng. Điều này đặt ra một tiêu chuẩn cao hơn nhiều cho những mô hình mà ngành tâm lý học nên hướng tới.

Dù sở hữu năng lực dự đoán ấn tượng, Centaur vẫn có những hạn chế. Theo GS Russell Poldrack, mô hình chỉ xử lý các nhiệm vụ dựa trên ngôn ngữ. Điều đó có nghĩa, nó có thể dự đoán lựa chọn của con người trong một nhiệm vụ, nhưng lại không thể ước lượng thời gian mà họ cần để đưa ra lựa chọn đó. Ngoài ra, dữ liệu huấn luyện hiện tại chủ yếu đến từ các nhóm người phương Tây, có trình độ học vấn và sống trong xã hội công nghiệp, điều này có thể giới hạn khả năng tổng quát hóa của Centaur đối với các nhóm dân cư đa dạng hơn trên toàn cầu.

Để cải thiện những hạn chế này, nhóm nghiên cứu cho biết họ đang mở rộng bộ dữ liệu huấn luyện lên gấp 4 lần kích thước hiện tại. Centaur hiện đã được công khai và miễn phí cho cộng đồng nghiên cứu.

BL (theo Nature)

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)