Chuyển đổi số

‏Công cụ AI mới dự báo nguy cơ mắc bệnh trong hai thập kỷ tới‏

Hoàng Phương Linh 26/09/2025 14:08

‏Một công cụ trí tuệ nhân tạo (AI) mới ra mắt, có thể dự báo nguy cơ mắc hơn 1.000 căn bệnh, mang lại bước đột phá cho nền y học dự phòng.‏

452-202509251429491.png
‏ Ảnh: Brooks/Kraft/Corbis/Getty‏

‏Delphi-2M là một mô hình ngôn ngữ lớn (LLM) có khả năng phân tích hồ sơ bệnh án và lối sống để ước tính nguy cơ mắc hơn 1.000 loại bệnh cho mỗi cá nhân.‏

‏Cụ thể, hệ thống AI này có thể dự báo nguy cơ mắc ung thư, bệnh về da và bệnh tự miễn dựa trên dữ liệu huấn luyện từ 400.000 người Anh. Dù chỉ được huấn luyện trên một nguồn dữ liệu, khả năng mô hình hóa đa bệnh của nó được xem là "chìa khóa” để các bác sĩ có thể nhận diện sớm bệnh nhân có nguy cơ cao và áp dụng các biện pháp phòng ngừa kịp thời.‏

Cỗ máy tiên tri sức khỏe

‏Hầu hết các công cụ AI y tế hiện nay chỉ có thể ước tính nguy cơ cho một bệnh duy nhất. Theo nhà khoa học dữ liệu Moritz Gerstung, đây là một hạn chế lớn, bởi dù đã có các mô hình dự đoán ung thư hay bệnh tim mạch, một chuyên gia "sẽ phải sử dụng hàng chục mô hình khác nhau để có được câu trả lời toàn diện".‏

‏Để vượt qua hạn chế này, nhóm của Gerstung đã cải tiến một mô hình ngôn ngữ lớn (LLM) có tên là GPT. Các tác giả đã thiết kế mô hình Delphi-2M để dự báo nguy cơ mắc 1.258 loại bệnh. ‏

‏Mô hình này hoạt động bằng cách phân tích một loạt dữ liệu đầu vào, từ lịch sử bệnh án, tuổi, giới tính, BMI, cho đến các thói quen như hút thuốc và uống rượu. Toàn bộ hệ thống được huấn luyện trên nguồn dữ liệu từ 400.000 người tham gia nghiên cứu dài hạn UK Biobank tại Anh.‏

‏Đối với hầu hết các bệnh, dự đoán của Delphi-2M có độ chính xác bằng, thậm chí vượt trội hơn so với các mô hình dự đoán đơn bệnh hiện hành. Nó cũng chứng tỏ sự ưu việt khi so sánh với một thuật toán máy học khác dựa trên dấu ấn sinh học (biomarker) trong cơ thể. ‏

‏Năng lực dự báo của Delphi-2M hoạt động hiệu quả nhất khi dự báo diễn biến của các bệnh có quy luật tiến triển dễ đoán, chẳng hạn như một số loại ung thư. Tùy theo mức độ chi tiết của hồ sơ bệnh án, mô hình có thể dự đoán khả năng mắc mỗi loại bệnh với tầm nhìn xa lên tới hai thập kỷ.‏

‏Hệ thống cảnh báo từ sớm

Nhóm nghiên cứu đã kiểm chứng hiệu quả của Delphi-2M bằng cách thử nghiệm trên dữ liệu của gần 2 triệu người trong cơ sở dữ liệu y tế công cộng của Đan Mạch. Kết quả cho thấy dự đoán của mô hình đối với dữ liệu này chỉ kém chính xác hơn một chút so với khi chạy trên dữ liệu của UK Biobank.

Theo Gerstung, điều này chứng tỏ rằng mô hình vẫn có thể đưa ra những dự báo tương đối đáng tin cậy khi áp dụng trên các bộ dữ liệu từ những hệ thống y tế quốc gia khác.‏

‏Dù Delphi-2M mở ra một hướng đi đầy hứa hẹn, con đường từ phòng thí nghiệm đến ứng dụng lâm sàng vẫn còn nhiều thách thức. Giới chuyên môn đã có những phản hồi tích cực nhưng cũng rất thận trọng.‏

‏Ông Degui Zhi, một nhà nghiên cứu tin sinh học chuyên phát triển mô hình AI tại Trung tâm Khoa học Y tế Đại học Texas ở Houston, nhận định đây là một đóng góp "thú vị" cho lĩnh vực mô hình hóa đa bệnh vốn đang phát triển mạnh mẽ.

Tuy nhiên, ông cũng chỉ ra một điểm yếu cốt lõi nằm ở chính dữ liệu huấn luyện. Dữ liệu của UK Biobank hiện chỉ ghi nhận lần đầu tiên một người tham gia mắc bệnh, bỏ qua các lần tái phát sau đó.‏

‏Đây là một thiếu sót quan trọng, bởi lẽ diễn biến sức khỏe của một người không phải là đường thẳng. Ví dụ, một bệnh nhân tiểu đường đã kiểm soát tốt bệnh trong nhiều năm sẽ có một lộ trình sức khỏe rất khác so với một người liên tục phải nhập viện vì các biến chứng.

Theo ông Zhi, số lần một người tái mắc bệnh là yếu tố cực kỳ quan trọng để có thể lập mô hình lộ trình sức khỏe cá nhân một cách chính xác.

Giải pháp trong tương lai

‏Nhận thức rõ những hạn chế này, Gerstung và nhóm của ông đã vạch ra những bước đi tiếp theo. Họ sẽ tiếp tục đánh giá và hiệu chỉnh độ chính xác của Delphi-2M trên các bộ dữ liệu từ nhiều quốc gia khác nhau. ‏

‏Mục tiêu không chỉ là mở rộng phạm vi ứng dụng, mà còn là để đảm bảo mô hình có thể hoạt động hiệu quả trên các nhóm dân cư đa dạng với nền tảng di truyền và lối sống khác nhau, giảm thiểu các thiên vị có thể xảy ra.‏

‏Đây không chỉ là việc thêm dữ liệu, mà là việc tạo ra một bức tranh sức khỏe toàn diện và đa sắc tộc hơn. "Hướng đi quan trọng sắp tới," Gerstung nói, "sẽ là việc tìm cách kết hợp tất cả các nguồn dữ liệu này lại với nhau để phát triển nên các thuật toán ngày càng chính xác và công bằng hơn nữa". ‏‏

‏Sự ra đời của Delphi-2M không chỉ là một bước đột phá về công nghệ mà là một lời báo trước về tương lai của y học - một tương lai nơi con người có thể "nhìn thấy" quỹ đạo sức khỏe của chính mình. Điều này mở ra một viễn cảnh đầy hứa hẹn: y học phòng ngừa được cá nhân hóa đến từng chi tiết, giúp chúng ta chủ động "đón đầu" bệnh tật thay vì bị động chữa trị./.‏‏

Theo Nature
https://www.nature.com/articles/d41586-025-02993-x
Copy Link
https://www.nature.com/articles/d41586-025-02993-x
Nổi bật
    Mới nhất
    ‏Công cụ AI mới dự báo nguy cơ mắc bệnh trong hai thập kỷ tới‏