Thứ sáu, 05/08/2022 14:37

AI dự đoán hình dạng của gần như toàn bộ “vũ trụ” protein

Mới đây, công ty DeepMind thông báo công cụ AlphaFold đã có thể xác định cấu trúc của khoảng 200 triệu protein. Với kết quả này, kể từ hôm nay, việc xác định hình dạng 3D của hầu hết mọi loại protein mà khoa học biết đến sẽ đơn giản như gõ tìm kiếm trên Google.

Cấu trúc của protein vitellogenin - tiền chất của lòng đỏ trứng theo dự đoán của công cụ AlphaFold (ảnh: DeepMind).

Các nhà nghiên cứu đã sử dụng AlphaFold (mạng trí tuệ nhân tạo) để dự đoán cấu trúc của hơn 200 triệu protein từ khoảng 1 triệu loài, bao gồm hầu hết mọi loại protein được biết đến trên hành tinh. Hình dạng 3D hay cấu trúc của protein là thứ xác định chức năng của protein trong tế bào. Hầu hết các loại thuốc được thiết kế bằng cách sử dụng thông tin cấu trúc và việc tạo ra các bản đồ chính xác về sự sắp xếp axit amin của protein thường là bước đầu tiên để tạo ra những khám phá về cách thức hoạt động của protein.

DeepMind đã phát triển mạng AlphaFold bằng cách sử dụng một kỹ thuật AI được gọi là học sâu và cơ sở dữ liệu AlphaFold đã được đưa ra cách đây một năm với hơn 350.000 dự đoán cấu trúc bao gồm gần như mọi protein được tạo ra bởi con người, chuột và 19 sinh vật được nghiên cứu rộng rãi khác. Danh mục kể từ đó đã tăng lên khoảng 1 triệu mục.

Nhiều cấu trúc AlphaFold đủ tốt để thay thế cấu trúc thử nghiệm cho một số ứng dụng. Trong các trường hợp khác, các nhà nghiên cứu sử dụng dự đoán AlphaFold để xác thực và tạo ý nghĩa cho dữ liệu thử nghiệm. 

Việc phát hành AlphaFold vào năm ngoái đã gây được tiếng vang lớn trong cộng đồng khoa học. Công cụ tạo ra các dự đoán có độ chính xác cao về cấu trúc của nhiều loại protein. Đồng thời, cung cấp thông tin về độ chính xác của các dự đoán, vì vậy các nhà nghiên cứu sẽ biết được liệu những cấu trúc này có thể được tin cậy hay không. Thông thường, các nhà khoa học cần phải sử dụng các phương pháp thí nghiệm tốn kém thời gian và chi phí như tinh thể học tia X và kính hiển vi điện tử lạnh để giải quyết cấu trúc protein.

Theo Viện Thông tin sinh học châu Âu, khoảng 35% trong số hơn 214 triệu dự đoán cấu trúc có độ chính xác cao, có nghĩa là chúng tốt như các cấu trúc được xác định bằng thực nghiệm. 45% khác được coi là đủ chính xác để sử dụng trong nhiều ứng dụng.

Bắc Lê (lược dịch theo Nature)

 

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)