Mở rộng ranh giới kiến thức của con người
Là siêu máy tính mạnh mẽ nhất hiện nay, Frontier xử lý dữ liệu với tốc độ kỷ lục, vượt xa 100.000 máy tính xách tay hoạt động cùng lúc. Khi ra mắt vào năm 2022, đây là máy tính đầu tiên vượt qua rào cản tốc độ exascale của siêu máy tính có khả năng thực hiện một exaflop, hay 1018 phép tính mỗi giây. Frontier luôn giữ vị trí đầu bảng trong cuộc đua chế tạo siêu máy tính trên toàn cầu kéo dài hàng thập kỷ gần đây.
Nhưng tốc độ và kích thước chỉ là thứ yếu so với mục đích chính của Frontier - mở rộng ranh giới kiến thức của con người. Frontier rất giỏi trong việc tạo ra các mô phỏng nắm bắt các mô hình quy mô lớn với các chi tiết siêu nhỏ, chẳng hạn như cách những giọt nước nhỏ xíu trong đám mây có thể ảnh hưởng đến tốc độ ấm lên của khí hậu Trái đất. Các nhà nghiên cứu đang sử dụng siêu máy tính để tạo ra các mô hình tiên tiến về mọi thứ, từ các hạt hạ nguyên tử đến các thiên hà. Một số dự án đang mô phỏng protein để giúp phát triển các loại thuốc mới, mô hình hóa nhiễu loạn để cải thiện thiết kế động cơ máy bay và tạo ra các mô hình ngôn ngữ lớn (LLM) mã nguồn mở để cạnh tranh với các công cụ trí tuệ nhân tạo (AI) từ Google và OpenAI.
Các nhà nghiên cứu đăng nhập vào Frontier từ khắp nơi trên thế giới. Vào năm 2023, siêu máy tính này có 1.744 người dùng ở 18 quốc gia. Trong năm 2024, dự kiến sẽ có ít nhất là 500 bài báo khoa học được công bố dựa trên các phép tính được thực hiện trên Frontier.
Nhà vật lý sinh học Dilip Asthagiri thuộc Phòng thí nghiệm Quốc gia Oak Ridge (Hoa Kỳ) cho biết rằng, Frontier không khác gì Kính viễn vọng không gian James Webb. Chúng ta nên coi nó như một công cụ khoa học.
Siêu máy tính Frontier bao phủ một khu vực lớn hơn hai sân bóng rổ. Nguồn: Nature.com.
Theo Bronson Messer, Giám đốc khoa học tại Cơ sở máy tính lãnh đạo thuộc Phòng thí nghiệm quốc gia Oak Ridge tại Tennessee (nơi đặt Frontier), các nhà khoa học trên khắp thế giới sẽ gửi đề xuất về việc được sử dụng Frontier. Trung bình sẽ có khoảng 1/4 đề xuất được chấp thuận. Năm 2023, số dự án được chấp nhận là 131. Các khoản phân bổ phổ biến nhất mà dự án được cung cấp là khoảng 500.000 giờ node, tương đương với việc chạy toàn bộ máy liên tục trong ba ngày. Nhiều dự án tận dụng khả năng của Frontier trong việc mô hình hóa đồng thời nhiều thang đo không gian và thời gian. Ví dụ, các nhà khoa học sử dụng Frontier để mô phỏng các quá trình sinh học chính xác đến mức nguyên tử, chẳng hạn như protein hoặc axit nucleic trong dung dịch tương tác với các bộ phận của tế bào. Năm 2023, các nhà khoa học khí hậu đã sử dụng siêu máy tính để chạy mô hình khí hậu toàn cầu với độ phân giải 3,25 km. Để một mô hình có thể thực hiện được dự báo thời tiết và khí hậu, nó cần chạy ít nhất một năm mô phỏng mỗi ngày. Frontier có thể mô phỏng 1,26 năm mỗi ngày cho mô hình này - tốc độ cho phép các nhà nghiên cứu tạo ra các dự báo 50 năm chính xác hơn so với trước đây.
Frontier cũng mang lại độ phân giải cao hơn cho các thang đo vũ trụ học. Nhà vật lý thiên văn Evan Schneider tại Đại học Pittsburgh ở Pennsylvania đang sử dụng siêu máy tính để nghiên cứu cách các thiên hà có kích thước bằng Ngân Hà khi chúng già đi. Các mô hình thiên hà của Frontier trải dài bốn cấp độ, lên đến các cấu trúc thiên hà quy mô lớn có kích thước khoảng 100.000 năm ánh sáng. Trước Frontier, các cấu trúc lớn nhất mà Evan Schneider có thể mô phỏng với độ phân giải tương đương là các thiên hà lùn, có khối lượng chỉ bằng khoảng một phần năm mươi so với các thiên hà lớn.
Các nhà nghiên cứu AI cũng đang yêu cầu sự hỗ trợ của Frontier, đặc biệt trong việc huấn luyện các kiến trúc mạng nơ-ron như mô hình transformer là nền tảng của ChatGPT. Với gần 38.000 GPU, Frontier giữ một vai trò nổi bật ở khu vực công trong lĩnh vực nghiên cứu AI, vốn chủ yếu bị chi phối bởi ngành công nghiệp.
Rút ngắn khoảng cách của nghiên cứu trí tuệ nhân tạo
Trong một nghiên cứu công bố vào năm 2023, Nur Ahmed và cộng sự tại Đại học Arkansas (Hoa Kỳ) đã nêu bật khoảng cách giữa AI trong học thuật và ngành công nghiệp. Theo đó, năm 2021, 96% các mô hình AI lớn nhất đến từ ngành công nghiệp. Trung bình, các mô hình của ngành công nghiệp lớn hơn gần 30 lần so với các mô hình học thuật. Sự chênh lệch này cũng thể hiện rõ ràng trong đầu tư tài chính. Các cơ quan phi quốc phòng của Hoa Kỳ đã cung cấp 1,5 tỷ USD để hỗ trợ nghiên cứu AI vào năm 2021. Cùng năm đó, ngành công nghiệp đã chi hơn 340 tỷ USD cho lĩnh vực này trên toàn cầu.
Ngành công nghiệp đang đẩy mạnh ranh giới của nghiên cứu AI cơ bản. Điều này có thể gây ra nhiều vấn đề. Sự thống trị của ngành công nghiệp có thể dẫn đến tình trạng thiếu nghiên cứu cơ bản (vì không mang lại lợi nhuận ngay lập tức) và dẫn đến việc sự phát triển của các công nghệ AI bỏ qua nhu cầu của các cộng đồng yếu thế. Nhiều mô hình đã cho thấy sự phân biệt giới tính và chủng tộc... Các nhà khoa học có thể đóng vai trò là các “kiểm toán viên” để đánh giá các rủi ro từ các mô hình AI, nhưng để làm được điều này, họ cần quyền truy cập vào tài nguyên tính toán ở quy mô tương đương với ngành công nghiệp. Đó là lý do khiến Frontier càng trở nên quan trọng.
"Cách duy nhất để những người trong giới học thuật có thể đào tạo các mô hình có quy mô tương tự trong công nghiệp là họ có quyền truy cập vào các tài nguyên như Frontier" - nhà khoa học Abhinav Bhatele thuộc Đại học Maryland (Hoa Kỳ) khẳng định. Bhatele đang sử dụng Frontier để phát triển LLM nguồn mở như một đối trọng với các mô hình công nghiệp. Bhatele cho biết, thông thường khi các công ty đào tạo các mô hình của mình, họ giữ chúng độc quyền và không công bố trọng số mô hình. Với nghiên cứu mở này, các nhà khoa học có thể cung cấp miễn phí các mô hình này để bất kỳ ai cũng có thể sử dụng.
Cuộc đua chế tạo siêu máy tính
Cách Frontier vài cánh cửa, thế hệ tiền nhiệm của nó vẫn đang nỗ lực thực hiện công việc phục vụ các nhà khoa học trên khắp thế giới. Trong đó có Summit - cỗ máy đã giữ kỷ lục thế giới về tốc độ trong giai đoạn 2018-2019 và hiện là siêu máy tính nhanh thứ chín trên thế giới.
Lịch sử của Summit cho thấy hình ảnh của Frontier trong tương lai. Frontier lần đầu tiên đứng đầu danh sách vào năm 2022 và có khả năng sẽ sớm phải rời bỏ vị trí này. Siêu máy tính đứng thứ hai - Aurora, đặt tại Phòng thí nghiệm Quốc gia Argonne ở Illinois, Hoa Kỳ, được cho là sẽ vượt qua hiệu suất của Frontier tại một thời điểm nào đó khi được tối ưu hóa. Siêu máy tính El Capitan của Phòng thí nghiệm Lawrence Livermore, dự kiến sẽ được đưa vào hoạt động vào cuối năm 2024 tại phòng thí nghiệm ở California, Hoa Kỳ, cũng được dự đoán sẽ vượt qua Frontier. Nằm trong danh sách này còn có Jupiter, một siêu máy tính exascale ở Đức dự kiến sẽ ra mắt vào cuối năm nay.
Thứ hạng các siêu máy tính theo TOP500. Nguồn: Nature.com.
Hiện tại, Hoa Kỳ và Trung Quốc là hai quốc gia này có nhiều siêu máy tính nhất trong bảng xếp hạng TOP5001 (được công bố vào tháng 6/2024). Theo đó, Hoa Kỳ có 168 máy, trong khi Trung Quốc có 80 máy. Tuy nhiên, các nhà nghiên cứu tự hỏi liệu các quốc gia này còn có các siêu máy tính mạnh mẽ khác mà họ chưa công khai hay không?
Phòng thí nghiệm Quốc gia Oak Ridge hiện đang lên kế hoạch cho máy tính kế nhiệm Frontier, được gọi là Discovery, có tốc độ tính toán gấp ba đến năm lần. Đây sẽ là sản phẩm mới nhất trong hành trình tìm kiếm tốc độ kéo dài hàng thập kỷ. Frontier nhanh hơn Tianhe-2A (máy tính nhanh nhất năm 2014) 35 lần, và nhanh hơn Earth Simulator (siêu máy tính nhanh nhất năm 2004) 33.000 lần.
Các nhà nghiên cứu rất khao khát việc tăng tốc độ tính toán cho các siêu máy tính. Một siêu máy tính lớn hơn sẽ cho phép nghiên cứu các mô hình thiên hà với độ phân giải cao hơn. Tuy nhiên, các kỹ sư phải đối mặt với một thách thức lớn: siêu máy tính tiêu thụ năng lượng rất lớn, và các siêu máy tính trong tương lai có thể cần nhiều năng lượng hơn nữa. Vì vậy, việc cải thiện hiệu quả năng lượng đang được các nhà nghiên cứu tích cực thúc đẩy. Frontier hiện tại hiệu quả hơn Summit gấp bốn lần, phần lớn nhờ hệ thống làm mát bằng nước ở nhiệt độ môi trường, khác với Summit sử dụng nước lạnh. Khoảng 3-4% tổng năng lượng tiêu thụ của Frontier dành cho việc làm mát, trong khi con số này ở Summit là 10%. Mặc dù vậy, hiện tại, nhu cầu điện đạt đỉnh của Frontier ở mức khoảng 27 megawatt - đủ để cung cấp điện cho khoảng 10.000 ngôi nhà ở Tennessee.
Chiêu Dương - Công Minh (lược dịch theo nature.com)
1TOP500 là dự án ra đời vào năm 1993, chuyên cung cấp cơ sở dữ liệu về điện toán hiệu năng cao.