Phiên bản mới nhất của Gaudi sẽ được ra mắt vào quý III năm 2024. Với công suất tính toán FP8: 1835 TFLOPS, Intel tin rằng Gaudi 3 có thể chiếm được một phần thị AI rộng lớn và đắt đỏ cho riêng mình.
Việc ra mắt sắp tới của Gaudi 3 cũng đến trong bối cảnh Intel thay đổi cách định vị các sản phẩm chip AI của mình - dòng sản phẩm Gaudi được nâng lên làm sản phẩm chip máy chủ đắt giá của Intel. Cụ thể, Intel không có bất kỳ chip AI mới nào khác đang được ra mắt ngoài Gaudi 3. Vì vậy, đây là sản phẩm duy nhất mang theo kỳ vọng to lớn của Intel vào lúc này.
Chip Gaudi 3 mới nhất của Intel.
Gaudi 3 là sản phẩm được phát triển trực tiếp và tích cực từ phần cứng Gaudi 2. Gaudi 2 được xây dựng trên quy trình 7nm của Taiwan Semiconductor Manufacturing Co (TSMC), Habana Labs đã đưa Gaudi 3 lên quy trình mới là 5nm. Đồng thời, mảng chip Gaudi 3 đã thêm một lượng phần cứng tính toán vừa phải, mở rộng từ 2 động cơ ma trận và 24 lõi Tensor lên thành 4 động cơ ma trận và 32 lõi Tensor.
Trong các thử nghiệm, độ chính xác cho kết quả FP8: 1835 TFLOPS, gấp đôi hiệu suất FP8 của Gaudi 2. Đáng chú ý hơn là hiệu suất BF16 đã tăng gấp 4 lần so với Gaudi 2. Tuy nhiên, Intel chưa tiết lộ số liệu chính thức về thông lượng cho chế độ đó, hoặc những thay đổi, thiết kế nào đã dẫn đến cải tiến đó. Dù sao đi nữa, Intel cần tối đa hóa hiệu suất của Gaudi 3 nếu họ muốn chiếm được một phần thị trường AI cho riêng mình.
Một số cải tiến về hiệu suất của Gaudi 3 so với phiên bản cũ Gaudi 2.
Intel cho biết, chip Gaudi 3 dự đoán hiệu suất sẽ cao hơn từ 1,3 đến 1,5 lần so với H200/H100 của Nvidia. Đáng chú ý nhất là hiệu suất tiết kiệm điện năng lên đến 2,3 lần.
Minh Hiếu (Theo Anandtech)