Khoa học - Công nghệ

Hệ thống định tuyến đạt tốc độ 51,2 Tbps thỏa mãn “cơn khát” tốc độ của AI trong kiến trúc mạng AI phân tán

Minh Thiện 27/11/2025 08:32

Được tăng cường sức mạnh bởi chip Silicon One P200 thế hệ mới, hệ thống định tuyến 8223 của Cisco tái định nghĩa chuẩn mực kết nối mạng AI an toàn và hiệu quả - cho phép triển khai liền mạch kiến trúc “scale-across” kết nối các cụm AI trên nhiều trung tâm dữ liệu.

Kiến trúc mạng AI thế hệ mới: Từ cụm đơn lẻ đến hệ sinh thái phân tán

Trong bối cảnh trí tuệ nhân tạo (AI) đang chuyển từ giai đoạn thử nghiệm sang triển khai quy mô cực lớn, hạ tầng mạng truyền thống đang đối mặt với ba giới hạn cứng: Băng thông, tiêu thụ điện năng và độ trễ giữa các cụm tính toán phân bố địa lý.

Cisco vừa công bố hệ thốngCisco 8223 - bộ định tuyến Ethernet cố định đầu tiên trên thế giới đạt dung lượng 51,2 Tbps trong một mạch tích hợp chuyên dụng (Application-Specific Integrated Circuit - ASIC) duy nhất - cùng vi xử lý Silicon One P200, đánh dấu sự chuyển dịch chiến lược từ mô hình “scale-up” và “scale-out” truyền thống sang mô hình “scale-across” (mở rộng xuyên trung tâm dữ liệu).

408-202511261819471.jpg
Hệ thống Cisco 8223 tích hợp vi xử lý Silicon One P200

“Khi khối lượng công việc AI ngày càng vượt xa khả năng xử lý của các trung tâm dữ liệu truyền thống, ngành công nghệ đang phải đối mặt với những thách thức mới về băng thông, độ tin cậy và khả năng mở rộng. Việc các trung tâm dữ liệu được dịch chuyển đến những khu vực xa hơn để tận dụng nguồn năng lượng đã khiến nhu cầu về các kết nối có độ tin cậy cực cao và băng thông lớn trở nên cấp thiết hơn bao giờ hết. Cisco 8223, được vận hành bởi chip Silicon One P200, đánh dấu một bước tiến quan trọng, mang đến router Ethernet cố định đầu tiên trên thị trường đạt tốc độ 51,2 terabit/giây, được thiết kế chuyên biệt cho mạng kết nối phân tán (scale-across) - đảm bảo tính bảo mật cao, tiết kiệm năng lượng và hiệu suất vượt trội”, Patrick Moorhead - Tổng Giám đốc kiêm Nhà phân tích trưởng, Moor Insights & Strategy nhận xét.

Các mô hình ngôn ngữ lớn (LLM) hiện nay yêu cầu hàng trăm nghìn đến hàng triệu GPU hoạt động đồng bộ. Khi một trung tâm dữ liệu không còn đủ không gian, nguồn điện hoặc khả năng làm mát, việc phân bố khối lượng huấn luyện và suy luận trên nhiều địa điểm cách nhau hàng trăm thậm chí hàng nghìn kilômét trở thành giải pháp bắt buộc.

Kiến trúc scale-across đòi hỏi liên kết DCI (Data Center Interconnect) phải đáp ứng đồng thời ba tiêu chí: Băng thông cực đại và ổn định trong các đợt bùng nổ lưu lượng (burst traffic) đặc trưng của giai đoạn all-reduce và gradient synchronization; Độ tiêu thụ điện trên mỗi bit truyền phải giảm mạnh để phù hợp với giới hạn nguồn điện ngày càng khắt khe; Độ bảo mật và khả năng chống chịu các mối đe dọa hậu lượng tử ngay từ tầng vật lý và tầng liên kết dữ liệu.

Cisco 8223 được thiết kế chính xác cho kịch bản này. Đặc tính kỹ thuật nổi bật của Cisco 8223 và Silicon One P200 bao gồm:

Dung lượng định tuyến 51,2 Tbps trong một chip duy nhất, tương đương khả năng xử lý hơn 20 tỷ gói tin mỗi giây.

64 cổng 800 Gbps native, mật độ cổng cao nhất hiện nay trong phân khúc định tuyến cố định.

Bộ đệm sâu (deep buffer) tích hợp trên chip P200 có khả năng hấp thụ các đợt lưu lượng bùng nổ hàng trăm gigabyte mà không làm rơi gói tin - yếu tố sống còn đối với hiệu suất huấn luyện phân tán.

Hiệu suất năng lượng đạt mức tương đương switch fabric dù thực hiện đầy đủ chức năng định tuyến Layer-3, giúp giảm đáng kể PUE (Power Usage Effectiveness) của toàn cụm AI.

Hỗ trợ quang học coherent 800G khoảng cách lên tới 1.000 km mà không cần tái sinh tín hiệu, cho phép kết nối trực tiếp giữa các vùng địa lý khác nhau (metro-to-metro DCI).

Lập trình giao thức hoàn toàn bằng P4 (Programming Protocol-Independent Packet Processors), cho phép triển khai nhanh các tính năng mới (Segment Routing, In-situ OAM, EVPN mới...) mà không cần thay thế phần cứng (P4 là ngôn ngữ lập trình miền đặc thù (domain-specific language) được thiết kế để mô tả hoàn toàn cách một thiết bị mạng (switch, router, NIC, FPGA, ASIC...) xử lý gói tin - từ việc phân tích header, tra bảng, chỉnh sửa gói tin, đến quyết định chuyển tiếp hay bỏ gói).

Mã hóa đường truyền chống chịu hậu lượng tử (post-quantum line-rate encryption) và cơ chế xác thực phần cứng tích hợp từ mức chip.

Thiết bị có kích thước chỉ 3RU nhưng cung cấp băng thông tương đương hoặc vượt nhiều hệ thống khung (chassis) truyền thống chiếm cả tủ rack.

408-202511261819472.jpg
Kiến trúc mạng phân tán.

Tác động thực tiễn đối với các nhà khai thác quy mô lớn

Các nhà cung cấp siêu quy mô (hyperscaler) và nhà cung cấp dịch vụ đám mây lớn đã bắt đầu tiếp nhận thiết bị. Alibaba Cloud công bố kế hoạch thay thế dần các router khung truyền thống bằng cụm thiết bị cố định chạy P200 cho mạng lõi và DCI, đồng thời phát triển kiến trúc disaggregated kết hợp G200 (phiên bản switching) và P200 (phiên bản routing) trong cùng một fabric thống nhất.

“Trong quá trình Alibaba tiếp tục đầu tư và mở rộng hạ tầng điện toán đám mây, DCI (Data Center Interconnect) là một trụ cột quan trọng trong chiến lược của chúng tôi. Chúng tôi rất vui mừng khi chứng kiến sự ra mắt của Cisco Silicon One P200 - chip định tuyến ASIC 51,2Tbps đầu tiên trong ngành, mang lại băng thông cao, khả năng tiết kiệm năng lượng vượt trội và khả năng lập trình toàn phần với P4. Đây là một bước đột phá công nghệ, phù hợp hoàn hảo với sự phát triển của kiến trúc eCore của Alibaba. Chúng tôi dự kiến sẽ tận dụng P200 để xây dựng nền tảng một chip duy nhất, đóng vai trò là khối nền tảng cốt lõi cho việc mở rộng triển khai eCore. Bên cạnh việc hỗ trợ các kịch bản triển khai hiện tại với Cisco Silicon One Q200, chip định tuyến mới này sẽ giúp chúng tôi mở rộng lên mạng lõi (Core network), thay thế các router dạng khung truyền thống bằng cụm thiết bị sử dụng P200. Sự chuyển đổi này sẽ tăng cường đáng kể tính ổn định, độ tin cậy và khả năng mở rộng của mạng DCI, đồng thời duy trì sự đơn giản trong vận hành.Ngoài ra, chúng tôi cũng đang phát triển và thử nghiệm các kiến trúc phân tách (disaggregated architectures) sáng tạo, sử dụng Cisco G200 cho mạng trung tâm dữ liệu hiệu năng cao. Việc ra mắt chip định tuyến tiên tiến này đánh dấu một bước tiến quan trọng, giúp Alibaba tăng tốc đổi mới và mở rộng hạ tầng trong kỷ nguyên AI”, Dennis Cai - Phó Chủ tịch, Giám đốc Hạ tầng Mạng, Alibaba Cloud - chia sẻ.

408-202511261819473.jpg
Chip Silicon One P200 - chip định tuyến ASIC 51,2Tbps.

Dave Maltz - Kỹ sư trưởng (Technical Fellow) kiêm Phó Chủ tịch Tập đoàn, Azure Networking, Microsoft cho biết: Microsoft Azure đặc biệt quan tâm đến tính nhất quán kiến trúc Silicon One giúp đơn giản hóa việc mở rộng từ leaf-spine nội bộ trung tâm dữ liệu ra mạng WAN và mạng AI/ML back-end. Cisco 8223 là nền tảng then chốt cho chiến lược multi-cloud interconnect thế hệ tiếp theo.

Ý nghĩa dài hạn đối với hạ tầng số quốc gia

Tại Việt Nam, nhu cầu điện toán đám mây và AI đang tăng trưởng theo cấp số nhân, trong khi nguồn điện và quỹ đất cho trung tâm dữ liệu lớn ngày càng khan hiếm. Việc triển khai kiến trúc scale-across với các liên kết DCI băng thông cực cao và tiêu thụ điện tối ưu sẽ trở thành yếu tố quyết định năng lực cạnh tranh của hạ tầng số quốc gia trong thập kỷ tới.

“Khi việc ứng dụng AI tại Việt Nam ngày càng tăng tốc, các trung tâm dữ liệu đang dần chạm tới giới hạn về điện năng và năng lực xử lý, từ đó đặt ra nhu cầu cấp thiết về kết nối an toàn, đáng tin cậy giữa các trung tâm dữ liệu cách nhau hàng trăm kilômét”, Tổng Giám Đốc Cisco Việt Nam, Lào, Campuchia Nguyễn Như Dũng chia sẻ.

“Với bộ định tuyến Cisco 8223, được trang bị bộ xử lý Cisco Silicon One P200 thế hệ mới, Cisco đang giải quyết những thách thức này bằng cách mang đến băng thông khổng lồ, khả năng mở rộng và bảo mật cần thiết cho các kiến trúc trung tâm dữ liệu phân tán".

Cisco 8223 không chỉ là một sản phẩm định tuyến mới, mà là một cải tiến kỹ thuật quan trọng cho kỷ nguyên AI phân tán: Khi sức mạnh tính toán không còn tập trung ở một điểm vật lý duy nhất, mạng lưới kết nối giữa các điểm đó sẽ quyết định tốc độ đổi mới của toàn ngành.

Với việc giao hàng thương mại đã bắt đầu cho các khách hàng hyperscale đầu tiên, năm 2025-2026 nhiều khả năng sẽ chứng kiến sự chuyển dịch lớn từ mô hình “siêu trung tâm dữ liệu” tập trung sang mô hình “siêu cụm AI phân tán” trên toàn cầu, và Cisco 8223 cùng Silicon One P200 đang định vị mình ở vị trí trung tâm của sự chuyển dịch đó./.

Minh Thiện