Tại buổi giới thiệu, ASUS khẳng định Ascent GX10 là một giải pháp dành cho các nhà phát triển AI, nhà nghiên cứu và chuyên gia dữ liệu muốn triển khai công việc phát triển, điều chỉnh mô hình (fine-tune) hoặc suy luận (inference) ngay tại chỗ, thay vì phải phụ thuộc hoàn toàn vào đám mây.
Trái tim của máy là NVIDIA GB10 Grace Blackwell Superchip, một con chip kết hợp CPU ARM 20 nhân (Grace) và GPU Blackwell tích hợp, sử dụng bộ nhớ hợp nhất (unified memory) lên đến 128 GB LPDDR5x. Kiến trúc này hỗ trợ băng thông cao nhờ NVLink-C2C, giúp CPU-GPU giao tiếp nhanh hơn so với PCIe Gen5 thông thường.
Hiệu năng AI của GX10 được công bố lên đến 1 petaFLOP – con số cực kỳ ấn tượng cho một máy để bàn có kích thước rất khiêm tốn: chỉ 150 150 51 mm, nặng khoảng 1,48 kg. Hệ thống cũng hỗ trợ ổ M.2 NVMe (kích thước 2242) từ 1TB, 2TB hoặc 4TB, chạy PCIe 4.0 4 (hoặc Gen5 dành cho bản 4TB).
ASUS cũng rất chú trọng về khả năng mở rộng: người dùng có thể kết nối hai chiếc GX10 thông qua cổng mạng ConnectX-7 của NVIDIA, để gấp đôi hiệu năng lên tới 2 petaFLOP và tăng dung lượng bộ nhớ hợp nhất lên đến 256GB. Việc kết nối hai thiết bị này cho phép xử lý các mô hình AI cực lớn, ví dụ như Llama 3.1 405 tỉ tham số.
Về phần mềm, GX10 sử dụng NVIDIA DGX OS (dựa trên Ubuntu) cùng với ngăn xếp phần mềm AI của NVIDIA (AI software stack). Trong đó có sẵn nhiều công cụ như CUDA, PyTorch, TensorFlow, Jupyter, TensorRT, cùng với các blueprint & SDK (NIM, Blueprint) giúp người dùng nhanh chóng phát triển, tinh chỉnh và suy luận mô hình.
Khả năng tản nhiệt cũng được ASUS thiết kế tinh xảo để đảm bảo hiệu năng bền vững trong một khung máy nhỏ. Theo công bố, hệ thống tản nhiệt của GX10 hiệu quả hơn khoảng 1,6 lần so với các hệ thống tương đương trong phân khúc siêu nhỏ.
Một điểm đáng chú ý nữa là kết nối: ngoài mạng ConnectX-7, máy còn có cổng 10G LAN, Wi-Fi 7 (Gig ), Bluetooth 5, và các cổng I/O như 3x USB-C 20 Gbps, HDMI 2.1. Điện năng cung cấp qua USB-C PD (180W) với adapter tương thích USB-C PD 3.1 EPR.
Việc ASUS ra mắt Ascent GX10 nằm trong xu hướng đưa siêu máy tính AI về bàn làm việc – một bước chuyển quan trọng so với mô hình phát triển AI chủ yếu dựa vào đám mây hoặc các trung tâm dữ liệu lớn. Thị trường máy dành cho phát triển AI cá nhân đang mở rộng nhanh, khi chi phí điện toán tại chỗ ngày càng hạ và các mô hình ngôn ngữ lớn (LLM) trở nên phổ biến hơn.
Trước đây, để chạy các mô hình AI lớn (tỷ thông số) hoặc điều chỉnh các mô hình tinh vi, các nhà khoa học dữ liệu thường cần thuê máy chủ cloud hoặc sử dụng hạ tầng GPU/TPU chuyên dụng, điều này tốn kém và đôi khi kém linh hoạt, nhất là khi xử lý dữ liệu nhạy cảm hoặc cần triển khai nhanh tại biên (edge) hoặc văn phòng. Ascent GX10 giải quyết được rất nhiều vấn đề này: nó cho phép phát triển, tinh chỉnh và suy luận mô hình ngay tại chỗ, giữ dữ liệu cục bộ (on-premise) để bảo mật hơn, đồng thời tiết kiệm chi phí thuê cloud nếu công việc chủ yếu là thử nghiệm hoặc phát triển prototyping.


