Trong sự kiện AI Day 2022 mới của mình, Tesla vừa giới thiệu phiên bản mới nhất cho siêu máy tính Dojo của mình và nó mạnh đến mức làm sập cả mạng lưới điện của Palo Alto. Thay vì thuê ngoài, Dojo là nền tảng siêu máy tính tùy chỉnh được Tesla xây dựng từ đầu dành cho các tác vụ học máy và huấn luyện AI thông qua các đoạn video mà những chiếc xe Tesla gửi về.
Trước đó, Tesla đã có một trong những siêu máy tính mạnh nhất thế giới sử dụng các GPU của Nvidia, nhưng siêu máy tính mới Dojo lại sử dụng chip và toàn bộ cơ sở hạ tầng do Tesla thiết kế. Được Tesla giới thiệu trong sự kiện AI Day 2021 nhưng Dojo vẫn liên tục được công ty cải thiện sức mạnh và năng lực của mình trong suốt thời gian vừa qua và trong sự kiện năm nay, Tesla đang cho thấy những cải tiến trong dự án siêu máy tính của mình.
Với sức mạnh của mình, Dojo được kỳ vọng sẽ tăng cường khả năng huấn luyện AI của Tesla thông qua các dữ liệu video – một yếu tố đặc biệt quan trọng cho công nghệ thị giác máy tính được ứng dụng cho xe tự lái.
Khay hệ thống chứa các bộ xử lý tùy chỉnh dành cho siêu máy tính Dojo mới của Tesla
Công ty xác nhận việc họ đã chuyển từ thiết kế dùng chip và các ô nối sang khay hệ thống và tủ máy chủ đầy đủ. Với thiết kế này, Tesla tuyên bố họ có thể thay thế 6 hộp GPU bằng một khay Dojo duy nhất với chi phí còn thấp hơn cả một hộp GPU. Tesla cho biết, một khay gắn các bộ xử lý này sẽ tương đương với "từ 3 đến 4 giá đầy đủ của siêu máy tính".
Bên cạnh đó, khay hệ thống chứa các bộ xử lý này còn được tích hợp trực tiếp vào giao diện máy chủ để tạo thành một cụm máy chủ đầy đủ như dưới đây:
Khay hệ thống này được tích hợp trực tiếp vào giao diện máy chủ của siêu máy tính Dojo
Tesla cho biết, hai khay hệ thống này có thể được lắp vừa trong một tủ chứa của siêu máy tính Dojo. Dưới đây là hình ảnh cho thấy tủ chứa của Dojo sẽ như thế nào khi đóng và mở.
Bên trong tủ máy chủ Dojo khi mở ra
Khi ghép các tủ chứa này lại với nhau sẽ tạo thành một cụm máy chủ lớn hơn được Tesla gọi là "Dojo Exapod":
Ghép nhiều tủ máy chủ này lại với nhau sẽ tạo thành cụm máy chủ Dojo Exapod
Hiện tại, Tesla vẫn đang trong quá trình phát triển và hoàn thiện cơ sở hạ tầng cho siêu máy chủ tùy chỉnh của riêng mình. Bill Chang, kỹ sư hệ thống chủ chốt của Tesla cho biết trong buổi giới thiệu Dojo: "Chúng tôi biết rằng mình sẽ phải kiểm tra lại mọi khía cạnh cần thiết của cơ sở hạ tầng trung tâm dữ liệu để hỗ trợ cho khả năng làm mát và mật độ sức mạnh chưa từng thấy trước đây."
"Đầu năm nay, chúng tôi đã bắt đầu thử tải và khả năng làm mát của cơ sở hạ tầng này, chúng tôi đã đẩy năng lượng tiêu thụ lên mức 2MW trước khi làm quá tải trạm biến áp và nhận được cuộc gọi từ thành phố." Ông Chang cho biết thêm. Đó là lý do họ phải phát triển hệ thống làm mát và cấp điện công suất cao dành riêng cho các tủ máy chủ Dojo của mình.
Dưới đây là một số thông số của mỗi cụm Dojo Exapod: khả năng xử lý 1,1 EFLOP, bộ nhớ 1,3 TB SRAM và 13 TB DRAM băng thông lớn.
Cấu hình của cụm máy chủ Dojo Exapod
Đang sở hữu một trong các siêu máy tính mạnh nhất thế giới, tại sao Tesla lại cần siêu máy tính mới Dojo?
Tại sao một nhà sản xuất ô tô như Tesla lại tập trung phát triển một siêu máy tính mạnh mẽ đến như vậy? Đơn giản là vì họ không chỉ là một nhà sản xuất xe điện thông thường mà còn là một công ty công nghệ đang phát triển các sản phẩm thúc đẩy quá trình chuyển đổi sang nền kinh tế bền vững hơn.
Ông Musk cho biết, sẽ cung cấp máy chủ Dojo như một dịch vụ, tương tự như dịch vụ máy chủ đám mây của Amazon AWS, với tuyên bố nó là "một dịch vụ mà bạn có thể sử dụng trực tuyến để huấn luyện các mô hình đường đi nhanh hơn và ít tốn kém hơn."
Nhưng quan trọng hơn, Tesla cần siêu máy tính Dojo để tự động dán nhãn cho các video dữ liệu mà họ thu thập được từ những chiếc xe đang vận hành của mình và sau đó huấn luyện mạng thần kinh nhân tạo để xây dựng các hệ thống tự lái.
Từ lâu Tesla đã nhận ra rằng, cách tiếp cận của mình trong việc xây dựng khả năng tự lái thông qua hàng triệu video do khách hàng của Tesla gửi về sẽ cần đến khả năng xử lý khổng lồ, do vậy, họ quyết định phải tự phát triển siêu máy tính của riêng mình để thực hiện khả năng đó một cách hiệu quả hơn.
Mặc dù vậy, đây rõ ràng chỉ là một mục tiêu trong ngắn hạn và nhiều khả năng Tesla sẽ triển khai nhiều ứng dụng khác trên nền tảng siêu máy tính này trong tương lai khi họ đang có tham vọng lớn trong việc phát triển các chương trình trí tuệ nhân tạo khác.
Tham khảo Electrek, Gizmodo