Ngày 06/08/2018 đã đánh dấu một bước tiến lớn với ngành công nghệ AI của nhân loại, khi trí tuệ nhân tạo OpenAI của Elon Musk đã chính thức đánh bại, nói đúng hơn là “”nghiền nát”” 5 game thủ Dota 2 gạo cội gồm Fog, Merlini, Blitz, Capitalist và MoonMeander.
Trước đó, 5 con bot OpenAI (còn được gọi là OpenAI Five) cũng đã đả bại 5 game thủ có mức rank cao tới 6.500+ MMR (top 0,05% thế giới).
Vậy thực sự OpenAI tiên tiến và thông minh ra sao? Và làm cách nào để chúng không chỉ chiến thắng người chơi tâm phục khẩu phục, mà thậm chí còn biết cả cách trêu tức đối phương?
Khiến cả thế giới chấn động tại The International 7
Chúng ta lần đầu tiên được “diện kiến” OpenAI tại sự kiện “The International 2017” - giải đấu hàng chục tỷ USD của Valve nhằm chọn ra đội Dota 2 vô địch thế giới.
Với sự hỗ trợ của Elon Musk, tham vọng của OpenAI là để đảm bảo trong tương lai trí thông minh nhân tạo sẽ chỉ phục vụ với mục đích tích cực cho con người, thay vì những viễn cảnh như Ma Trận hay Skynet.
Tuy nhiên ở thời điểm đó, có thể nói OpenAI đã khiến cả cộng đồng game thủ lẫn giới công nghệ phải bàng hoàng, thậm chí sợ hãi. Lý do? OpenAI lần lượt đánh bại tất cả những game thủ chuyên nghiệp giỏi nhất thời bấy giờ trong thể thức 1 vs 1 Shadowfiend. Ngay cả thần đồng Dota 2 người Canada Artour "Arteezy" Babaev cũng phải lắc đầu ngao ngán.
Đến đây, nhiều người sẽ tự hỏi: Vì sao OpenAI lại đem nỗi kinh hoàng “máy móc chiến thắng con người” đến Dota 2 mà không phải những tựa game khác?
Lý do chọn Dota 2 làm điểm đến
Không hề giống những game đơn giản như cờ vua hay xếp hình, v.v… Dota 2 đòi hỏi người chơi phải có một kiến thức sâu rộng về tất cả các mặt của game, thậm chí ngay cả khi bạn có trình độ thượng thừa thì vẫn phải suy đoán các khả năng ra quyết định của đối thủ.
Ví dụ như 1 game Dota 2 trung bình sẽ dài khoảng 45 phút với 30 khung hình/1 giây, từ đó 1 game đấu sẽ có tổng cộng 80.000 khung hình. Cứ 4 khung hình, OpenAI lại kiểm tra lại một lần và sau đó đưa ra một quyết định hành động.
Như vậy, nó sẽ phải đưa ra 20.000 quyết định trong 1 game, con số này chỉ là 40 với cờ vua và 150 với cờ tướng. Nếu phác thảo “cây quyết định” (decision tree) của chúng ra thì có thể có tới hàng nghìn nhánh, thậm chí nhiều hơn.
Ngoài ra, trong không chỉ Dota 2 mà tất cả các game Moba khác, luôn đòi hỏi 5 thành viên trong một đội cần kết hợp ăn ý cùng nhau tiến tới chiến thắng. Chính vì vậy, OpenAI cũng không thể “cheat” mà bắt buộc phải hành động, hỗ trợ nhau và tự phán đoán như 5 người chơi bình thường. Có lẽ đây là những lý do vì sao, đội ngũ OpenAI lại chọn Dota 2.
Tự đấu với chính mình với khối lượng game bằng 180 năm/ngày
Khác với con Bot năm 2017 chỉ biết đối đầu 1 vs 1 và chạy trên nền tảng Azure60.000 nhân xử lý, thì nay 5 con Bot “OpenAI Five” của 2018 đã được phát triển trên một nền tảng mới hoàn toàn, đó là Google Cloud với 128.000 nhân.
Đội ngũ của OpenAI cũng cho chúng tự đối đầu với nhau trong một khối lượng game bằng 180 năm/ngày. Trong đó Bot sẽ tự học từ phiên bản trước của chính nó, cứ như vậy, qua hàng ngàn ngàn trận đấu, hình thành nên một trí tuệ nhân tạo tính toán tới mọi khía cạnh của game và tìm ra yếu tố làm tăng tỷ lệ thắng.
Mặc dù có tới 115 hero (tướng) trong Dota 2 nhưng hiện OpenAI vẫn chỉ có thể chơi với 18 tướng, cũng một số lợi thế khác (chúng ta vẫn an toàn). Tuy nhiên, nó vẫn đủ sức thắng gọn cả 5 game thủ gạo cội đại diện cho 99,95% người chơi toàn thế giới.
“Bọn ta ước lượng tỷ lệ thắng là hơn 95%”
Đó chính là câu “chat-all” vừa gây cười, vừa khiến nhiều người phải ám ảnh của OpenAI Five trong trận đấu gần đây. Ngay khi vào game, 1 con BOT đại diện cho team AI đã nhanh chóng đưa ra nhận định: “Bọn ta ước lượng tỷ lệ thắng là hơn 80%”.
Không dừng lại, chỉ vài giây sau, tỷ lệ dự đoán của chúng lại tăng lên 90% và 95%, khiến cho cả khán giả và team con người khá “nóng mặt”. Điều này cũng có nghĩa, chúng thay đổi quyết định và dự đoán của mình trong thời gian chỉ tính bằng giây.
“Bọn ta ước lượng tỷ lệ thắng là hơn 95%”
Thực chất, OpenAI đã tự tính toán khả năng thắng của mình ngay từ khâu chọn tướng, hay còn được gọi là “draft” - một trong những việc khó nhất trong Dota 2. Đội ngũ của OpenAI đã dạy cho con BOT 11 triệu khả năng kết hợp giữa các hero với nhau, từ đó giúp chúng đưa ra quyết định chọn đội hình tối ưu nhất có thể.
Kết quả? 2 game đấu đầu tiên OpenAI đã “nghiền nát” team con người một cách tâm phục khẩu phục chỉ trong chưa đầy 40 phút.
AI tính toàn khả năng thắng thông qua từng lượt ban/pick đội hình tướng
Lối chơi của chúng là liên tục tạo áp lực, tập trung chủ yếu vào những mục tiêu cụ thể, như phá hủy trụ team địch, kiểm soát bản đồ và luôn giữ cho lượng máu/mana của mình ổn định trong những pha combat dài hơi. Chính điều này đã khiến team con người bất ngờ và rơi vào thế bị động, không có đủ thời gian để farm được những item cần thiết cho game đấu.
Làm những thứ hoàn toàn khác biệt với con người
Thông thường trong một team Dota 2, vị trí “carry” (có khả năng gây sát thương nhiều nhất trong team) sẽ là vị trí được farm nhiều nhất. Tuy nhiên OpenAI lại cho những “support” (một vị trí thiên về khả năng hỗ trợ) lại được farm trước, thậm chí còn có được nhiều gold và kinh nghiệm hơn carry.
OpenAI đã dự đoán được các chỉ số trong vòng 8 phút tới trong game
Tiếp theo, OpenAI còn có khuynh hướng ra chiêu liên tục ngay khi nhìn thấy đối thủ để tạo áp lực (vô cùng hiếu chiến và thích gây hấn). Ví dụ như support của team con người là Crystal Maiden, chỉ cần xuất hiện đã bị mất nửa cột máu do chiêu cuối của Sniper nhằm vào mình liên tục.
Điều này cũng hoàn toàn có lợi cho chúng, bởi khi đã rút máu được đối thủ từ khoảng cách xa, khi combat 5 đánh 5 nổ ra, AI sẽ dễ kết liễu đối phương hơn và đem lại nhiều lợi thế cho team mình.
OpenAI vẫn có điểm yếu
OpenAI có một điểm yếu khá nhạt nhẽo, đó là khả năng last-hit rất kém. (Last hit: Tung đòn kết liễu lên lính để có được lượng gold nhất định). Chúng thường bỏ qua khâu này hoặc trong một số trường hợp, tung đòn không được… chính xác cho lắm.
Sau 2 game đấu đầu, thay vì để OpenAI tự chọn đội hình tướng, team con người đành phải nhờ đến khán giả để quyết định và đưa cho chúng 5 hero vô cùng bất lợi. Những hero không có các chiêu thức làm chậm, gây choáng, cần nhiều thời gian farm.
Ngay sau khi game khởi động, OpenAI thậm chí còn dự đoán luôn kết cục của mình chỉ có 2,9% chiến thắng. Mặc dù vậy, team con người vẫn cần tới hơn 30 phút để đánh bại chúng.
Một game khi đội ngũ OpenAI cho các con BOT thoải mái mua mango, kết quả là chúng mua tới hàng trăm trái
Game cuối cũng cho thấy một điểm yếu nữa của OpenAI. Ở một số thời điểm của game, BOT Slark (một hero rất yếu ở giai đoạn đầu game) không hề biết trốn khỏi đối thủ và đi farm, thay vào đó, nó vẫn lộ diện và để chết nhiều pha khá nhảm nhí.
Và bây giờ đây, The International 8 đã chính thức bắt đầu bắt đầu. Kết quả trên của OpenAI tốt đến nỗi, Valve còn đích thân mời các team chuyên nghiệp luyện tập với OpenAI khi giải đấu đang diễn ra, công ty của Gaben cũng sẽ sắp xếp để lịch tập luyện phù hợp nhất với lịch thi đấu.
Hi vọng khán giả sẽ được một lần chứng kiến OpenAI đối đầu với đội mạnh nhất mùa giải năm nay.
Tham khảo Arstechnica