Phát hiện 'gót chân Achilles' của AI: Thua cuộc trước những trò chơi tưởng chừng đơn giản

Các AI hàng đầu như AlphaGo của DeepMind, vốn bất khả chiến bại trong cờ vây và cờ vua, lại bộc lộ điểm yếu chết người trước một loại trò chơi đơn giản gọi là 'trò chơi công bằng'. Phát hiện này không chỉ là một câu chuyện thú vị về game, mà còn là lời cảnh báo quan trọng về việc xác định và khắc phục các 'điểm mù' của AI trước khi chúng được ứng dụng rộng rãi.
Với loạt AI chơi game thuộc series Alpha, nhóm DeepMind của Google dường như đã tìm ra công thức để trí tuệ nhân tạo chinh phục bất kỳ trò chơi nào. Bằng cách liên tục tự đấu với chính mình trong quá trình huấn luyện, các AI này đã làm chủ những đấu trường trí tuệ phức tạp như cờ vua và cờ vây. Tuy nhiên, một vài sự việc kỳ lạ đã xảy ra khi người ta phát hiện ra những thế cờ vây có thể thua trước những người mới chơi, nhưng lại dễ dàng đánh bại một AI chơi cờ vây sừng sỏ.
Việc đánh bại một AI trong một ván cờ có vẻ không quá to tát, nhưng nó lại giúp chúng ta xác định được các “chế độ lỗi” (failure modes) của AI. Từ đó, các nhà nghiên cứu có thể cải thiện phương pháp huấn luyện để ngăn chúng hình thành những “điểm mù” ngay từ đầu. Đây là yếu tố có thể trở nên cực kỳ quan trọng khi con người ngày càng phụ thuộc vào các quyết định của AI trong nhiều lĩnh vực khác nhau.
Một bài báo khoa học gần đây được công bố trên tạp chí Machine Learning đã mô tả toàn bộ một nhóm trò chơi mà phương pháp huấn luyện của AlphaGo và AlphaChess hoàn toàn thất bại. Đáng chú ý, những trò chơi này có thể cực kỳ đơn giản, điển hình là trò Nim mà các nhà nghiên cứu đã sử dụng. Nim là một trò chơi hai người, trong đó người chơi lần lượt bốc các que diêm ra khỏi một bàn cờ hình kim tự tháp cho đến khi một người không còn nước đi hợp lệ.
Trò chơi Công bằng (Impartial Games)
Luật chơi của Nim rất đơn giản: một bộ các que diêm được xếp thành nhiều hàng, hàng trên cùng có một que, và mỗi hàng bên dưới lại có nhiều hơn hàng trên nó hai que, tạo thành một hình kim tự tháp. Hai người chơi lần lượt thực hiện nước đi bằng cách chọn một hàng bất kỳ và bốc đi từ một cho đến toàn bộ số que diêm trong hàng đó. Ván cờ kết thúc khi không còn nước đi hợp lệ nào. Đây là một trò chơi đơn giản đến mức có thể dễ dàng dạy cho trẻ em.
Thế nhưng, Nim lại là một ví dụ quan trọng cho cả một loại quy tắc định nghĩa nên “trò chơi công bằng” (impartial games). Các trò chơi này khác với những trò như cờ vua, nơi mỗi người chơi có một bộ quân cờ riêng. Trong các trò chơi công bằng, cả hai người chơi đều dùng chung các quân cờ và bị ràng buộc bởi cùng một bộ quy tắc. Tầm quan trọng của Nim xuất phát từ một định lý cho thấy rằng bất kỳ thế cờ nào trong một trò chơi công bằng đều có thể được biểu diễn bằng một cấu hình của kim tự tháp Nim. Điều này có nghĩa là, nếu một quy luật nào đó áp dụng cho Nim, nó sẽ áp dụng cho tất cả các trò chơi công bằng khác.
Nguồn: Ars Technica AI

