Siêu AI có thể học cách chơi game Atari nhanh hơn 6.000 lần so với trước đây

Trước đây, các mô hình AI phải mất nhiều thời gian và dữ liệu để có thể học, cũng như giải quyết các vấn đề mà con người có thể tiếp thu gần như ngay lập tức.

Các mô hình AI được đánh giá là hoàn hảo hơn con người trong nhiều lĩnh vực như vẽ, tính toán,... nhưng với việc tiếp thu thì hoàn toàn không. Các mô hình AI phải mất nhiều thời gian và dữ liệu để có thể học, cũng như giải quyết các vấn đề mà con người có thể tiếp thu gần như ngay lập tức.

Mới đây, các nhà nghiên cứu Đại học Carnegie Mellon (CMU) phát hiện ra cách giúp AI nhằm tăng tốc kỹ năng tiếp thu và đưa ra hướng giải quyết nhanh nhất từ trước đến giờ, còn được gọi là Deep Q-Network.

Siêu AI có thể học các chơi game Atari nhanh hơn 6.000 lần so với trước đây

Xem thêm: Mantra Engine: Mô hình AI mới được phát triển để dịch truyện manga sang tiếng Anh

Cụ thể, các nhà nghiên cứu đã nghĩ cách tích hợp thuật toán Deep Q-Network để có thể đọc hướng dẫn sử dụng sản phẩm, trong đó có cả game.

Cho đến nay, họ đã thành công trong việc dạy AI chơi các tựa game Atari đầy thử thách nhanh hơn 6.000 lần so với mô hình do DeepMind phát triển.

Nhóm nghiên cứu bắt đầu bằng cách tóm tắt thông tin chính từ sách hướng dẫn của game và đào tạo cho AI. Dữ liệu này sau đó được sử dụng để đặt câu hỏi về trò chơi cho một mô hình ngôn ngữ được đào tạo trước. 

Siêu AI có thể học các chơi game Atari nhanh hơn 6.000 lần so với trước đây

Xem thêm: AI có thể ghi lại giấc mơ của con người, bằng cách quét sóng não

Các câu trả lời thu được sau đó được sử dụng để tạo ra nhằm củng cố cho AI kiến thức và được đưa vào thuật toán học tăng cường đã được thiết lập, giúp nó tìm hiểu trò chơi nhanh hơn.

Các nhà nghiên cứu đã thử nghiệm nghiên cứu của mình trên Skiing 6000, một tựa game mà AI phải chạy qua 80 tỷ khung hình của trò chơi để đạt được hiệu suất tương đương với con người.

Vào năm 2013, CMU phát triển thành công Deep Q-Network (DQN) giúp AI học cách chơi trò chơi Atari bằng cách thử và sai. Hệ thống AI được cung cấp dữ liệu pixel thô từ game và được giao mục tiêu tối đa hóa điểm số của nó. 

Qua hàng ngàn lần thử, DQN dần dần biết được hành động nào dẫn đến điểm cao hơn và hành động nào dẫn đến điểm thấp hơn.

Kết quả đáng kinh ngạc khi mà DQN đã có thể vượt trội so với người chơi trong nhiều tựa game Atari, bao gồm các tựa game cổ điển như Breakout, Space Invaders và Pong.

Sau thành công ban đầu, CMU sẽ bắt đầu thử nghiệm sang các trò chơi 3D phức tạp hơn như Minecraft. Với kết quả ban đầu đầy hứa hẹn và đang tìm cách đánh giá mức độ cải tiến nhanh chóng trong các mô hình ngôn ngữ AI có thể đóng vai trò là chất xúc tác cho sự tiến bộ ở những nơi khác trong lĩnh vực này. 

Bài viết liên quan

Bài viết đọc nhiều nhất

Lên đầu trang