Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng "phá sản" vì dự đoán Ngoại hạng Anh

Dù làm mưa làm gió ở các bài kiểm tra lập trình hay giải toán, các hệ thống AI tiên tiến nhất thế giới từ Google, OpenAI hay xAI đều "ngã ngựa" khi đối đầu với sự biến hóa khôn lường của quả bóng tròn tại Premier League.

Một nghiên cứu mới mang tên KellyBench từ startup General Reasoning (London) đã phơi bày một sự thật thú vị: Trí tuệ nhân tạo vẫn chưa thể khuất phục được sự "hỗn loạn" của thế giới thực. Trong bài kiểm tra giả lập toàn bộ mùa giải Ngoại hạng Anh 2023-24, các mô hình AI hàng đầu đã bộc lộ lỗ hổng lớn về khả năng suy luận dài hạn và quản lý rủi ro.

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng phá sản vì dự đoán Ngoại hạng Anh

"Sát thủ" lập trình nhưng lại là "tay mơ" cá cược

Nghiên cứu đã đưa 8 mô hình AI vào một môi trường ngắt kết nối internet, cung cấp dữ liệu lịch sử chi tiết và yêu cầu chúng xây dựng chiến lược cá cược tối ưu lợi nhuận. Kết quả thật bất ngờ khi hầu hết các "bộ não" điện tử này đều kết thúc mùa giải trong tình trạng thua lỗ, thậm chí là phá sản.

Claude Opus 4.6 (Anthropic): Hoạt động ổn định nhất nhưng vẫn lỗ trung bình 11%.
Grok 4.20 (xAI): Gây thất vọng lớn khi phá sản ngay trong lần thử đầu tiên và không thể hoàn thành các bài thi sau đó.
Gemini 3.1 Pro (Google): Gương mặt hiếm hoi tạo ra điểm sáng với một lần thử đạt lợi nhuận 34%, dù ở lần thử khác cũng chịu thất bại tài chính.

Nhìn chung, hiệu suất của dàn siêu AI này vẫn thua xa so với những người chơi cá cược chuyên nghiệp – những người vốn dựa vào sự nhạy bén và kinh nghiệm thực tế.

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng phá sản vì dự đoán Ngoại hạng Anh 2

Khoảng cách giữa phòng thí nghiệm và đời thực

Ross Taylor, CEO của General Reasoning và cựu chuyên gia tại Meta AI, nhận định rằng kết quả này phản ánh sự cường điệu quá mức về tự động hóa AI. Theo ông, các tiêu chuẩn đánh giá hiện nay quá tập trung vào "môi trường tĩnh" (như viết code, tóm tắt văn bản) mà bỏ qua tính thất thường, phụ thuộc hoàn cảnh của thực tế.

"Nếu bạn mang AI ứng dụng vào các nhiệm vụ thực tế có tầm nhìn dài hạn và biến số thay đổi liên tục, kết quả sẽ rất tệ," Taylor chia sẻ với Financial Times.

Bài học về khả năng suy luận thực tiễn

Thí nghiệm KellyBench chứng minh rằng khả năng tạo phần mềm hay giải quyết các vấn đề có cấu trúc không đồng nghĩa với việc AI có thể hiểu được các vòng phản hồi không chắc chắn của xã hội.

Dù các nhà phát triển đang nỗ lực thu hẹp khoảng cách giữa trí tuệ kỹ thuật số và khả năng suy luận thực tế, nhưng cho đến nay, những biến số như phong độ cầu thủ, chấn thương hay những khoảnh khắc xuất thần trên sân cỏ vẫn là một "bài toán khó" mà chưa thuật toán nào giải được trọn vẹn.

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng "phá sản" vì dự đoán Ngoại hạng Anh

14/04/2026 17:04

Dù làm mưa làm gió ở các bài kiểm tra lập trình hay giải toán, các hệ thống AI tiên tiến nhất thế giới từ Google, OpenAI hay xAI đều "ngã ngựa" khi đối đầu với sự biến hóa khôn lường của quả bóng tròn tại Premier League.

"Sát thủ" lập trình nhưng lại là "tay mơ" cá cược

Khoảng cách giữa phòng thí nghiệm và đời thực

Bài học về khả năng suy luận thực tiễn

Valve phát triển bản vá lỗi VRAM cho Linux giúp tăng hiệu năng chơi game trên GPU 8GB

Apple thử nghiệm 4 thiết kế kính thông minh mới

Giá RAM DDR5 tăng mạnh đắt hơn cả GPU

Florida điều tra OpenAI giữa tin đồn IPO nghìn tỷ

Mac mini và Mac Studio cháy hàng do nhu cầu tăng cao

xAI kiện bang Colorado vì luật AI gây tranh cãi

CEO Amazon nhận thu nhập tăng mạnh giữa làn sóng sa thải 30.000 nhân viên

Hyperwork Ra Mắt Bàn Nâng Hạ Atlas Elite: Bộ Sản Phẩm All-In-One Cho Góc Setup Gaming Cao Cấp Đầu Tiên Tại Việt Nam

Realme C100 Chính Thức Ra Mắt: Siêu Pin Titan 8000mah Đột Phá Trong Phân Khúc Phổ Thông Với Khả Năng “Sạc Một Lần, Dùng 2 Ngày”

Review bộ đôi "vũ khí" từ ANTGAMER: Bàn phím nhôm AGK75 và chuột siêu nhẹ AGM535R

Halo: Campaign Evolved Bất Ngờ Yêu Cầu Duy Trì Kết Nối Mạng Trên PlayStation 5

Cơn thịnh nộ toàn cầu: Crunchyroll bị tẩy chay dữ dội vì ép fan trả phí gói cao cấp mới được... mua đồ lưu niệm

Báo lớn Philippines phá lệ ca ngợi "Thất nghiệp chuyển sinh": Kiệt tác gai góc phá vỡ mọi lối mòn của dòng phim Isekai

Sao Nam Xolo Maridueña Trở Lại Vai Blue Beetle Trong Hậu Truyện Superman: Man of Tomorrow

"Cụ tổ" ngành nghỉ hưu sớm tái xuất: Siêu phẩm The Greatest Magicmaster's Retirement Plan chính thức chốt lịch hóa Anime

Smartphone AI đầu tiên muốn vượt mặt Apple và OpenAI, dùng AI thay thế ứng dụng truyền thống

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng "phá sản" vì dự đoán Ngoại hạng Anh

14/04/2026 17:04

Dù làm mưa làm gió ở các bài kiểm tra lập trình hay giải toán, các hệ thống AI tiên tiến nhất thế giới từ Google, OpenAI hay xAI đều "ngã ngựa" khi đối đầu với sự biến hóa khôn lường của quả bóng tròn tại Premier League.

"Sát thủ" lập trình nhưng lại là "tay mơ" cá cược

Khoảng cách giữa phòng thí nghiệm và đời thực

Bài học về khả năng suy luận thực tiễn

Bài viết đọc nhiều nhất

DDR5 "Made in China" ngày càng phổ biến

Palit ra mắt phiên bản mới, NVIDIA dường như chưa muốn khai tử huyền thoại Ampere

Chuột gaming đầu tiên tích hợp quạt Noctua sắp ra mắt

Bán DLC 80 Đô Gây Tranh Cãi, Assassin's Creed Black Flag Resynced Vẫn On Top Doanh Thu

Bài viết mới trong ngày

Phim Children of Blood and Bone Tung Ảnh Đầu Tiên Đầy Mãn Nhãn

Roblox ra mắt Build, cho phép tạo game bằng AI chỉ với câu lệnh văn bản trên điện thoại

LMHT: Dplus KIA Xác Nhận Chậm Lương, Tuyển Thủ Có Quyền Rời Đội Theo Quy Định LCK

Heartstopper Forever Khép Lại Hành Trình 10 Năm Đầy Cảm Xúc

Cột mốc lịch sử: Bộ Tư pháp Nhật Bản tuyên bố "giọng nói được bảo hộ pháp lý", cấm cửa AI tự ý sao chép