Những người thông minh hơn AI

Google DeepMind và OpenAI đã giành huy chương vàng tại Olympic toán học, nhưng những thiếu niên người Mỹ trong đội tuyển vẫn đạt điểm cao hơn hai cỗ máy này.

IMO 2025 được tổ chức từ ngày 10-20/7, tại thành phố Sunshine Coast, bang Queensland, Australia, với 630 thí sinh tham dự. Trong số đó, 67 thí sinh (khoảng 11%) đã đạt được huy chương vàng. Việc AI cũng đạt được thành tích tương tự là một cột mốc lịch sử.

Đây là năm đầu tiên cuộc thi IMO chính thức phối hợp với một số nhà phát triển AI. Các giám khảo IMO đã xác nhận kết quả của các công ty hợp tác, bao gồm Google, và yêu cầu họ công bố kết quả vào ngày 28/7.

Tuy nhiên, kết quả chung cuộc cho thấy những cỗ máy tiên tiến và hiện đại nhất vẫn bị đánh bại bởi những thiếu niên sáng giá nhất thế giới.

Bức tường cuối của nhân loại?

Kỳ thi IMO nổi tiếng khắc nghiệt được tổ chức trong hai ngày. Mỗi ngày trôi qua, học sinh phải giải 3 bài toán ngày càng tăng trong vòng hơn 4 giờ. Các câu hỏi bao gồm đại số, hình học, lý thuyết số và tổ hợp.

Vì những vấn đề vừa phức tạp vừa phi truyền thống, bài kiểm tra toán học hàng năm đã trở thành một công cụ hữu ích để đo lường tiến bộ của AI từ năm này sang năm khác. Trong thời đại phát triển nhanh chóng, các phòng thí nghiệm nghiên cứu hàng đầu mơ ước một ngày các hệ thống của họ đủ mạnh để đạt tiêu chuẩn huy chương vàng IMO.

Dù tham vọng này đã thành hiện thực khi AI của Google và OpenAI đã đạt huy chương vàng, điều đáng chú ý là có tới 26 học sinh đạt điểm cao hơn.

Trong số này, có 4 ngôi sao của đội tuyển Mỹ, bao gồm Qiao Zhang, người từng hai lần giành huy chương vàng và Alexander Wang, thí sinh đã mang huy chương vàng thứ 3 liên tiếp về New Jersey. Với thành tích này, Wang trở thành một trong những nhân vật toán học trẻ xuất sắc mọi thời đại, và vẫn có thể giành thêm một huy chương vàng nữa tại IMO vào năm tới.

Đội tuyển Mỹ tại Olympic Toán quốc tế 2025. Ảnh: WSJ.
Đội tuyển Mỹ tại Olympic Toán quốc tế 2025. Ảnh: WSJ.

Trả lời tờ WSJ, Zhang cho biết dành thời gian dài nhất trong kỳ thi cho bài toán số 6. Đây là một bài toán trong lĩnh vực tổ hợp nổi tiếng với độ khó không tưởng, bao gồm nhánh toán học liên quan đến việc đếm, sắp xếp và kết hợp các đối tượng rời rạc.

Lời giải cho bài toán này đòi hỏi sự khéo léo, sáng tạo và trực giác mà con người có thể phát huy nhưng máy móc thì không thể, hoặc ít nhất là chưa. "Tôi thực sự sẽ hơi sợ nếu các mô hình AI có thể giải Bài toán số 6", Zhang nói.

Bài toán số 6 đã làm khó các mô hình của DeepMind và OpenAI, nhưng nó không chỉ gây khó khăn cho AI. Trong số 630 thí sinh, 569 người cũng nhận được điểm 0. Chỉ 6 người nhận được điểm tuyệt đối là 7 điểm. Zhang tự hào về giải pháp một phần của mình đã giành được 4 điểm, nhiều hơn so với hầu hết thí sinh khác.

Với sự tiến bộ không ngừng, đã có nhiều ý kiến cho rằng AI có thể đang "hủy diệt" con người trong toán học. Tuy nhiên, Junehyuk Jung không nghĩ vậy.

Từng giành huy chương vàng IMO, Jung hiện là phó giáo sư tại Đại học Brown và nhà nghiên cứu thỉnh giảng tại DeepMind. Tuy nhiên, ông không tin đây là trận chiến cuối cùng của nhân loại. Theo Jung, những vấn đề như Bài toán số 6 sẽ làm khó AI ít nhất một thập kỷ nữa.

"Có những điều AI sẽ làm rất tốt. Tuy nhiên, vẫn sẽ có những thứ mà con người có thể làm tốt hơn", Jung nhận xét.

Cuộc đua vàng của làng toán học

Năm 2021, sinh viên có tên Alexander Wei là một phần của nghiên cứu yêu cầu anh dự đoán khả năng về toán học của AI vào tháng 7/2025. Khi xem xét các dự báo khác, Wei nghĩ điều này là quá lạc quan.

Tuy nhiên, cựu sinh viên này giờ đây lại là bằng chứng sống về việc bản thân đã sai lầm đến mức nào. Wei chính là nhà khoa học nghiên cứu đã dẫn dắt dự án IMO cho OpenAI. Điều ấn tượng hơn là cách chúng làm điều đó.

Không chỉ OpenAI, Google cũng gọi kết quả tại IMO 2025 là một tiến bộ lớn. Năm 2024, mô hình AI cần các bài toán phải được dịch sang ngôn ngữ lập trình máy tính để chứng minh toán học.

Chỉ sau một năm, các hệ thống này đã hoạt động hoàn toàn bằng "ngôn ngữ tự nhiên" mà không cần bất kỳ sự can thiệp nào của con người. DeepMind cũng hoàn thành kỳ thi trong giới hạn thời gian 4 tiếng rưỡi của IMO. Để so sánh, năm 2024, hệ thống này phải mất đến vài ngày tính toán để tìm ra lời giải.

Nhiều người có thể nghĩ về AI như một đối thủ cạnh tranh. Mặc dù vậy, người đứng sau các mô hình lại xem chúng là những công cụ bổ sung.

Kết quả chung cuộc tại Olympic Toán quốc tế 2025. Ảnh: WSJ.
Kết quả chung cuộc tại Olympic Toán quốc tế 2025. Ảnh: WSJ.

"Đây có lẽ có thể là một máy tính mới, thứ sẽ thúc đẩy thế hệ các nhà toán học tiếp theo", TS Lương Minh Thắng, nhà nghiên cứu cao cấp tại Google (Mỹ) nói.

Ba tuần trước, nhóm của TS Minh Thắng phát triển thành công phiên bản AlphaGeometry 2. Điểm nổi bật nhất của phiên bản lần này là trình độ giải Toán vượt qua các thí sinh đạt huy chương vàng Olympic Toán quốc tế (IMO) về giải Toán hình học.

“Các bạn trình độ huy chương vàng IMO giải được 40/50 bài toán thì AlphaGeometry 2 sẽ giải được 42/50 bài”, TS Thắng vui mừng chia sẻ.

Năm ngoái, mô hình này chỉ đạt được huy chương bạc. Năm nay, Google sử dụng mô hình đa năng Gemini Deep Think (một phiên bản từng được giới thiệu tại hội nghị nhà phát triển vào tháng 5).

Đáng chú ý, theo WSJ, trước khi cuộc thi bắt đầu, nhóm của TS Thắng vẫn đang thực hiện các điều chỉnh. Ban đầu, TS Thắng chỉ kỳ vọng mô hình của DeepMind giải quyết được cả 3 bài toán trong ngày đầu tiên

Sự đơn giản, thanh lịch và khả năng đọc hiểu tuyệt vời của những giải pháp đó đã làm kinh ngạc các nhà toán học. Ngày hôm sau, ngay khi Thắng và các đồng nghiệp phát hiện hệ thống AI đã giải được thêm 2 bài nữa, đó cũng là lúc họ nhận ra rằng hoàn toàn có thể giành huy chương vàng.

Kết quả, AI DeepMind giải thành công 5/6 bài toán. Đáng chú ý, chúng đều sử dụng các mô hình lý luận thực nghiệm, xử lý các khái niệm toán học bằng ngôn ngữ tự nhiên, khác hẳn với những cách tiếp cận phức tạp mà các công ty AI từng dùng trước đây.

znews.vn

Đọc thêm

Trung Quốc công bố 'chip dạng sợi' mỏng như tóc

Trung Quốc công bố 'chip dạng sợi' mỏng như tóc

Theo SCMP, các nhà khoa học Trung Quốc vừa tạo ra một bước đột phá trong công nghệ điện tử khi tích hợp thành công các mạch điện tử phức tạp vào những sợi dây dẻo, co giãn và mỏng như sợi tóc con người.
Có gì trong phần mềm "Trợ lý ảo AI đa lĩnh vực”?

Có gì trong phần mềm "Trợ lý ảo AI đa lĩnh vực”?

Dự án Trợ lý ảo AI đa lĩnh vực đã giành giải Nhất Cuộc thi Khởi nghiệp đổi mới sáng tạo Hà Tĩnh năm 2025, góp phần thúc đẩy chuyển đổi số và nâng cao hiệu quả phục vụ người dân, doanh nghiệp.
8 đột phá y học 2025

8 đột phá y học 2025

National Geographic vừa công bố 8 đột phá y học 2025, từ thuốc ngừa HIV tiêm 2 lần mỗi năm, chỉnh sửa gene cá nhân hóa đến tái tạo chi, mở ra kỷ nguyên chăm sóc sức khỏe mới.
VinFuture 2025 vinh danh 4 công trình khoa học "cùng vươn mình - cùng thịnh vượng"

VinFuture 2025 vinh danh 4 công trình khoa học "cùng vươn mình - cùng thịnh vượng"

Quỹ VinFuture chính thức công bố các Chủ nhân Giải thưởng VinFuture 2025. 4 công trình khoa học công nghệ xuất sắc được vinh danh đã khẳng định nhất quán chủ điểm năm nay là “Cùng vươn mình – Cùng thịnh vượng”, thể hiện vai trò hợp tác khoa học xuyên biên giới để cùng giải quyết các thách thức toàn cầu về y tế, môi trường và sinh kế cho nhân loại.
Nhà khoa học VinFuture hiến kế để chung sống an toàn khi AI thông minh hơn con người

Nhà khoa học VinFuture hiến kế để chung sống an toàn khi AI thông minh hơn con người

Tốc độ phát triển của trí tuệ nhân tạo (AI) đang diễn ra nhanh hơn bất kỳ cuộc cách mạng công nghệ nào trước đây, đẩy nhân loại vào một tình huống chưa từng có tiền lệ: phải nghĩ cách chung sống với một thực thể thông minh hơn chúng ta. Tại Tọa đàm “AI vì nhân loại: Đạo đức và an toàn AI trong kỷ nguyên mới” diễn ra chiều 2/12, các nhà khoa học VinFuture đã thảo luận nhiều “kế sách” hay.
4 công nghệ mở đường cho tương lai gây chú ý tại Tuần lễ VinFuture 2025

4 công nghệ mở đường cho tương lai gây chú ý tại Tuần lễ VinFuture 2025

Lần đầu tiên được tổ chức, “Diễn thuyết truyền cảm hứng: Công nghệ đột phá tương lai”, diễn ra sáng 2/12 tại Hà Nội, đã mang đến một khởi đầu đầy ấn tượng cho Tuần lễ Khoa học - Công nghệ VinFuture 2025. 4 nhà khoa học quốc tế đã mang đến 4 câu chuyện đổi mới đang tái định hình tương lai thế giới, với chung 1 tầm nhìn là khoa học phục vụ con người.
Các nhà khoa học hàng đầu thế giới hiến kế nuôi sống 10 tỷ người tại Tuần lễ KHCN VinFuture 2025

Các nhà khoa học hàng đầu thế giới hiến kế nuôi sống 10 tỷ người tại Tuần lễ KHCN VinFuture 2025

Biến đổi khí hậu đang đẩy nông nghiệp toàn cầu vào vòng xoáy bất ổn, đe dọa an ninh lương thực của gần 10 tỷ người trong tương lai. Tại Tuần lễ KHCN VinFuture 2025, các nhà khoa học hàng đầu thế giới sẽ cùng thảo luận về những đổi mới có thể giúp nhân loại nuôi sống hành tinh một cách bền vững.
Khi AI “vẽ” giấc mơ an cư

Khi AI “vẽ” giấc mơ an cư

Trong bối cảnh đô thị "đất chật người đông", việc ứng dụng AI giúp các kiến trúc sư phá vỡ những giới hạn về không gian, tạo ra những ngôi nhà phố thông minh và giàu cảm xúc.