AI chỉ mất 10 giây để giải bài toán thi tốt nghiệp THPT

Có chatbot chỉ tốn trung bình 10 giây cho mỗi câu hỏi ở đề thi toán tốt nghiệp THPT năm 2025. Kết quả cho ra khá ấn tượng, nhưng không thể hiện rõ quá trình suy luận của AI.

Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.
Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.

Chiều 26/6, các thí sinh hoàn thành bài thi môn toán trong kỳ thi tốt nghiệp THPT năm 2025, với thời gian làm bài 90 phút. Đây là đề thi đầu tiên sau khi Bộ Giáo dục và Đào tạo áp dụng hình thức mới, được cho là khó hơn so với những năm trước.

Trong khi đề toán năm nay có thể làm khó thí sinh vì dài, tốn thời gian, các chatbot AI không mất nhiều thời gian để xử lý. Để thử nghiệm độ hiệu quả của AI, Tri Thức - Znews sử dụng 4 chatbot bao gồm ChatGPT, Google Gemini, Claude AI và Grok AI để giải một số câu hỏi tự luận của đề thi tốt nghiệp THPT năm nay.

Xử lý nhanh, kết quả "hên xui"

Các chatbot được sử dụng để trả lời phần câu hỏi ngắn của mã đề 0109. Trong đó, ChatGPT và Gemini cho ra kết quả đúng nhất với độ trễ ít. Cả 2 chatbot đều trả lời được 6 câu hỏi với thời gian từ 7-15 giây cho mỗi câu. Tuy nhiên, Gemini đã có thể giải được các bài toán trên với mô hình 2.5 Flash (không suy luận), giúp xử lý nhanh toàn diện.

Trong khi đó, Claude hoàn toàn thất bại ở khả năng tính toán, cho ra toàn bộ kết quả không đúng. Mặc dù được yêu cầu tính lại, chatbot của Anthropic vẫn đưa ra đáp án cũ. Grok trả lời đúng khoảng một nửa số câu hỏi, nhưng với thời gian phản hồi lâu (hơn 2 phút cho một câu).

Đối với ChatGPT và Grok, để giải được các câu hỏi này cần dùng đến phiên bản suy luận, sẽ tiêu tốn thời gian nhiều hơn. Gemini vừa xử lý với tốc độ rất nhanh, có thể chỉ 5 giây với câu nhanh nhất, vừa chỉ sử dụng mô hình 2.5 Flash.

ChatGPT trình bày quá trình suy nghĩ rất sinh động.
ChatGPT trình bày quá trình suy nghĩ rất sinh động.

Xét về tốc độ, Gemini có thời gian xử lý nhanh nhất, trung bình một bài chưa đến 10 giây, nhưng có lời giải phức tạp, rườm rà và khó theo sát hơn. Tiếp đến là mô hình suy luận của ChatGPT có trung bình thời gian xử lý là 25 giây. Trong khi đó, dù vẫn ra kết quả đúng, Grok mất rất nhiều thời gian suy luận, với 148 giây cho một câu hỏi độ khó tương đối.

Dù được hỏi bằng tiếng Việt, cả 3 mô hình đều thể hiện quá trình suy luận của mình bằng tiếng Anh. ChatGPT có phần mô tả ngắn gọn nhất, với nhiều hình ảnh minh hoạ, đồ thị, đoạn phân tích dễ hiểu. Gemini cũng làm rõ ra, trình bày theo thứ tự suy nghĩ của mô hình.

Riêng Grok có quá trình suy nghĩ giống con người nhất. Mô hình liên tục dùng những từ “tuy nhiên, khoan đã, ngược lại” để tự hỏi lại chính mình giống như cách một học sinh sẽ giải bài toán. Điều này có thể khiến chatbot tự làm quá lên vấn đề và chậm thời gian đưa ra kết quả.

Grok mất 148 giây để giải thích rườm rà kết quả của mình.
Grok mất 148 giây để giải thích rườm rà kết quả của mình.

AI giải toán không giống con người

Một nghiên cứu từ Apple chỉ ra rằng các mô hình suy luận thực sự không động não giống như tên gọi, mà chỉ học vẹt từ dữ liệu có sẵn. Nghiên cứu cũng nói rằng AI có quá trình suy nghĩ hoàn toàn khác con người, vì vậy chúng cố bắt chước cách chúng ta giải một bài toán. Tuy nhiên, rất có thể quá trình suy luận trên chỉ là do mô hình tự bịa ra.

Trong bối cảnh kỳ thi tốt nghiệp THPT ngày càng khó hơn và đòi hỏi tư duy phân tích cao, việc sử dụng AI để tham khảo và học hỏi không còn xa lạ với học sinh. Trong các chatbot sử dụng ở trên, ChatGPT và Gemini là 2 lựa chọn phù hợp để người tự học có thể tham khảo lời giải cho những bài toán khó.

Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.
Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.

Tuy nhiên, dù AI cho ra kết quả nhanh chóng, dễ dàng, quá trình suy luận của chúng thậm chí vẫn chưa được nhà phát triển hiểu rõ. Trong môi trường học thuật, năng lực tư duy của con người vẫn là yếu tố cốt lõi. Thầy Tuấn Nguyễn, giảng viên tại một trường Đại học quốc tế ở TP.HCM, cho rằng việc sử dụng AI là điều bình thường, nhưng học sinh cần hiểu bài, rèn luyện khả năng phản biện và làm chủ công cụ thông minh để học tập hiệu quả hơn.

Thầy Trần Mạnh Tùng, Trưởng bộ môn Toán trường THCS Newton nhận định đề thi về hình thức thì giống với đề minh họa của Bộ Giáo dục và Đào tạo đưa ra trước đó. “Tuy nhiên, nếu đặt lên bàn cân thì đề thi thật có phần khó hơn và phân hoá mạnh hơn đề thi thử”, thầy nhận xét.

Đề thi năm nay gồm 3 phần tương ứng với ba chữ số La Mã. Hai phần đầu tiên dưới dạng trắc nghiệm, không quá khó để thí sinh lấy điểm dễ dàng, thầy Tùng cho biết. Tuy nhiên, phần còn lại là dạng câu hỏi ngắn, giống hình thức tự luận từ nhiều năm trước, chỉ khác là thí sinh chỉ cần điền kết quả chứ không cần trình bày.

znews.vn

Đọc thêm

iPhone 17 vượt kỳ vọng

iPhone 17 vượt kỳ vọng

Giới phân tích nhận định nhu cầu dòng iPhone 17 cao hơn kỳ vọng, trong khi còn quá sớm để khẳng định iPhone Air có thành công hay không.
Những điều cần biết trước khi nâng cấp iOS 26

Những điều cần biết trước khi nâng cấp iOS 26

Mỗi năm, Apple đều giới thiệu phiên bản iOS mới với nhiều cải tiến về giao diện, tính năng và hiệu năng. Tuy nhiên, không phải lúc nào việc cập nhật ngay lập tức cũng là lựa chọn tối ưu.
Người Việt chi hàng nghìn tỷ cho iPhone 17

Người Việt chi hàng nghìn tỷ cho iPhone 17

Dòng điện thoại chủ lực của Apple đem lại doanh thu lớn cho đại lý, nhà sản xuất. Số tiền Táo khuyết thu được tương đương hãng điện thoại cỡ trung bán một năm ở Việt Nam.
Cách kiểm tra Facebook có bị người lạ truy cập

Cách kiểm tra Facebook có bị người lạ truy cập

Bạn có bao giờ lo lắng rằng tài khoản Facebook của mình bị người lạ truy cập trái phép? Việc theo dõi và kiểm tra lịch sử đăng nhập Facebook là cách giúp bạn biết tài khoản đã được sử dụng ở đâu, thiết bị nào, từ đó bảo vệ quyền riêng tư tốt hơn.
Tốc độ mạng Internet Việt Nam tiếp tục tăng

Tốc độ mạng Internet Việt Nam tiếp tục tăng

Số liệu mới nhất từ nền tảng đo tốc độ i-Speed, từ tháng 3/2025 đến nay, chất lượng mạng băng rộng cố định tại Việt Nam liên tục giữ nhịp tăng cả theo chiều tải lên lẫn tải xuống.
Tại sao gọi Zalo bên kia không nghe được?

Tại sao gọi Zalo bên kia không nghe được?

Sẽ rất khó chịu khi điện thoại gọi Zalo mà nói người khác không nghe được. Điều này khiến bạn bỏ lỡ nhiều cuộc gọi và thông tin quan trọng từ người thân, bạn bè.
iPhone 17 Pro Max lập kỷ lục mới

iPhone 17 Pro Max lập kỷ lục mới

iPhone 17 Pro và Pro Max đánh dấu lần đầu tiên Apple trang bị tùy chọn lưu trữ lên đến 2 TB và chính thức mở ra phân khúc giá hoàn toàn mới.
2 cách chuyển ảnh thành bảng Excel đơn giản

2 cách chuyển ảnh thành bảng Excel đơn giản

Việc chuyển đổi ảnh chứa dữ liệu thành bảng Excel là một kỹ năng hữu ích trong công việc và học tập. Thay vì nhập liệu thủ công, bạn có thể sử dụng các công cụ để tự động hóa quá trình này, giúp tiết kiệm thời gian và công sức.
iPhone 17: Những bí mật được chờ đợi

iPhone 17: Những bí mật được chờ đợi

Theo dự kiến, ngày 9/9/2025, Apple sẽ trình làng dòng điện thoại thông minh đình đám iPhone 17 cũng như các sản phẩm như đồng hồ thông minh Apple Watch Series 11 và tai nghe không dây AirPods Pro 3.