AI chỉ mất 10 giây để giải bài toán thi tốt nghiệp THPT

Có chatbot chỉ tốn trung bình 10 giây cho mỗi câu hỏi ở đề thi toán tốt nghiệp THPT năm 2025. Kết quả cho ra khá ấn tượng, nhưng không thể hiện rõ quá trình suy luận của AI.

Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.
Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.

Chiều 26/6, các thí sinh hoàn thành bài thi môn toán trong kỳ thi tốt nghiệp THPT năm 2025, với thời gian làm bài 90 phút. Đây là đề thi đầu tiên sau khi Bộ Giáo dục và Đào tạo áp dụng hình thức mới, được cho là khó hơn so với những năm trước.

Trong khi đề toán năm nay có thể làm khó thí sinh vì dài, tốn thời gian, các chatbot AI không mất nhiều thời gian để xử lý. Để thử nghiệm độ hiệu quả của AI, Tri Thức - Znews sử dụng 4 chatbot bao gồm ChatGPT, Google Gemini, Claude AI và Grok AI để giải một số câu hỏi tự luận của đề thi tốt nghiệp THPT năm nay.

Xử lý nhanh, kết quả "hên xui"

Các chatbot được sử dụng để trả lời phần câu hỏi ngắn của mã đề 0109. Trong đó, ChatGPT và Gemini cho ra kết quả đúng nhất với độ trễ ít. Cả 2 chatbot đều trả lời được 6 câu hỏi với thời gian từ 7-15 giây cho mỗi câu. Tuy nhiên, Gemini đã có thể giải được các bài toán trên với mô hình 2.5 Flash (không suy luận), giúp xử lý nhanh toàn diện.

Trong khi đó, Claude hoàn toàn thất bại ở khả năng tính toán, cho ra toàn bộ kết quả không đúng. Mặc dù được yêu cầu tính lại, chatbot của Anthropic vẫn đưa ra đáp án cũ. Grok trả lời đúng khoảng một nửa số câu hỏi, nhưng với thời gian phản hồi lâu (hơn 2 phút cho một câu).

Đối với ChatGPT và Grok, để giải được các câu hỏi này cần dùng đến phiên bản suy luận, sẽ tiêu tốn thời gian nhiều hơn. Gemini vừa xử lý với tốc độ rất nhanh, có thể chỉ 5 giây với câu nhanh nhất, vừa chỉ sử dụng mô hình 2.5 Flash.

ChatGPT trình bày quá trình suy nghĩ rất sinh động.
ChatGPT trình bày quá trình suy nghĩ rất sinh động.

Xét về tốc độ, Gemini có thời gian xử lý nhanh nhất, trung bình một bài chưa đến 10 giây, nhưng có lời giải phức tạp, rườm rà và khó theo sát hơn. Tiếp đến là mô hình suy luận của ChatGPT có trung bình thời gian xử lý là 25 giây. Trong khi đó, dù vẫn ra kết quả đúng, Grok mất rất nhiều thời gian suy luận, với 148 giây cho một câu hỏi độ khó tương đối.

Dù được hỏi bằng tiếng Việt, cả 3 mô hình đều thể hiện quá trình suy luận của mình bằng tiếng Anh. ChatGPT có phần mô tả ngắn gọn nhất, với nhiều hình ảnh minh hoạ, đồ thị, đoạn phân tích dễ hiểu. Gemini cũng làm rõ ra, trình bày theo thứ tự suy nghĩ của mô hình.

Riêng Grok có quá trình suy nghĩ giống con người nhất. Mô hình liên tục dùng những từ “tuy nhiên, khoan đã, ngược lại” để tự hỏi lại chính mình giống như cách một học sinh sẽ giải bài toán. Điều này có thể khiến chatbot tự làm quá lên vấn đề và chậm thời gian đưa ra kết quả.

Grok mất 148 giây để giải thích rườm rà kết quả của mình.
Grok mất 148 giây để giải thích rườm rà kết quả của mình.

AI giải toán không giống con người

Một nghiên cứu từ Apple chỉ ra rằng các mô hình suy luận thực sự không động não giống như tên gọi, mà chỉ học vẹt từ dữ liệu có sẵn. Nghiên cứu cũng nói rằng AI có quá trình suy nghĩ hoàn toàn khác con người, vì vậy chúng cố bắt chước cách chúng ta giải một bài toán. Tuy nhiên, rất có thể quá trình suy luận trên chỉ là do mô hình tự bịa ra.

Trong bối cảnh kỳ thi tốt nghiệp THPT ngày càng khó hơn và đòi hỏi tư duy phân tích cao, việc sử dụng AI để tham khảo và học hỏi không còn xa lạ với học sinh. Trong các chatbot sử dụng ở trên, ChatGPT và Gemini là 2 lựa chọn phù hợp để người tự học có thể tham khảo lời giải cho những bài toán khó.

Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.
Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.

Tuy nhiên, dù AI cho ra kết quả nhanh chóng, dễ dàng, quá trình suy luận của chúng thậm chí vẫn chưa được nhà phát triển hiểu rõ. Trong môi trường học thuật, năng lực tư duy của con người vẫn là yếu tố cốt lõi. Thầy Tuấn Nguyễn, giảng viên tại một trường Đại học quốc tế ở TP.HCM, cho rằng việc sử dụng AI là điều bình thường, nhưng học sinh cần hiểu bài, rèn luyện khả năng phản biện và làm chủ công cụ thông minh để học tập hiệu quả hơn.

Thầy Trần Mạnh Tùng, Trưởng bộ môn Toán trường THCS Newton nhận định đề thi về hình thức thì giống với đề minh họa của Bộ Giáo dục và Đào tạo đưa ra trước đó. “Tuy nhiên, nếu đặt lên bàn cân thì đề thi thật có phần khó hơn và phân hoá mạnh hơn đề thi thử”, thầy nhận xét.

Đề thi năm nay gồm 3 phần tương ứng với ba chữ số La Mã. Hai phần đầu tiên dưới dạng trắc nghiệm, không quá khó để thí sinh lấy điểm dễ dàng, thầy Tùng cho biết. Tuy nhiên, phần còn lại là dạng câu hỏi ngắn, giống hình thức tự luận từ nhiều năm trước, chỉ khác là thí sinh chỉ cần điền kết quả chứ không cần trình bày.

znews.vn

Đọc thêm

Cách xuất file Canva sang PDF đơn giản

Cách xuất file Canva sang PDF đơn giản

Xuất file PDF từ Canva là thao tác cần thiết khi thiết kế tài liệu, thuyết trình. Hướng dẫn dưới đây giúp bạn lưu file đúng chuẩn, đảm bảo chất lượng.
Ông Trump tìm được chủ mới cho TikTok

Ông Trump tìm được chủ mới cho TikTok

Tổng thống Mỹ Donald Trump, trong một cuộc phỏng vấn, cho biết ông sẽ tiết lộ danh tính một nhóm người "rất giàu có" sẽ mua lại TikTok trong hai tuần tới.
Cách xóa tất cả lịch sử chat trên ChatGPT

Cách xóa tất cả lịch sử chat trên ChatGPT

Trước đây, để xóa lịch sử trò chuyện trên ChatGPT, bạn phải nhấn vào từng đoạn chat một cách thủ công, vừa mất thời gian lại tốn công sức nếu có nhiều cuộc trò chuyện.
Lý do AI của iPhone tốt hơn Android

Lý do AI của iPhone tốt hơn Android

Nhiều tính năng mới của trí tuệ nhân tạo của Apple hoạt động trên thiết bị hoặc đám mây bảo mật. Đây là lợi thế cạnh tranh so với các thiết bị Android.
Loạt tính năng AI mới của Apple

Loạt tính năng AI mới của Apple

Apple Intelligence sẽ hỗ trợ tiếng Việt vào cuối năm, thêm tính năng dịch trực tiếp, nhận dạng hình ảnh để tìm kiếm hoặc lấy thông tin, tạo hình với ChatGPT.
BlackBerry sắp trở lại

BlackBerry sắp trở lại

Một công ty Trung Quốc muốn hồi sinh mẫu smartphone BlackBerry Classic (Q20) với hệ điều hành Android và trang bị phần cứng hiện đại.
AI có hại cho trẻ em?

AI có hại cho trẻ em?

Trong bối cảnh AI tạo sinh ngày càng dễ tiếp cận, các chuyên gia và phụ huynh cần quan tâm nhiều hơn về tác động của chatbot AI lên tâm lý trẻ em.