AI chỉ mất 10 giây để giải bài toán thi tốt nghiệp THPT

Có chatbot chỉ tốn trung bình 10 giây cho mỗi câu hỏi ở đề thi toán tốt nghiệp THPT năm 2025. Kết quả cho ra khá ấn tượng, nhưng không thể hiện rõ quá trình suy luận của AI.

Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.
Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.

Chiều 26/6, các thí sinh hoàn thành bài thi môn toán trong kỳ thi tốt nghiệp THPT năm 2025, với thời gian làm bài 90 phút. Đây là đề thi đầu tiên sau khi Bộ Giáo dục và Đào tạo áp dụng hình thức mới, được cho là khó hơn so với những năm trước.

Trong khi đề toán năm nay có thể làm khó thí sinh vì dài, tốn thời gian, các chatbot AI không mất nhiều thời gian để xử lý. Để thử nghiệm độ hiệu quả của AI, Tri Thức - Znews sử dụng 4 chatbot bao gồm ChatGPT, Google Gemini, Claude AI và Grok AI để giải một số câu hỏi tự luận của đề thi tốt nghiệp THPT năm nay.

Xử lý nhanh, kết quả "hên xui"

Các chatbot được sử dụng để trả lời phần câu hỏi ngắn của mã đề 0109. Trong đó, ChatGPT và Gemini cho ra kết quả đúng nhất với độ trễ ít. Cả 2 chatbot đều trả lời được 6 câu hỏi với thời gian từ 7-15 giây cho mỗi câu. Tuy nhiên, Gemini đã có thể giải được các bài toán trên với mô hình 2.5 Flash (không suy luận), giúp xử lý nhanh toàn diện.

Trong khi đó, Claude hoàn toàn thất bại ở khả năng tính toán, cho ra toàn bộ kết quả không đúng. Mặc dù được yêu cầu tính lại, chatbot của Anthropic vẫn đưa ra đáp án cũ. Grok trả lời đúng khoảng một nửa số câu hỏi, nhưng với thời gian phản hồi lâu (hơn 2 phút cho một câu).

Đối với ChatGPT và Grok, để giải được các câu hỏi này cần dùng đến phiên bản suy luận, sẽ tiêu tốn thời gian nhiều hơn. Gemini vừa xử lý với tốc độ rất nhanh, có thể chỉ 5 giây với câu nhanh nhất, vừa chỉ sử dụng mô hình 2.5 Flash.

ChatGPT trình bày quá trình suy nghĩ rất sinh động.
ChatGPT trình bày quá trình suy nghĩ rất sinh động.

Xét về tốc độ, Gemini có thời gian xử lý nhanh nhất, trung bình một bài chưa đến 10 giây, nhưng có lời giải phức tạp, rườm rà và khó theo sát hơn. Tiếp đến là mô hình suy luận của ChatGPT có trung bình thời gian xử lý là 25 giây. Trong khi đó, dù vẫn ra kết quả đúng, Grok mất rất nhiều thời gian suy luận, với 148 giây cho một câu hỏi độ khó tương đối.

Dù được hỏi bằng tiếng Việt, cả 3 mô hình đều thể hiện quá trình suy luận của mình bằng tiếng Anh. ChatGPT có phần mô tả ngắn gọn nhất, với nhiều hình ảnh minh hoạ, đồ thị, đoạn phân tích dễ hiểu. Gemini cũng làm rõ ra, trình bày theo thứ tự suy nghĩ của mô hình.

Riêng Grok có quá trình suy nghĩ giống con người nhất. Mô hình liên tục dùng những từ “tuy nhiên, khoan đã, ngược lại” để tự hỏi lại chính mình giống như cách một học sinh sẽ giải bài toán. Điều này có thể khiến chatbot tự làm quá lên vấn đề và chậm thời gian đưa ra kết quả.

Grok mất 148 giây để giải thích rườm rà kết quả của mình.
Grok mất 148 giây để giải thích rườm rà kết quả của mình.

AI giải toán không giống con người

Một nghiên cứu từ Apple chỉ ra rằng các mô hình suy luận thực sự không động não giống như tên gọi, mà chỉ học vẹt từ dữ liệu có sẵn. Nghiên cứu cũng nói rằng AI có quá trình suy nghĩ hoàn toàn khác con người, vì vậy chúng cố bắt chước cách chúng ta giải một bài toán. Tuy nhiên, rất có thể quá trình suy luận trên chỉ là do mô hình tự bịa ra.

Trong bối cảnh kỳ thi tốt nghiệp THPT ngày càng khó hơn và đòi hỏi tư duy phân tích cao, việc sử dụng AI để tham khảo và học hỏi không còn xa lạ với học sinh. Trong các chatbot sử dụng ở trên, ChatGPT và Gemini là 2 lựa chọn phù hợp để người tự học có thể tham khảo lời giải cho những bài toán khó.

Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.
Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.

Tuy nhiên, dù AI cho ra kết quả nhanh chóng, dễ dàng, quá trình suy luận của chúng thậm chí vẫn chưa được nhà phát triển hiểu rõ. Trong môi trường học thuật, năng lực tư duy của con người vẫn là yếu tố cốt lõi. Thầy Tuấn Nguyễn, giảng viên tại một trường Đại học quốc tế ở TP.HCM, cho rằng việc sử dụng AI là điều bình thường, nhưng học sinh cần hiểu bài, rèn luyện khả năng phản biện và làm chủ công cụ thông minh để học tập hiệu quả hơn.

Thầy Trần Mạnh Tùng, Trưởng bộ môn Toán trường THCS Newton nhận định đề thi về hình thức thì giống với đề minh họa của Bộ Giáo dục và Đào tạo đưa ra trước đó. “Tuy nhiên, nếu đặt lên bàn cân thì đề thi thật có phần khó hơn và phân hoá mạnh hơn đề thi thử”, thầy nhận xét.

Đề thi năm nay gồm 3 phần tương ứng với ba chữ số La Mã. Hai phần đầu tiên dưới dạng trắc nghiệm, không quá khó để thí sinh lấy điểm dễ dàng, thầy Tùng cho biết. Tuy nhiên, phần còn lại là dạng câu hỏi ngắn, giống hình thức tự luận từ nhiều năm trước, chỉ khác là thí sinh chỉ cần điền kết quả chứ không cần trình bày.

znews.vn

Đọc thêm

Lý do AI của iPhone tốt hơn Android

Lý do AI của iPhone tốt hơn Android

Nhiều tính năng mới của trí tuệ nhân tạo của Apple hoạt động trên thiết bị hoặc đám mây bảo mật. Đây là lợi thế cạnh tranh so với các thiết bị Android.
Loạt tính năng AI mới của Apple

Loạt tính năng AI mới của Apple

Apple Intelligence sẽ hỗ trợ tiếng Việt vào cuối năm, thêm tính năng dịch trực tiếp, nhận dạng hình ảnh để tìm kiếm hoặc lấy thông tin, tạo hình với ChatGPT.
BlackBerry sắp trở lại

BlackBerry sắp trở lại

Một công ty Trung Quốc muốn hồi sinh mẫu smartphone BlackBerry Classic (Q20) với hệ điều hành Android và trang bị phần cứng hiện đại.
AI có hại cho trẻ em?

AI có hại cho trẻ em?

Trong bối cảnh AI tạo sinh ngày càng dễ tiếp cận, các chuyên gia và phụ huynh cần quan tâm nhiều hơn về tác động của chatbot AI lên tâm lý trẻ em.
Hồi chuông báo động cho Apple

Hồi chuông báo động cho Apple

Sự kết hợp giữa OpenAI, cha đẻ ChatGPT và bậc thầy thiết kế Jony Ive trong việc tạo ra một thế hệ thiết bị AI mới khiến cách tiếp cận của Apple bị đặt dấu hỏi.
iPhone 17 sẽ đắt đến đâu?

iPhone 17 sẽ đắt đến đâu?

Dựa vào chính sách thuế thay đổi liên tục, xu hướng giá của các đời máy trước, iPhone 17 có thể là chiếc iPhone đắt nhất từ trước đến nay.
Viettel đấu giá thành công băng tần 700 MHz

Viettel đấu giá thành công băng tần 700 MHz

Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) vừa đấu giá thành công quyền sử dụng tần số vô tuyến điện đối với khối tần B2 – B2’ của băng tần 700MHz trong vòng 15 năm tới.
Đừng mắc lỗi ngớ ngẩn này khi dùng AI

Đừng mắc lỗi ngớ ngẩn này khi dùng AI

Việc sử dụng AI để tạo nội dung vẫn thường thấy trên các nền tảng. Tuy nhiên, một số người dùng quên bỏ câu dẫn nhập của AI, tạo ra những lỗi ngớ ngẩn.