AI chỉ mất 10 giây để giải bài toán thi tốt nghiệp THPT

Có chatbot chỉ tốn trung bình 10 giây cho mỗi câu hỏi ở đề thi toán tốt nghiệp THPT năm 2025. Kết quả cho ra khá ấn tượng, nhưng không thể hiện rõ quá trình suy luận của AI.

Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.
Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.

Chiều 26/6, các thí sinh hoàn thành bài thi môn toán trong kỳ thi tốt nghiệp THPT năm 2025, với thời gian làm bài 90 phút. Đây là đề thi đầu tiên sau khi Bộ Giáo dục và Đào tạo áp dụng hình thức mới, được cho là khó hơn so với những năm trước.

Trong khi đề toán năm nay có thể làm khó thí sinh vì dài, tốn thời gian, các chatbot AI không mất nhiều thời gian để xử lý. Để thử nghiệm độ hiệu quả của AI, Tri Thức - Znews sử dụng 4 chatbot bao gồm ChatGPT, Google Gemini, Claude AI và Grok AI để giải một số câu hỏi tự luận của đề thi tốt nghiệp THPT năm nay.

Xử lý nhanh, kết quả "hên xui"

Các chatbot được sử dụng để trả lời phần câu hỏi ngắn của mã đề 0109. Trong đó, ChatGPT và Gemini cho ra kết quả đúng nhất với độ trễ ít. Cả 2 chatbot đều trả lời được 6 câu hỏi với thời gian từ 7-15 giây cho mỗi câu. Tuy nhiên, Gemini đã có thể giải được các bài toán trên với mô hình 2.5 Flash (không suy luận), giúp xử lý nhanh toàn diện.

Trong khi đó, Claude hoàn toàn thất bại ở khả năng tính toán, cho ra toàn bộ kết quả không đúng. Mặc dù được yêu cầu tính lại, chatbot của Anthropic vẫn đưa ra đáp án cũ. Grok trả lời đúng khoảng một nửa số câu hỏi, nhưng với thời gian phản hồi lâu (hơn 2 phút cho một câu).

Đối với ChatGPT và Grok, để giải được các câu hỏi này cần dùng đến phiên bản suy luận, sẽ tiêu tốn thời gian nhiều hơn. Gemini vừa xử lý với tốc độ rất nhanh, có thể chỉ 5 giây với câu nhanh nhất, vừa chỉ sử dụng mô hình 2.5 Flash.

ChatGPT trình bày quá trình suy nghĩ rất sinh động.
ChatGPT trình bày quá trình suy nghĩ rất sinh động.

Xét về tốc độ, Gemini có thời gian xử lý nhanh nhất, trung bình một bài chưa đến 10 giây, nhưng có lời giải phức tạp, rườm rà và khó theo sát hơn. Tiếp đến là mô hình suy luận của ChatGPT có trung bình thời gian xử lý là 25 giây. Trong khi đó, dù vẫn ra kết quả đúng, Grok mất rất nhiều thời gian suy luận, với 148 giây cho một câu hỏi độ khó tương đối.

Dù được hỏi bằng tiếng Việt, cả 3 mô hình đều thể hiện quá trình suy luận của mình bằng tiếng Anh. ChatGPT có phần mô tả ngắn gọn nhất, với nhiều hình ảnh minh hoạ, đồ thị, đoạn phân tích dễ hiểu. Gemini cũng làm rõ ra, trình bày theo thứ tự suy nghĩ của mô hình.

Riêng Grok có quá trình suy nghĩ giống con người nhất. Mô hình liên tục dùng những từ “tuy nhiên, khoan đã, ngược lại” để tự hỏi lại chính mình giống như cách một học sinh sẽ giải bài toán. Điều này có thể khiến chatbot tự làm quá lên vấn đề và chậm thời gian đưa ra kết quả.

Grok mất 148 giây để giải thích rườm rà kết quả của mình.
Grok mất 148 giây để giải thích rườm rà kết quả của mình.

AI giải toán không giống con người

Một nghiên cứu từ Apple chỉ ra rằng các mô hình suy luận thực sự không động não giống như tên gọi, mà chỉ học vẹt từ dữ liệu có sẵn. Nghiên cứu cũng nói rằng AI có quá trình suy nghĩ hoàn toàn khác con người, vì vậy chúng cố bắt chước cách chúng ta giải một bài toán. Tuy nhiên, rất có thể quá trình suy luận trên chỉ là do mô hình tự bịa ra.

Trong bối cảnh kỳ thi tốt nghiệp THPT ngày càng khó hơn và đòi hỏi tư duy phân tích cao, việc sử dụng AI để tham khảo và học hỏi không còn xa lạ với học sinh. Trong các chatbot sử dụng ở trên, ChatGPT và Gemini là 2 lựa chọn phù hợp để người tự học có thể tham khảo lời giải cho những bài toán khó.

Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.
Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.

Tuy nhiên, dù AI cho ra kết quả nhanh chóng, dễ dàng, quá trình suy luận của chúng thậm chí vẫn chưa được nhà phát triển hiểu rõ. Trong môi trường học thuật, năng lực tư duy của con người vẫn là yếu tố cốt lõi. Thầy Tuấn Nguyễn, giảng viên tại một trường Đại học quốc tế ở TP.HCM, cho rằng việc sử dụng AI là điều bình thường, nhưng học sinh cần hiểu bài, rèn luyện khả năng phản biện và làm chủ công cụ thông minh để học tập hiệu quả hơn.

Thầy Trần Mạnh Tùng, Trưởng bộ môn Toán trường THCS Newton nhận định đề thi về hình thức thì giống với đề minh họa của Bộ Giáo dục và Đào tạo đưa ra trước đó. “Tuy nhiên, nếu đặt lên bàn cân thì đề thi thật có phần khó hơn và phân hoá mạnh hơn đề thi thử”, thầy nhận xét.

Đề thi năm nay gồm 3 phần tương ứng với ba chữ số La Mã. Hai phần đầu tiên dưới dạng trắc nghiệm, không quá khó để thí sinh lấy điểm dễ dàng, thầy Tùng cho biết. Tuy nhiên, phần còn lại là dạng câu hỏi ngắn, giống hình thức tự luận từ nhiều năm trước, chỉ khác là thí sinh chỉ cần điền kết quả chứ không cần trình bày.

znews.vn

Đọc thêm

Facebook bắt đầu thu phí

Facebook bắt đầu thu phí

Không phải chặn quảng cáo, các gói trả phí mới trên Instagram, Facebook và WhatsApp bổ sung nhiều tính năng nâng cao.
Lý do người dùng từ bỏ Microsoft Word

Lý do người dùng từ bỏ Microsoft Word

Microsoft Word vẫn là phần mềm soạn thảo phổ biến nhất thế giới, song ngày càng nhiều người dùng cho rằng nó gây ra phiền toái hơn hỗ trợ công việc.
Các đổi mật khẩu Wi-Fi chỉ trong tích tắc

Các đổi mật khẩu Wi-Fi chỉ trong tích tắc

Wi-Fi chậm, dễ mất kết nối hay có người lạ dùng là lúc bạn nên đổi mật khẩu để mạng ổn định hơn. Dưới đây là cách đổi Wi-Fi bằng điện thoại đơn giản, nhanh chóng.
Cách tắt giới hạn ứng dụng trên iPhone cho mọi phiên bản iOS

Cách tắt giới hạn ứng dụng trên iPhone cho mọi phiên bản iOS

Screen Time là một tính năng hữu ích giúp người dùng kiểm soát việc sử dụng điện thoại và xây dựng thói quen công nghệ lành mạnh. Việc hiểu rõ cách tắt giới hạn ứng dụng trên iPhone sẽ giúp bạn linh hoạt điều chỉnh thiết bị theo nhu cầu cá nhân.
Cách quay video 2 camera cùng lúc trên Android

Cách quay video 2 camera cùng lúc trên Android

Nhiều dòng điện thoại Android hiện nay đã hỗ trợ tính năng quay video 2 camera cùng lúc, giúp bạn ghi lại cả camera trước và sau trong cùng một khung hình cực kỳ tiện lợi.
Chi tiết mới lạ trên Galaxy Z TriFold 2

Chi tiết mới lạ trên Galaxy Z TriFold 2

Rò rỉ bằng sáng chế cho thấy Samsung đang nghiên cứu Galaxy Z TriFold 2 với khe cất bút S Pen được giấu trong bản lề, giải quyết điểm yếu lớn nhất của dòng điện thoại gập.
Apple sắp định nghĩa lại iPhone

Apple sắp định nghĩa lại iPhone

Apple đang chuẩn bị cho dự án mang tên "Glasswing" nhằm lột xác hoàn toàn iPhone 20, với thiết kế toàn kính và loại bỏ toàn bộ nút bấm vật lý.
Cách sao chép chữ từ ảnh trên Zalo

Cách sao chép chữ từ ảnh trên Zalo

Zalo trên điện thoại mới cập nhật tính năng mới, cho phép người dùng sao chép trực tiếp chữ trong ảnh được gửi trên Zalo mà không cần phải qua các ứng dụng phức tạp hay tải ảnh về máy.
Khi trí tuệ nhân tạo trở thành "con dao hai lưỡi" trong môi trường làm việc hiện đại

Khi trí tuệ nhân tạo trở thành "con dao hai lưỡi" trong môi trường làm việc hiện đại

Theo báo Liberation của Pháp, trong những năm gần đây, trí tuệ nhân tạo (AI) được ca ngợi như một công cụ giúp tăng năng suất và giải phóng con người khỏi các công việc lặp lại. Tuy nhiên, đằng sau những lời hứa hẹn đó, ngày càng nhiều người lao động trong lĩnh vực công nghệ - từ nhà thiết kế, lập trình viên đến kỹ sư - đang phải đối mặt với một thực tế khác: Mệt mỏi nhận thức, “sương mù não” và nguy cơ kiệt sức nghề nghiệp gia tăng.
Sắp có MacBook Ultra

Sắp có MacBook Ultra

Apple dự kiến mở rộng thương hiệu Ultra vào cuối năm nay với iPhone màn hình gập và MacBook OLED.
Xin chào,
Tôi là Chatbot của
Báo Hà Tĩnh
Hãy hỏi tôi bất kỳ điều gì bạn cần biết về
Báo Hà Tĩnh nhé. Tôi sẵn sàng hỗ trợ!