AI chỉ mất 10 giây để giải bài toán thi tốt nghiệp THPT

Có chatbot chỉ tốn trung bình 10 giây cho mỗi câu hỏi ở đề thi toán tốt nghiệp THPT năm 2025. Kết quả cho ra khá ấn tượng, nhưng không thể hiện rõ quá trình suy luận của AI.

Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.
Nhiều thí sinh nhận xét đề toán dài, khó hoàn thành trong 90 phút. Tuy nhiên đây không phải trở ngại với AI. Ảnh: Duy Hiệu.

Chiều 26/6, các thí sinh hoàn thành bài thi môn toán trong kỳ thi tốt nghiệp THPT năm 2025, với thời gian làm bài 90 phút. Đây là đề thi đầu tiên sau khi Bộ Giáo dục và Đào tạo áp dụng hình thức mới, được cho là khó hơn so với những năm trước.

Trong khi đề toán năm nay có thể làm khó thí sinh vì dài, tốn thời gian, các chatbot AI không mất nhiều thời gian để xử lý. Để thử nghiệm độ hiệu quả của AI, Tri Thức - Znews sử dụng 4 chatbot bao gồm ChatGPT, Google Gemini, Claude AI và Grok AI để giải một số câu hỏi tự luận của đề thi tốt nghiệp THPT năm nay.

Xử lý nhanh, kết quả "hên xui"

Các chatbot được sử dụng để trả lời phần câu hỏi ngắn của mã đề 0109. Trong đó, ChatGPT và Gemini cho ra kết quả đúng nhất với độ trễ ít. Cả 2 chatbot đều trả lời được 6 câu hỏi với thời gian từ 7-15 giây cho mỗi câu. Tuy nhiên, Gemini đã có thể giải được các bài toán trên với mô hình 2.5 Flash (không suy luận), giúp xử lý nhanh toàn diện.

Trong khi đó, Claude hoàn toàn thất bại ở khả năng tính toán, cho ra toàn bộ kết quả không đúng. Mặc dù được yêu cầu tính lại, chatbot của Anthropic vẫn đưa ra đáp án cũ. Grok trả lời đúng khoảng một nửa số câu hỏi, nhưng với thời gian phản hồi lâu (hơn 2 phút cho một câu).

Đối với ChatGPT và Grok, để giải được các câu hỏi này cần dùng đến phiên bản suy luận, sẽ tiêu tốn thời gian nhiều hơn. Gemini vừa xử lý với tốc độ rất nhanh, có thể chỉ 5 giây với câu nhanh nhất, vừa chỉ sử dụng mô hình 2.5 Flash.

ChatGPT trình bày quá trình suy nghĩ rất sinh động.
ChatGPT trình bày quá trình suy nghĩ rất sinh động.

Xét về tốc độ, Gemini có thời gian xử lý nhanh nhất, trung bình một bài chưa đến 10 giây, nhưng có lời giải phức tạp, rườm rà và khó theo sát hơn. Tiếp đến là mô hình suy luận của ChatGPT có trung bình thời gian xử lý là 25 giây. Trong khi đó, dù vẫn ra kết quả đúng, Grok mất rất nhiều thời gian suy luận, với 148 giây cho một câu hỏi độ khó tương đối.

Dù được hỏi bằng tiếng Việt, cả 3 mô hình đều thể hiện quá trình suy luận của mình bằng tiếng Anh. ChatGPT có phần mô tả ngắn gọn nhất, với nhiều hình ảnh minh hoạ, đồ thị, đoạn phân tích dễ hiểu. Gemini cũng làm rõ ra, trình bày theo thứ tự suy nghĩ của mô hình.

Riêng Grok có quá trình suy nghĩ giống con người nhất. Mô hình liên tục dùng những từ “tuy nhiên, khoan đã, ngược lại” để tự hỏi lại chính mình giống như cách một học sinh sẽ giải bài toán. Điều này có thể khiến chatbot tự làm quá lên vấn đề và chậm thời gian đưa ra kết quả.

Grok mất 148 giây để giải thích rườm rà kết quả của mình.
Grok mất 148 giây để giải thích rườm rà kết quả của mình.

AI giải toán không giống con người

Một nghiên cứu từ Apple chỉ ra rằng các mô hình suy luận thực sự không động não giống như tên gọi, mà chỉ học vẹt từ dữ liệu có sẵn. Nghiên cứu cũng nói rằng AI có quá trình suy nghĩ hoàn toàn khác con người, vì vậy chúng cố bắt chước cách chúng ta giải một bài toán. Tuy nhiên, rất có thể quá trình suy luận trên chỉ là do mô hình tự bịa ra.

Trong bối cảnh kỳ thi tốt nghiệp THPT ngày càng khó hơn và đòi hỏi tư duy phân tích cao, việc sử dụng AI để tham khảo và học hỏi không còn xa lạ với học sinh. Trong các chatbot sử dụng ở trên, ChatGPT và Gemini là 2 lựa chọn phù hợp để người tự học có thể tham khảo lời giải cho những bài toán khó.

Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.
Học sinh Hà Nội trong kỳ thi tốt nghiệp THPT 2025. Ảnh: Việt Hà.

Tuy nhiên, dù AI cho ra kết quả nhanh chóng, dễ dàng, quá trình suy luận của chúng thậm chí vẫn chưa được nhà phát triển hiểu rõ. Trong môi trường học thuật, năng lực tư duy của con người vẫn là yếu tố cốt lõi. Thầy Tuấn Nguyễn, giảng viên tại một trường Đại học quốc tế ở TP.HCM, cho rằng việc sử dụng AI là điều bình thường, nhưng học sinh cần hiểu bài, rèn luyện khả năng phản biện và làm chủ công cụ thông minh để học tập hiệu quả hơn.

Thầy Trần Mạnh Tùng, Trưởng bộ môn Toán trường THCS Newton nhận định đề thi về hình thức thì giống với đề minh họa của Bộ Giáo dục và Đào tạo đưa ra trước đó. “Tuy nhiên, nếu đặt lên bàn cân thì đề thi thật có phần khó hơn và phân hoá mạnh hơn đề thi thử”, thầy nhận xét.

Đề thi năm nay gồm 3 phần tương ứng với ba chữ số La Mã. Hai phần đầu tiên dưới dạng trắc nghiệm, không quá khó để thí sinh lấy điểm dễ dàng, thầy Tùng cho biết. Tuy nhiên, phần còn lại là dạng câu hỏi ngắn, giống hình thức tự luận từ nhiều năm trước, chỉ khác là thí sinh chỉ cần điền kết quả chứ không cần trình bày.

znews.vn

Đọc thêm

Chi tiết mới lạ trên Galaxy Z TriFold 2

Chi tiết mới lạ trên Galaxy Z TriFold 2

Rò rỉ bằng sáng chế cho thấy Samsung đang nghiên cứu Galaxy Z TriFold 2 với khe cất bút S Pen được giấu trong bản lề, giải quyết điểm yếu lớn nhất của dòng điện thoại gập.
Apple sắp định nghĩa lại iPhone

Apple sắp định nghĩa lại iPhone

Apple đang chuẩn bị cho dự án mang tên "Glasswing" nhằm lột xác hoàn toàn iPhone 20, với thiết kế toàn kính và loại bỏ toàn bộ nút bấm vật lý.
Cách sao chép chữ từ ảnh trên Zalo

Cách sao chép chữ từ ảnh trên Zalo

Zalo trên điện thoại mới cập nhật tính năng mới, cho phép người dùng sao chép trực tiếp chữ trong ảnh được gửi trên Zalo mà không cần phải qua các ứng dụng phức tạp hay tải ảnh về máy.
Khi trí tuệ nhân tạo trở thành "con dao hai lưỡi" trong môi trường làm việc hiện đại

Khi trí tuệ nhân tạo trở thành "con dao hai lưỡi" trong môi trường làm việc hiện đại

Theo báo Liberation của Pháp, trong những năm gần đây, trí tuệ nhân tạo (AI) được ca ngợi như một công cụ giúp tăng năng suất và giải phóng con người khỏi các công việc lặp lại. Tuy nhiên, đằng sau những lời hứa hẹn đó, ngày càng nhiều người lao động trong lĩnh vực công nghệ - từ nhà thiết kế, lập trình viên đến kỹ sư - đang phải đối mặt với một thực tế khác: Mệt mỏi nhận thức, “sương mù não” và nguy cơ kiệt sức nghề nghiệp gia tăng.
Sắp có MacBook Ultra

Sắp có MacBook Ultra

Apple dự kiến mở rộng thương hiệu Ultra vào cuối năm nay với iPhone màn hình gập và MacBook OLED.
AI đang 'nuốt chửng' Internet

AI đang 'nuốt chửng' Internet

Một nghiên cứu quy mô lớn xác nhận hiện có tới 35% số website mới lập được tạo ra bởi các công cụ AI. Đáng chú ý, vào tháng 8/2022, tỷ lệ này gần như là số 0.
Sắp có điện thoại ChatGPT

Sắp có điện thoại ChatGPT

Smartphone của OpenAI có thể ra mắt vào năm 2028 với vi xử lý tuỳ chỉnh, tập trung vào trí tuệ nhân tạo.
Cách tìm iPhone bị mất khi tắt nguồn

Cách tìm iPhone bị mất khi tắt nguồn

Việc bỗng nhiên đánh rơi hay để quên chiếc điện thoại iPhone đắt giá khiến nhiều người lo lắng. Nhiều người không biết làm sao để tìm iPhone bị mất khi tắt nguồn.
Từ hôm nay, đừng tin ảnh chụp màn hình

Từ hôm nay, đừng tin ảnh chụp màn hình

GPT Image 2 của OpenAI có thể tạo ảnh chụp màn hình, lịch sử chuyển khoản và ảnh người nổi tiếng chân thực đến mức không thể phân biệt, làm dấy lên làn sóng tin giả trên mạng xã hội.
Bạn đang trả tiền cho điều gì khi dùng Internet?

Bạn đang trả tiền cho điều gì khi dùng Internet?

Phần lớn người dùng quan tâm tới tốc độ gói cước, thường được thể hiện bằng chỉ số Mbps. Tuy nhiên, ngoài tốc độ, còn nhiều yếu tố khác ảnh hưởng đến chất lượng và giá trị của dịch vụ.
Cột mốc mới của Apple

Cột mốc mới của Apple

Apple tiến gần mục tiêu bảo vệ môi trường khi tỷ lệ vật liệu tái chế trên sản phẩm đạt kỷ lục.
Xin chào,
Tôi là Chatbot của
Báo Hà Tĩnh
Hãy hỏi tôi bất kỳ điều gì bạn cần biết về
Báo Hà Tĩnh nhé. Tôi sẵn sàng hỗ trợ!