Không thể tin nổi: Trí tuệ nhân tạo đã có thể dịch ngôn ngữ mà không cần tới từ điển

Một bước đột phá rất lớn trong machine learning và trong nghiên cứu, giảng dạy ngôn ngữ.

Cứ đà này, ta sẽ có một ngôn ngữ trí tuệ nhân tạo hoàn toàn khác và hoàn toàn mới, cứ nhìn ví dụ của Facebook này mà xem.

Vừa mới đây thôi, hai công trình nghiên cứu nêu lên cách thức một mạng máy tính neural network có thể dịch được ngôn ngữ mà không cần từ điển, một bước tiến cực kì quan trọng trong việc nghiên cứu và dạy ngôn ngữ.

khong the tin noi tri tue nhan tao da co the dich ngon ngu ma khong can toi tu dien

"Hãy cứ tưởng tượng bạn cho một người một đống sách tiếng Trung và một đống sách tiếng Ả rập – không có nội dung nào trùng nhau cả - và người đó phải học cách dịch tiếng Trung sang tiếng Ả rập. Có vẻ như là bất khả thi phải không?", tác giả của một trong hai nghiên cứu trên, một nhà khoa học máy tính tại Đại học vùng Basque, Tây Ban Nha ,Mikel Artetxe nói. "Nhưng chúng tôi đã cho thấy rằng một cỗ máy có thể làm được như thế".

Từ trước đến giờ, việc "dạy" cho máy tính sẽ bao gồm quy trình máy tính đoán câu trả lời – nhận được câu trả lời đúng – điều chỉnh lại quá trình phân tích để lần sau tạo ra câu trả lời cho đúng; cách thức này là "được giám sát".

Hai nghiên cứu mới này tập trung vào phương thức hoàn toàn khác: cho machine learning chạy mà không cần giám sát, để nó tự học đúng nghĩa. Hai hệ thống tự tạo ra một cuốn từ điển song ngữ của riêng mình mà không có ai sửa sai cho chúng. Điều này khả thi bởi lẽ ngôn ngữ thường có những điểm chung giữa các nhóm từ cũng như cách kết hợp từ.

khong the tin noi tri tue nhan tao da co the dich ngon ngu ma khong can toi tu dien

Ví dụ như "bàn" và "ghế" thường được đi dôi với nhau. Vậy nên máy tính tạo ra một bản đồ từ điểm lớn, những từ là những thành phố lớn, được nối với những từ liên quan bởi những con đường quốc lộ. Dần dần, nó sẽ tìm ra cách tốt nhất để vẽ nên một con đường hiệu quả đi giữa các thành phố. Thế đó, nó đã có một cuốn từ điển song ngữ.

Trong hai nghiên cứu này, các nhà khoa học đều dùng những phương pháp tương tự nhau và đều có thể dịch ngôn ngữ theo từng câu một. Họ đều sử dụng hai chiến lược huấn luyện trí tuệ nhân tạo có tên dịch ngược – back translation và giảm nhiễu – denoising.

khong the tin noi tri tue nhan tao da co the dich ngon ngu ma khong can toi tu dien

Trong phương thức back translation, một câu trong ngôn ngữ A sẽ được dịch thô sang ngôn ngữ B, rồi từ B lại dịch ngược về A. Nếu như câu được dịch ngược lại không đúng với nguyên bản, AI sẽ dần sửa lại cho đúng.

Denoising cũng na ná với back translation, nhưng thay vì dịch đi dịch lại giữa hai ngôn ngữ A và B, AI sẽ thêm các yếu tố khác vào trong câu (sắp xếp lại vị trí từ, loại bỏ bớt từ đi) và cố gắng dịch ngược câu ấy về nguyên bản.

Sử dụng hai phương thức dịch này, AI sẽ hiểu được sâu hơn về cấu trúc của ngôn ngữ.

"Thật là đáng ngạc nhiên khi máy tính có thể dịch ngôn ngữ mà không cần đến sự giúp đỡ của con người", Di He, nhà khoa học máy tính tại Microsoft đã có nghiên cứu truyền cảm hứng cho cả hai nghiên cứu trên, nói.

Hai nghiên cứu trên, một từ Mikel Artetxe và một từ nhà khoa học máy tính tại Facebook, Guillaume Lample và các cộng sự đều đã được đăng tải trên Science. Cả hai đội ngũ đều vui mừng bày tỏ rằng họ có thể cải thiện AI của mình bằng việc áp dụng những yếu tố mới từ đội ngũ còn lại.

Tuy nhiên, hai nghiên cứu này vẫn chưa được kiểm tra và phân tích kĩ càng (peer review).

Theo Trí Thức trẻ

Đọc thêm

Tiết lộ thiết kế độc đáo của iPhone 18

Tiết lộ thiết kế độc đáo của iPhone 18

Nguồn tin tiết lộ Apple đang có kế hoạch di chuyển các thành phần Face ID xuống dưới màn hình vào năm 2026, cho phép loại bỏ phần khuyết hình viên thuốc tạo nên Dynamic Island.
Rò rỉ nâng cấp đáng kể của iPhone 18

Rò rỉ nâng cấp đáng kể của iPhone 18

iPhone 18 có thể nhận được cải thiện hiệu suất từ bộ nhớ, với tin đồn Apple sẽ sử dụng tùy chọn bộ nhớ mới nhanh hơn trong phiên bản ra mắt năm 2026.
Câu lệnh có thể thao túng AI

Câu lệnh có thể thao túng AI

Phương pháp bẻ khoá, khai thác thông tin qua trí tuệ nhân tạo ngày càng tinh vi, đòi hỏi giải pháp bảo mật tốt hơn từ cá nhân và doanh nghiệp.
Đừng nghĩ nhiều khi sạc iPhone

Đừng nghĩ nhiều khi sạc iPhone

iPhone đã có mặt trên thị trường gần 18 năm. Vẫn có rất nhiều hiểu lầm xoay quanh nó tiếp tục lan truyền. Không ít trong số đó có thể ảnh hưởng xấu đến trải nghiệm người dùng.
ChatGPT vượt Google trong cuộc đua AI

ChatGPT vượt Google trong cuộc đua AI

Khi xét theo lượng người dùng ứng dụng riêng lẻ, ChatGPT đang dẫn trước Gemini của Google. Tuy nhiên, lợi thế về hệ sinh thái rộng lớn vẫn giúp Google duy trì sức mạnh vượt trội.
Mắt thông minh AI dành cho người khiếm thị

Mắt thông minh AI dành cho người khiếm thị

Các nhà khoa học đã phát triển hệ thống thiết bị đeo tích hợp công nghệ AI để chỉ dẫn người khiếm thị tránh các chướng ngại vật trên đường và xử lý các tác vụ hàng ngày.
Tính năng sạc đặc biệt của iPhone

Tính năng sạc đặc biệt của iPhone

Tính năng Clean Energy Saving (Sạc pin năng lượng sạch) nhằm mục tiêu giảm khí thải carbon sẽ được triển khai trên toàn bộ iPhone và iPad trưng bày tại Mỹ.
Những lưu ý khi sạc điện thoại trên ô tô

Những lưu ý khi sạc điện thoại trên ô tô

Sạc điện thoại trên ô tô là một giải pháp hỗ trợ tối ưu để duy trì liên lạc với mọi người xung quanh. Tuy nhiên, sạc không đúng cách tiềm ẩn nguy hiểm cho người ngồi trên xe.
Thiết bị gập bí ẩn của Apple

Thiết bị gập bí ẩn của Apple

Với màn hình gập có kích thước gần 19 inch, rất khó để hình dung cách Apple định vị phân khúc thị trường cho sản phẩm này.
Kỷ nguyên iPhone 'nhàm chán' sắp kết thúc

Kỷ nguyên iPhone 'nhàm chán' sắp kết thúc

Apple đang chuẩn bị cho một sự thay đổi mang tính cách mạng đối với dòng sản phẩm iPhone, mở ra một kỷ nguyên mới sau giai đoạn được nhận định là thiếu đột phá.
Hình ảnh mới của iOS 19

Hình ảnh mới của iOS 19

iOS 19 tiếp tục lộ diện với biểu tượng ứng dụng mới, các thành phần giao diện bóng bẩy hơn.