Google Maps nâng cấp: Biết nghe và trò chuyện với người dùng

Nhờ tích hợp Gemini 2.5, Google Maps giờ không chỉ dẫn đường mà còn có thể phản hồi bằng ngôn ngữ tự nhiên, hiểu cả ý định của người dùng.

Google Maps tích hợp mô hình Gemini 2.5
Google Maps tích hợp mô hình Gemini 2.5

Sau khi ra mắt mô hình Gemini 2.5, Google tiếp tục đưa trí tuệ nhân tạo vào chính ứng dụng quen thuộc bậc nhất của mình là Google Maps. Lần đầu tiên, bản đồ không chỉ hiển thị đường đi mà còn có thể nghe, hiểu và phản hồi bằng ngôn ngữ tự nhiên, một bước tiến biến công cụ chỉ đường thành trợ lý giao tiếp thực thụ.

Khi Google Maps trở nên thông minh hơn

Theo blog chính thức của Google DeepMind (tháng 11-2025), Gemini 2.5, mô hình AI có khả năng thao tác trình duyệt và xử lý dữ liệu thực tế, đã bắt đầu được tích hợp thử nghiệm vào Google Maps. Mục tiêu là giúp người dùng có thể "trao đổi tự nhiên với bản đồ" thay vì gõ thủ công từng địa điểm hay tùy chọn phức tạp.

Gemini có thể hiểu các yêu cầu như: "Tìm quán ăn mở cửa trễ gần đây, tránh đường đang sửa" hay "Dẫn tôi về nhà nhưng ghé tiệm thuốc trên đường". Hệ thống sẽ tự động đọc dữ liệu giao thông thời gian thực, xác định vị trí người nói, và gợi ý tuyến đường phù hợp nhất.

"Gemini được huấn luyện để hiểu không chỉ từ ngữ mà cả mục đích của người dùng trong không gian thực" - Google mô tả trong bài đăng giới thiệu tính năng "Ask Gemini in Maps".

Phiên bản thử nghiệm đầu tiên đang được triển khai tại Mỹ, Canada và Anh, với kế hoạch mở rộng sang các quốc gia châu Á trong năm 2026. Một số người dùng Android đã có thể kích hoạt bằng lệnh thoại "Ask Gemini in Maps" để ra lệnh hoặc trò chuyện trực tiếp.

Điểm đặc biệt là Gemini không chỉ tra cứu bản đồ, mà còn phân tích hình ảnh Street View, đánh giá cộng đồng, thói quen di chuyển và dữ liệu thời tiết nhờ đó, bản đồ có thể nói những câu tự nhiên như "Rẽ phải ở quán cà phê bà Bảy phía trước" thay vì "Rẽ phải sau 200 mét".

Công nghệ "nghe - hiểu - phản hồi" và bước tiến cá nhân hóa

Về mặt kỹ thuật, Gemini trong Maps ứng dụng mô hình đa phương thức (multimodal model) - kết hợp xử lý ngôn ngữ, hình ảnh và dữ liệu định vị để "hiểu" thế giới theo cách con người cảm nhận.

Hệ thống sử dụng kỹ thuật grounding (liên kết ngôn ngữ với vật thể và địa điểm cụ thể) cho phép AI hiểu các câu tự nhiên như "đi về hướng mặt trời lặn" hay "qua ngã ba có bảng hiệu màu đỏ".

So với Google Assistant trước đây, Gemini xử lý nhanh hơn khoảng hai lần, đồng thời giảm tiêu thụ dữ liệu đám mây nhờ khả năng xử lý cục bộ (on-device AI) trên các thiết bị Pixel và Android cao cấp. Điều này không chỉ giúp phản hồi gần như tức thì mà còn bảo vệ quyền riêng tư tốt hơn, vì nhiều lệnh thoại được xử lý ngay trên thiết bị của người dùng.

Giới quan sát công nghệ cho rằng sự xuất hiện của Gemini trong Maps có thể biến bản đồ thành một giao diện hội thoại thực thụ, nơi người dùng có thể đặt câu hỏi, điều chỉnh lộ trình hoặc tìm hiểu địa điểm mà không cần thao tác tay.

Xu hướng này cũng mở ra một giai đoạn mới: AI không chỉ trả lời câu hỏi, mà bắt đầu hành động thay con người trong thế giới thực.

Google vẫn chưa công bố thời điểm phát hành chính thức, nhưng giới chuyên môn dự đoán rằng năm 2026 sẽ là mốc mở rộng tích hợp Gemini sâu hơn vào hệ sinh thái Android từ chỉ đường, đặt xe cho tới quản lý hành trình di chuyển cá nhân.

tuoitre.vn

Đọc thêm

Thí nghiệm chậm nhất thế giới

Thí nghiệm chậm nhất thế giới

Thí nghiệm nhỏ giọt nhựa đường chứng minh "chất rắn có thể chảy" bước qua năm thứ 99, là thí nghiệm có quãng thời gian dài nhất được thực hiện.
iPhone lại bị sao chép trắng trợn

iPhone lại bị sao chép trắng trợn

Các hãng công nghệ lớn tại Trung Quốc đang thử nghiệm loại cảm biến camera trước hình vuông tỷ lệ 1:1 sau khi Apple áp dụng thiết kế này trên dòng iPhone 17.
Facebook sập trên toàn cầu

Facebook sập trên toàn cầu

Hàng loạt nền tảng thuộc hệ sinh thái Meta như Facebook, Instagram và Messenger bất ngờ gặp sự cố trên diện rộng vào tối 12/6.
Galaxy S26 FE lộ diện

Galaxy S26 FE lộ diện

Hình ảnh và thông số kỹ thuật của Samsung Galaxy S26 FE vừa rò rỉ, hé lộ thay đổi về thiết kế và cấu hình.
Ra mắt AI dịch hội thoại trực tiếp hơn 70 ngôn ngữ

Ra mắt AI dịch hội thoại trực tiếp hơn 70 ngôn ngữ

Theo Google, công nghệ mới có khả năng tự động nhận diện hơn 70 ngôn ngữ và thực hiện dịch giọng nói gần như ngay lập tức, đồng thời giữ được ngữ điệu, tốc độ nói và cao độ giọng của người dùng.
Xin chào,
Tôi là Chatbot của
Báo Hà Tĩnh
Hãy hỏi tôi bất kỳ điều gì bạn cần biết về
Báo Hà Tĩnh nhé. Tôi sẵn sàng hỗ trợ!