Khoa học - Công nghệ
Google ra mắt Gemini 3.5 Flash và Gemini Omni: Kỷ nguyên AI tốc độ cao và xử lý video chân thực
Tại sự kiện I/O 2026, Google chính thức trình làng Gemini 3.5 Flash với tốc độ xử lý nhanh gấp 4 lần và Gemini Omni, mô hình AI đa phương thức đột phá trong việc tạo và chỉnh sửa video.
Tại sự kiện I/O 2026 vừa diễn ra, Google đã chính thức công bố hai mô hình trí tuệ nhân tạo (AI) mới: Gemini 3.5 Flash và Gemini Omni. Đây là bước tiến chiến lược nhằm tối ưu hóa tốc độ xử lý, khả năng lập trình và mở rộng giới hạn sáng tạo nội dung đa phương thức trên toàn hệ sinh thái của hãng.

Gemini 3.5 Flash: Tối ưu hóa tốc độ và tư duy logic
Gemini 3.5 Flash được thiết kế để giải quyết bài toán cân bằng giữa tốc độ phản hồi và trí thông minh nhân tạo. Theo CEO Sundar Pichai, mô hình này đạt hiệu năng vượt trội khi hoạt động nhanh hơn gấp 4 lần so với một số mô hình AI tiên tiến khác về khả năng tạo mã thông báo (token) đầu ra, đồng thời duy trì độ trễ cực thấp.
Google nhấn mạnh rằng Gemini 3.5 Flash không chỉ ưu tiên tốc độ mà còn sở hữu trí thông minh cạnh tranh trực tiếp với các hệ thống AI lớn nhất hiện nay. Thậm chí, mô hình này còn vượt qua Gemini 3.1 Pro ở một số tiêu chí đánh giá về khả năng lập trình và tư duy logic phức tạp.

Khả năng xử lý đa phương thức thực thụ
Một điểm nhấn quan trọng của Gemini 3.5 Flash là hệ thống đa phương thức toàn diện. Mô hình có khả năng hiểu và xử lý đồng thời văn bản, âm thanh, hình ảnh, video và mã lập trình. Điều này cho phép AI hỗ trợ các nhóm tác nhân phụ (agent sub-teams) thực hiện các quy trình làm việc dài hạn và tạo ra giao diện web tương tác phong phú.

Hiện tại, Google đã bắt đầu đưa Gemini 3.5 Flash lên toàn bộ nền tảng của mình, bao gồm ứng dụng Gemini, API, Google AI Studio và Android Studio, giúp các nhà phát triển và người dùng cá nhân có thể tiếp cận ngay lập tức.

Gemini Omni: Định nghĩa lại khả năng sáng tạo video AI
Cũng tại sự kiện, Google giới thiệu Gemini Omni – một mô hình video AI đa phương thức cho phép tạo và chỉnh sửa video thông qua các lời nhắc văn bản mang tính hội thoại. Khác với các công cụ trước đây, người dùng Gemini Omni có thể trực tiếp can thiệp vào các yếu tố hình ảnh như nhân vật, cảnh quay và hành động chỉ bằng việc ra lệnh.

Mô hình này được trang bị sự hiểu biết sâu sắc về các quy luật vật lý thực tế, từ trọng lực đến chuyển động của chất lỏng, giúp video do AI tạo ra có độ chân thực cao. Để tăng tính minh bạch, Google tích hợp hình mờ kỹ thuật số SynthID vào mọi sản phẩm đầu ra nhằm ngăn chặn việc lạm dụng và giả mạo nội dung.
Bảng so sánh tính năng các mô hình AI mới của Google
| Tính năng | Gemini 3.5 Flash | Gemini Omni |
|---|---|---|
| Ưu điểm chính | Tốc độ cực nhanh, độ trễ Flash | Chỉnh sửa video đa phương thức |
| Tốc độ xử lý | Nhanh gấp 4 lần bình thường | Tối ưu hóa cho video thời gian thực |
| Lĩnh vực thế mạnh | Lập trình, suy luận, xử lý ngữ cảnh dài | Sáng tạo video, hiểu biết vật lý thực tế |
| Nền tảng hỗ trợ | Toàn bộ hệ sinh thái Google | YouTube Shorts, ứng dụng Gemini |
Hiện phiên bản Gemini Omni Flash đang được triển khai miễn phí cho người dùng YouTube Shorts, trong khi các tính năng nâng cao hơn vẫn giới hạn cho người đăng ký gói Google AI Plus, Pro và Ultra. Đồng thời, Google cũng xác nhận đang phát triển mẫu flagship Gemini 3.5 Pro để ra mắt trong thời gian tới.