Khoa học - Công nghệ

Google ra mắt Gemini 3.5 Flash và Gemini Omni: Kỷ nguyên AI tốc độ cao và xử lý video chân thực

Bảo Long•20/05/2026 10:35

Tại sự kiện I/O 2026, Google chính thức trình làng Gemini 3.5 Flash với tốc độ xử lý nhanh gấp 4 lần và Gemini Omni, mô hình AI đa phương thức đột phá trong việc tạo và chỉnh sửa video.

Tại sự kiện I/O 2026 vừa diễn ra, Google đã chính thức công bố hai mô hình trí tuệ nhân tạo (AI) mới: Gemini 3.5 Flash và Gemini Omni. Đây là bước tiến chiến lược nhằm tối ưu hóa tốc độ xử lý, khả năng lập trình và mở rộng giới hạn sáng tạo nội dung đa phương thức trên toàn hệ sinh thái của hãng.

Gemini 3.5 Flash: Tối ưu hóa tốc độ và tư duy logic

Gemini 3.5 Flash được thiết kế để giải quyết bài toán cân bằng giữa tốc độ phản hồi và trí thông minh nhân tạo. Theo CEO Sundar Pichai, mô hình này đạt hiệu năng vượt trội khi hoạt động nhanh hơn gấp 4 lần so với một số mô hình AI tiên tiến khác về khả năng tạo mã thông báo (token) đầu ra, đồng thời duy trì độ trễ cực thấp.

Google nhấn mạnh rằng Gemini 3.5 Flash không chỉ ưu tiên tốc độ mà còn sở hữu trí thông minh cạnh tranh trực tiếp với các hệ thống AI lớn nhất hiện nay. Thậm chí, mô hình này còn vượt qua Gemini 3.1 Pro ở một số tiêu chí đánh giá về khả năng lập trình và tư duy logic phức tạp.

Gemini 3.5 Flash có hiệu suất nhanh và hiệu quả

Khả năng xử lý đa phương thức thực thụ

Một điểm nhấn quan trọng của Gemini 3.5 Flash là hệ thống đa phương thức toàn diện. Mô hình có khả năng hiểu và xử lý đồng thời văn bản, âm thanh, hình ảnh, video và mã lập trình. Điều này cho phép AI hỗ trợ các nhóm tác nhân phụ (agent sub-teams) thực hiện các quy trình làm việc dài hạn và tạo ra giao diện web tương tác phong phú.

Gemini 3.5 Flash hỗ trợ AI đa phương thức

Hiện tại, Google đã bắt đầu đưa Gemini 3.5 Flash lên toàn bộ nền tảng của mình, bao gồm ứng dụng Gemini, API, Google AI Studio và Android Studio, giúp các nhà phát triển và người dùng cá nhân có thể tiếp cận ngay lập tức.

Gemini 3.5 Flash đã được tích hợp lên hệ sinh thái Google

Gemini Omni: Định nghĩa lại khả năng sáng tạo video AI

Cũng tại sự kiện, Google giới thiệu Gemini Omni – một mô hình video AI đa phương thức cho phép tạo và chỉnh sửa video thông qua các lời nhắc văn bản mang tính hội thoại. Khác với các công cụ trước đây, người dùng Gemini Omni có thể trực tiếp can thiệp vào các yếu tố hình ảnh như nhân vật, cảnh quay và hành động chỉ bằng việc ra lệnh.

Gemini Omni được Google giới thiệu tại sự kiện I/O 2026

Mô hình này được trang bị sự hiểu biết sâu sắc về các quy luật vật lý thực tế, từ trọng lực đến chuyển động của chất lỏng, giúp video do AI tạo ra có độ chân thực cao. Để tăng tính minh bạch, Google tích hợp hình mờ kỹ thuật số SynthID vào mọi sản phẩm đầu ra nhằm ngăn chặn việc lạm dụng và giả mạo nội dung.

Bảng so sánh tính năng các mô hình AI mới của Google

Tính năng	Gemini 3.5 Flash	Gemini Omni
Ưu điểm chính	Tốc độ cực nhanh, độ trễ Flash	Chỉnh sửa video đa phương thức
Tốc độ xử lý	Nhanh gấp 4 lần bình thường	Tối ưu hóa cho video thời gian thực
Lĩnh vực thế mạnh	Lập trình, suy luận, xử lý ngữ cảnh dài	Sáng tạo video, hiểu biết vật lý thực tế
Nền tảng hỗ trợ	Toàn bộ hệ sinh thái Google	YouTube Shorts, ứng dụng Gemini

Hiện phiên bản Gemini Omni Flash đang được triển khai miễn phí cho người dùng YouTube Shorts, trong khi các tính năng nâng cao hơn vẫn giới hạn cho người đăng ký gói Google AI Plus, Pro và Ultra. Đồng thời, Google cũng xác nhận đang phát triển mẫu flagship Gemini 3.5 Pro để ra mắt trong thời gian tới.

Bảo Long