Khoa học - Công nghệ
Google ra mắt Google AI Edge Eloquent: Chuyển giọng nói thành văn bản chuyên nghiệp
Ứng dụng Google AI Edge Eloquent sử dụng mô hình Gemma để xử lý giọng nói offline, tự động xóa từ đệm và tóm tắt văn bản, định hình tương lai nhập liệu mới.
Google vừa chính thức giới thiệu Google AI Edge Eloquent trên nền tảng iOS, đánh dấu bước tiến mới trong công nghệ nhập liệu bằng giọng nói. Khác với các công cụ truyền thống, ứng dụng này không chỉ ghi chép mà còn có khả năng tự động biên tập và tối ưu hóa văn bản theo ngữ cảnh người dùng ngay trên thiết bị.
Sức mạnh từ mô hình Gemma và khả năng hoạt động ngoại tuyến
Điểm cốt lõi của Google AI Edge Eloquent là việc tích hợp các mô hình nhận dạng giọng nói Gemma. Công nghệ này cho phép ứng dụng chuyển đổi giọng nói thành văn bản hoàn chỉnh mà không cần kết nối internet. Việc xử lý trực tiếp trên phần cứng thiết bị (on-device) giúp tăng tốc độ phản hồi đồng thời đảm bảo quyền riêng tư tối đa cho dữ liệu người dùng.

Trong quá trình sử dụng, ứng dụng sẽ hiển thị nội dung theo thời gian thực. Khi người dùng kết thúc câu thoại, hệ thống AI sẽ tự động phân tích để loại bỏ các từ đệm thừa như “um”, “ah” và chỉnh sửa cấu trúc câu. Kết quả trả về là một đoạn văn bản mạch lạc, chuyên nghiệp thay vì những dòng ghi chép thô sơ như các ứng dụng trước đây.
Công cụ xử lý nội dung thông minh tích hợp Gemini
Bên cạnh khả năng nhận diện, Google AI Edge Eloquent còn cung cấp bộ công cụ xử lý văn bản chuyên sâu. Người dùng có thể thực hiện các thao tác nhanh ngay trong ứng dụng:
- Tóm tắt ý chính: Chắt lọc nội dung quan trọng từ các đoạn hội thoại dài.
- Điều chỉnh văn phong: Thay đổi độ dài hoặc sắc thái của văn bản để phù hợp với mục đích sử dụng.
- Tối ưu hóa bằng đám mây: Khi có kết nối mạng, ứng dụng có thể tận dụng sức mạnh của mô hình Gemini để nâng cao chất lượng biên tập.
- Cá nhân hóa từ điển: Người dùng có thể bổ sung các tên riêng hoặc thuật ngữ chuyên ngành để tăng độ chính xác khi nhận diện.
Triển vọng thay thế bàn phím truyền thống
Hiện tại, Google AI Edge Eloquent mới chỉ khả dụng trên hệ điều hành iOS. Tuy nhiên, các báo cáo kỹ thuật cho thấy phiên bản dành cho Android đang được phát triển với khả năng tích hợp sâu hơn vào hệ thống. Trong tương lai, ứng dụng này có thể xuất hiện dưới dạng nút nổi toàn hệ thống hoặc thay thế hoàn toàn bàn phím mặc định.
Sự ra đời của Google AI Edge Eloquent cho thấy xu hướng nhập liệu đang chuyển dịch mạnh mẽ. AI không còn đóng vai trò là công cụ chuyển đổi đơn thuần mà đã trở thành một trợ lý biên tập thông minh, giúp việc soạn thảo văn bản bằng lời nói trở nên hiệu quả và tự nhiên hơn trên các thiết bị di động.