DeepSeek V4 ra mắt: Cửa sổ ngữ cảnh 1 triệu token thách thức OpenAI và Google
DeepSeek công bố mô hình V4 với cửa sổ ngữ cảnh 1 triệu token, đạt điểm MMLU 88,5% và sở hữu chi phí vận hành thấp hơn nhiều so với các đối thủ từ Mỹ.
DeepSeek vừa chính thức giới thiệu mô hình ngôn ngữ lớn thế hệ thứ tư (V4) dưới dạng bản xem trước (Preview), đánh dấu một bước tiến mới trong cuộc đua trí tuệ nhân tạo toàn cầu. Điểm nhấn lớn nhất của lần ra mắt này là khả năng xử lý cửa sổ ngữ cảnh lên tới một triệu token, cho phép mô hình tiếp nhận và phân tích khối lượng dữ liệu khổng lồ trong một lần xử lý duy nhất.

Sức mạnh của kiến trúc DeepSeek V4 Pro
Phiên bản DeepSeek V4 Pro được xây dựng trên hệ thống định tuyến chuyên gia (Mixture-of-Experts) với cấu trúc 16×16. Theo dữ liệu công bố, mô hình đạt điểm chuẩn MMLU lên tới 88,5%, vượt xa mức 85,5% của thế hệ V3 tiền nhiệm. Sự nâng cấp này giúp DeepSeek dẫn đầu trong cả phân khúc nguồn mở lẫn nguồn đóng về khả năng tác nhân, kiến thức thực tế và hiệu suất suy luận.
Đáng chú ý, DeepSeek V4 Pro cho phép người dùng phân tích trực tiếp các bộ tài liệu hoặc mã nguồn quy mô lớn mà không cần thông qua lớp truy xuất tăng cường (RAG). Điều này giúp giảm thiểu độ trễ và tăng tính chính xác khi xử lý các tác vụ phức tạp liên quan đến dữ liệu nội bộ.
Chiến lược giá cạnh tranh và biến thể Flash
Bên cạnh phiên bản Pro, DeepSeek cũng giới thiệu biến thể V4 Flash với 284 tỷ tham số (trong đó có 13 tỷ tham số hoạt động). Đây là lựa chọn được tối ưu cho tốc độ và hiệu suất, cạnh tranh trực tiếp với các mô hình thu nhỏ như GPT-4o-mini của OpenAI hay Claude Haiku của Anthropic.
| Phiên bản | Chi phí đầu vào (1 triệu token) | Chi phí đầu ra (1 triệu token) |
|---|---|---|
| DeepSeek V4 Pro | 2,8 USD | 8,8 USD |
| DeepSeek V4 Flash | 0,4 USD | 1,2 USD |
Mức phí này được đánh giá là cực thấp so với mặt bằng chung của các mô hình AI phương Tây, tiếp nối truyền thống tối ưu chi phí mà DeepSeek từng thực hiện với các dòng R1 và V3 trước đây.
Đối đầu trực diện với GPT-5.5 và Gemini
Sự kiện ra mắt của DeepSeek diễn ra chỉ vài giờ sau khi OpenAI công bố GPT-5.5 – mô hình được kỳ vọng là thông minh nhất của hãng với khả năng tư duy sắc bén. Mặc dù OpenAI khẳng định GPT-5.5 xử lý nhanh hơn với ít token hơn, DeepSeek V4 Pro vẫn khẳng định được vị thế khi vượt trội hơn hầu hết các đối thủ mã nguồn mở.
Trên các bảng xếp hạng hiệu năng toàn cầu, sản phẩm từ Trung Quốc hiện chỉ xếp sau Gemini-Pro-3.1 của Google một khoảng cách nhỏ. Tuy nhiên, lợi thế về chi phí vận hành giúp DeepSeek trở thành lựa chọn hấp dẫn cho các doanh nghiệp đang tìm kiếm giải pháp AI hiệu quả về kinh tế nhưng vẫn đảm bảo năng lực xử lý mạnh mẽ.
