Khoa học - Công nghệ
OpenAI Codex CLI dính lỗi nghiêm trọng có thể làm hỏng ổ cứng SSD chỉ sau một năm
Một lỗi cấu hình nhật ký trên OpenAI Codex CLI đang gây ra tình trạng ghi dữ liệu liên tục lên ổ cứng với tốc độ 640 TB/năm, vượt quá giới hạn chịu đựng của phần lớn SSD phổ thông hiện nay.
Người dùng công cụ OpenAI Codex CLI đang đối mặt với nguy cơ hỏng ổ cứng SSD sớm do một lỗi kỹ thuật liên quan đến hệ thống ghi nhật ký (logging). Theo các báo cáo kỹ thuật mới nhất, công cụ này đang gây áp lực cực lớn lên phần cứng lưu trữ bằng cách ghi dữ liệu liên tục, có thể làm cạn kiệt tuổi thọ của ổ cứng trong thời gian ngắn.
Cơ chế gây hại: Khi hệ thống nhật ký "tra tấn" phần cứng
Lỗi này được phát hiện sau khi người dùng nhận thấy hoạt động đĩa tăng cao bất thường trên máy tính. Qua kiểm tra chuyên sâu, nguyên nhân xuất phát từ việc OpenAI Codex liên tục ghi các nhật ký chẩn đoán vào một cơ sở dữ liệu SQLite cục bộ tại đường dẫn ~/.codex/logs_2.sqlite.
Dữ liệu thực tế cho thấy, chỉ sau khoảng 21 ngày hoạt động, ổ cứng đã phải hấp thụ khoảng 37 TB dữ liệu ghi. Nếu tính toán theo tỷ lệ năm, con số này lên tới xấp xỉ 640 TB/năm. Đây là mức ghi dữ liệu khổng lồ, đe dọa trực tiếp đến tính toàn vẹn của các linh kiện lưu trữ bán dẫn.
Phân tích kỹ thuật về cấu hình TRACE và hiện tượng khuếch đại ghi
Nguyên nhân cốt lõi nằm ở cấu hình nhật ký mặc định được thiết lập ở mức TRACE — mức độ chi tiết nhất và tạo ra nhiều dữ liệu thừa nhất trong lập trình. Ở chế độ này, hệ thống ghi lại mọi thông tin từ tải trọng WebSocket thô đến các sự kiện hệ thống tệp thông thường như việc mở passwd hay ld.so.cache.
Đáng chú ý, trình cắm này bỏ qua các biến môi trường tiêu chuẩn như RUST_LOG, khiến người dùng không có cách nào dễ dàng để giảm mức độ ghi nhật ký xuống thấp hơn. Khoảng 71% dữ liệu được ghi lại là các thông tin nhiễu ở mức TRACE, không mang lại giá trị chẩn đoán thực tế cho người dùng thông thường.
Vấn đề còn trở nên trầm trọng hơn do hiện tượng khuếch đại ghi (write amplification). Cơ sở dữ liệu SQLite không chỉ tăng kích thước mà còn thực hiện hàng chục nghìn thao tác chèn và xóa mỗi phút. Điều này khiến lượng dữ liệu thực tế ghi xuống đĩa vật lý lớn hơn nhiều so với kích thước tệp hiển thị trên hệ điều hành.
So sánh với giới hạn chịu đựng của SSD phổ thông
Để dễ hình dung, một ổ SSD tiêu dùng dung lượng 1 TB thông thường có chỉ số TBW (Total Bytes Written - tổng lượng dữ liệu có thể ghi) được bảo hành ở mức khoảng 600 TB. Với tốc độ ghi lên đến 640 TB/năm do lỗi Codex gây ra, một chiếc ổ cứng mới có thể bị đẩy đến giới hạn hỏng hóc vật lý và mất bảo hành chỉ trong vòng chưa đầy 12 tháng sử dụng liên tục.
Giải pháp khắc phục tạm thời cho người dùng
Mặc dù OpenAI đã có những cập nhật gần đây cho tính ổn định của SQLite, nhưng vấn đề về tốc độ ghi dữ liệu quá mức vẫn chưa được giải quyết triệt để trên GitHub. Trong khi chờ đợi bản vá chính thức, người dùng trên các hệ điều hành Linux và macOS có thể áp dụng biện pháp tạm thời bằng kỹ thuật liên kết tượng trưng (symlink).
Cụ thể, người dùng có thể chuyển hướng tệp ~/.codex/logs_2.sqlite sang thư mục /tmp/. Thao tác này sẽ đẩy toàn bộ dữ liệu ghi nhật ký vào bộ nhớ RAM thay vì ghi trực tiếp lên ổ cứng SSD. Vì tệp nhật ký này không chứa dữ liệu hội thoại quan trọng, việc dữ liệu bị xóa sạch sau mỗi lần khởi động lại máy sẽ không gây ảnh hưởng đến trải nghiệm người dùng, đồng thời bảo vệ ổ cứng khỏi sự bào mòn không đáng có.