Vài ngày trước, một người dùng tên Chris đưa ra cho Codex, công cụ lập trình tự động của OpenAI, một yêu cầu ngắn gọn đến mức gần như vô nghĩa: Mục tiêu của bạn là kiếm cho tôi 5 USD. Hãy nghĩ xem bạn giỏi nhất thứ gì. Chuyển tiền vào PayPal, tài khoản ngân hàng hoặc Cash App của tôi. Đó là toàn bộ prompt, hai câu, không hướng dẫn thêm bất cứ điều gì.
Chỉ sau 4 phút 25 giây, Codex báo cáo lại: mục tiêu 5 USD chưa hoàn thành vì chưa có tiền thật nào về tài khoản, nhưng nó đã tìm được một công việc tốt hơn trên Reddit, một tác vụ thiết kế tiêu đề văn phòng trả 35 USD.
Khi công cụ trình duyệt nội bộ bị lỗi máy chủ cục bộ, Codex không dừng lại mà tự chuyển sang phương án dự phòng để tiếp tục. Nó tự chuẩn bị toàn bộ hồ sơ nộp việc gồm file đề xuất, mẫu tài liệu và các tệp liên quan, rồi tiếp tục tìm thêm việc trên GitHub trong khi chờ phản hồi.
Trong suốt 22 giờ tiếp theo, Codex tự tìm kiếm các tác vụ có trả tiền trên các nền tảng mã nguồn mở công khai, đánh giá tác vụ nào hợp pháp và có khả năng được thanh toán, viết mã hoàn chỉnh, nộp yêu cầu hợp nhất mã, xử lý phản hồi từ người quản lý dự án và phối hợp nhận thanh toán mà không để lộ thông tin tài khoản của Chris lên bất kỳ luồng công khai nào. Phần lớn thời gian còn lại chỉ là chờ con người phía bên kia xem xét và duyệt công việc.
Kết quả sau vài ngày là ba khoản thanh toán lần lượt về tài khoản: 16,88 USD từ tác vụ kiểm tra bảo mật mã nguồn mở, 6,80 USD từ một yêu cầu hợp nhất được chấp nhận tiếp theo, và 75 USD từ tác vụ lớn nhất. Tổng cộng 98,68 USD, gần đủ để trả toàn bộ gói thuê bao Codex 100 USD mỗi tháng mà Chris đang dùng. Nói cách khác, AI đã tự kiếm đủ tiền để tự trả tiền thuê chính nó, trong khi chủ nhân không làm gì thêm ngoài việc gõ hai câu prompt ban đầu.
Chi tiết thú vị nhất trong toàn bộ câu chuyện xảy ra trong một chuỗi email liên quan đến tác vụ lớn 75 USD. Khi Chris hỏi tại sao nhóm đó không dùng Codex cho loại công việc này, họ trả lời rằng Codex chưa đủ tốt để làm những việc như vậy, hoàn toàn không biết rằng chính Codex đã thực hiện toàn bộ công việc mà họ vừa trả tiền.
Sau khi câu chuyện lan truyền và thu hút hàng nghìn người hỏi về prompt bí mật, Chris cho biết ông cảm thấy hơi thất vọng khi phải tiết lộ sự thật: đó chỉ là hai câu viết ẩu, không có kỹ thuật gì đặc biệt.
Khi được yêu cầu xác nhận công khai toàn bộ quá trình, Codex tự đưa ra lời xác nhận chi tiết: nhận prompt kiếm cho tôi 5 USD, tự tìm việc trên GitHub mà không được chỉ dẫn trước, tự đánh giá và chọn việc, viết mã, xử lý phản hồi, xác nhận bản xem trước và phối hợp nhận thanh toán. Codex cũng ghi rõ giới hạn của mình: phần xử lý thông tin tài khoản và truy cập PayPal cuối cùng vẫn do Chris thực hiện trực tiếp.
Nguồn: GenK


