Vì sao AI không “one-shot” ra một website hoàn chỉnh — và cái khung bạn đang thiếu

Bài 3/5 trong chuỗi “Hành trình từ ra lệnh rồi cầu nguyện đến sản phẩm thật”.

Có một ảo tưởng phổ biến đến mức nó khiến không ít người bỏ tiền, bỏ thời gian, rồi ngồi nhìn kết quả mà tiếc.

Ảo tưởng đó nghe như sau: “Chỉ cần viết prompt đủ hay, AI sẽ nhả ra cả một website hoàn chỉnh.”

Tôi đã tự tay thử chuyện này vài trăm lần. Câu trả lời là không. Bài này nói rõ vì sao, và chỉ ra cái thứ bạn đang thiếu — thứ tạo nên gần như toàn bộ khác biệt.

“One-shot” thực ra là gì

Khi bạn ra một lệnh, AI xử lý toàn bộ yêu cầu trong một nốt nhạc, thường chỉ 1 đến 2 lượt gọi. Cái nó trả về là một thứ chạy được, nhưng tối thiểu về chức năng.

Lấy một ví dụ cụ thể cho dễ hình dung. Bạn gõ: “Tạo cho tôi một website bán khoá học, có trang chủ, trang khoá học, giỏ hàng, đăng nhập, và trang quản trị.” AI sẽ vui vẻ dựng ra một trang chủ trông cũng ổn, một trang khoá học tĩnh, và mấy cái nút “đăng nhập”, “thêm vào giỏ” mà bấm vào thì chẳng có gì xảy ra. Đứng xa nhìn thì giống website. Lại gần thì là một cái vỏ.

Quy luật tôi rút ra sau nhiều lần làm:

Một landing page đơn giản thì may ra. AI có thể làm tới nơi tới chốn.
Một website thật — có đăng nhập, có dữ liệu, có nghiệp vụ, có thanh toán — thì không đời nào xong trong một phát, dù bạn prompt kỹ đến đâu.

Chuyện này không phải lỗi của bạn, cũng chẳng phải AI dở. Nó là bản chất của việc giao một việc lớn mà không kèm theo quy trình. Bạn không thể bảo một người thợ giỏi “xây cho tôi cái nhà” rồi mong có nhà sau một câu nói. Không bản vẽ, không móng, không nghiệm thu, thứ họ dựng cho bạn sẽ là một cái lều. Nhanh thật, nhưng là cái lều.

“Ra lệnh rồi cầu nguyện”

Tôi gọi cách làm phổ biến này là ra lệnh rồi cầu nguyện. Gõ một câu thật dài, bấm Enter, rồi ngồi hy vọng điều kỳ diệu xảy ra. Vài dấu hiệu cho thấy bạn đang kẹt trong đó:

Bạn viết một prompt khổng lồ mô tả cả sản phẩm, rồi mong AI làm xong trong một lần.
Kết quả sai, bạn lại gõ thêm một prompt khổng lồ nữa để “sửa hết một lượt”.
Bạn không có khái niệm gì về thiết kế, tài liệu, hay tiêu chí nghiệm thu. Chỉ có đầu vào là lời nói, và đầu ra là hy vọng.
Mỗi lần làm lại đều bắt đầu từ con số không, vì chẳng có cấu trúc nào để AI bám vào.

Nếu thấy mình trong đó thì cũng đừng nản. Gần như ai mới dùng AI để làm sản phẩm cũng đi qua khúc này, tôi cũng vậy. Vấn đề không nằm ở bạn. Nó nằm ở chỗ bạn đang thiếu một thứ.

Thứ bạn thiếu là một quy trình

Làm phần mềm nhiều năm, tôi quen với một điều mà người ngoài ngành ít để ý: sản phẩm thật không ra đời từ một mệnh lệnh, nó ra đời từ một quy trình.

Quy trình làm phần mềm, bóc tách ra, là một chuỗi bước có thứ tự: lấy ý tưởng, rồi thiết kế, rồi cập nhật tài liệu, rồi dựng từng màn hình một, rồi viết test, rồi định nghĩa thế nào là “đạt” để nghiệm thu. Mỗi bước có đầu vào, có đầu ra, có tiêu chí rõ ràng.

Chính cái kỷ luật theo bước đó mới biến ý tưởng thành sản phẩm dùng được. Thiếu nó, AI sẽ nhảy cóc thẳng từ “ý tưởng” sang “code lung tung”, và thứ rơi ra cuối cùng lại là cái lều ban nãy.

Đó chính là Harness

Năm 2025, Anthropic và Claude Code đưa ra một khái niệm giải đúng bài toán này: Harness.

Nói harness là gì cho gọn thì nó là một bộ khung kèm một bộ quy tắc, dùng để dẫn AI agent đi đúng từng bước theo quy trình sản xuất phần mềm đã định sẵn. Nó không cho AI tuỳ hứng. Nó bảo AI: trước hết thiết kế đã, rồi viết tài liệu, rồi làm từng màn hình một, rồi tự viết test để tự kiểm tra, và chỉ được coi là xong khi chạm đủ các tiêu chí nghiệm thu.

Nói cách khác, Harness biến AI từ một đứa làm ẩu một phát thành một đội kỹ sư có kỷ luật. Đây là nấc thứ 5 trong sáu nấc thang dùng AI tôi đã vẽ ở bài trước, và nó là ranh giới thật giữa “đồ chơi AI” với “công cụ ra được sản phẩm”.

Có một hệ quả ít người để ý. Khi đã có Harness tốt, chất lượng không còn phụ thuộc quá nhiều vào chuyện model thông minh cỡ nào, mà vào chuyện quy trình ép nó làm việc kỷ luật cỡ nào. Tôi nghĩ điều này mở ra một cánh cửa khá lớn về chi phí, nhưng để dành nói kỹ ở bài sau.

Tự dựng Harness thì khó

Đến đây hay có người hỏi: vậy tôi tự dựng Harness được không.

Được, nếu bạn là kỹ sư và có thời gian. Tự tay làm nghĩa là tự thiết kế quy trình cho agent, tự viết các skill cho từng bước, tự cấu hình MCP Server để nối đúng công cụ, tự định nghĩa tiêu chí nghiệm thu, rồi tự ngồi sửa khi nó chạy sai. Đây vẫn là một việc kỹ thuật thực thụ. Tôi đã mất khá nhiều đêm cho nó, và thú thật vẫn còn vài chỗ tôi chưa hài lòng.

Tin tốt là bạn không cần dựng lại từ đầu. Giống như bạn không cần tự đúc động cơ để lái xe, cái khung Harness hoàn toàn có thể được đóng gói sẵn, để một người vibe code bình thường chỉ việc lắp vào rồi chạy. Đó là thứ tôi sẽ giới thiệu ở bài tiếp theo.

👉 Đọc tiếp Bài 4: claude_support — bộ khung Harness và skills cài sẵn để bạn ra sản phẩm thật mà không cần là kỹ sư.