Công cụ token AI

Công cụ tính chi phí token AI — Ước tính chi phí API ChatGPT, Claude & Gemini

Ước tính một lần gọi API AI sẽ tốn bao nhiêu. Dán prompt để đếm token đầu vào, đặt đầu ra dự kiến và số yêu cầu, rồi so sánh chi phí giữa các mô hình trong một bảng.

Công thức chi phí: (vào × giá-vào + ra × giá-ra) ÷ 1M × số yêu cầu
Đơn vị giá: USD cho mỗi 1M token
Token đầu vào: Đếm từ prompt của bạn
Lưu ý: Giá ước tính — kiểm tra với nhà cung cấp

Giới thiệu công cụ

Giá API AI tính theo token, thường với mức khác nhau cho đầu vào (prompt, kèm thông điệp hệ thống và lịch sử) và đầu ra (câu trả lời của mô hình). Để ước tính chi phí cần số token và giá theo từng mô hình — công cụ này gộp cả hai.

Dán prompt để đếm token đầu vào tự động, đặt số token đầu ra dự kiến và số lần gọi, bảng sẽ hiển thị chi phí ước tính theo mô hình. Giá thay đổi thường xuyên, nên luôn xác nhận mức hiện hành với nhà cung cấp.

Token đầu ra thường đắt hơn token đầu vào, đôi khi gấp nhiều lần, nên độ dài câu trả lời có thể chiếm phần lớn hóa đơn với các tác vụ hội thoại.

Cách tính giá API AI

Nhà cung cấp công bố giá trên mỗi triệu token, tách thành mức đầu vào và đầu ra. Chi phí một lần gọi là (token vào × giá vào + token ra × giá ra) ÷ 1.000.000. Nhân với số yêu cầu để có ước tính theo lô hoặc theo tháng.

Token đầu vào so với đầu ra

Token đầu vào là mọi thứ bạn gửi — prompt, thông điệp hệ thống, lịch sử và tệp đính kèm. Token đầu ra là câu trả lời của mô hình. Vì đầu ra thường đắt hơn, giới hạn độ dài trả lời (max tokens) là một trong những cách kiểm soát chi phí hiệu quả nhất.

Cách giảm hóa đơn API

Chọn mô hình nhỏ hơn hoặc rẻ hơn khi chất lượng cho phép, rút ngắn và tóm tắt prompt, cache hoặc tái dùng thông điệp hệ thống, giới hạn token đầu ra tối đa và gộp các yêu cầu. Đếm token trước giúp đo lường được mỗi khoản tiết kiệm.

Cách dùng

Thêm prompt — Dán prompt để đếm token đầu vào tự động, hoặc gõ trực tiếp con số.
Đặt đầu ra & số yêu cầu — Nhập token đầu ra dự kiến và số lần gọi API.
So sánh chi phí — Đọc chi phí ước tính của từng mô hình và chọn phù hợp nhất.
Lập ngân sách — Tăng số yêu cầu để dự phóng hóa đơn theo ngày hoặc tháng.

Câu hỏi thường gặp

Chi phí API được tính thế nào?

Chi phí = (token vào × giá vào + token ra × giá ra) ÷ 1.000.000 × số yêu cầu. Đầu vào và đầu ra có mức giá riêng trên mỗi triệu token.

Giá có cập nhật không?

Giá là ước tính và chỉ để so sánh. Nhà cung cấp AI đổi giá thường xuyên — hãy kiểm tra mức mới nhất trước khi dựa vào.

Vì sao phải ước tính token đầu ra?

Bạn cũng trả tiền cho câu trả lời, thường là phần lớn chi phí. Ước tính độ dài (vd 300–800 token) giúp tổng số sát thực tế.

Mô hình nào rẻ nhất?

Tùy tỷ lệ vào/ra của bạn. Các mô hình nhỏ như GPT-4o mini, Gemini Flash và DeepSeek thường rẻ nhất; bảng hiển thị chúng cạnh nhau.

Công cụ có lưu prompt của tôi không?

Không. Việc đếm token chạy trên trình duyệt và không có gì được tải lên.