Công cụ token AI

Bộ đếm token AI — ChatGPT, Claude, Gemini và hơn nữa (miễn phí)

Đếm token cho mọi mô hình AI lớn cùng lúc. Dán văn bản và so sánh ChatGPT/GPT-4o, Claude, Gemini, DeepSeek và Llama cạnh nhau, kèm ký tự và từ trực tiếp.

Mô hình so sánh: GPT · Claude · Gemini · DeepSeek · Llama
Độ chính xác GPT: Chính xác (tiktoken)
Riêng tư: Chạy trên trình duyệt
Quy tắc chung: 1 token ≈ 4 ký tự ≈ ¾ từ

Giới thiệu công cụ

Mô hình ngôn ngữ lớn đọc văn bản dưới dạng token — một token bằng khoảng ¾ một từ tiếng Anh, hay chừng 4 ký tự. Mô hình tính phí theo token và áp giới hạn cửa sổ ngữ cảnh theo token, nên số token cho biết prompt có vừa không và có thể tốn bao nhiêu.

Bộ đếm này so sánh nhiều mô hình trong một khung nhìn. Số liệu OpenAI (GPT) là chính xác (mã hóa BPE tiktoken); Claude, Gemini, DeepSeek và Llama là ước tính sát vì tokenizer của chúng không được công bố cho trình duyệt. Mọi thứ chạy cục bộ — văn bản không rời thiết bị của bạn.

Các mô hình khác nhau tách cùng một văn bản hơi khác nhau, nên số trong bảng có chênh lệch. Để lập ngân sách và canh cửa sổ ngữ cảnh, hãy so sánh đúng mô hình bạn thực sự dùng.

Token là gì?

Token là một mẩu văn bản mà mô hình xử lý như một đơn vị — thường là cả một từ thông dụng, đôi khi là một phần của từ dài hoặc hiếm, và tính riêng cho dấu cách và dấu câu. Ước chừng: tiếng Anh khoảng 4 ký tự mỗi token; các ngôn ngữ CJK và mã nguồn dày hơn và dùng nhiều token hơn.

Token so với từ và ký tự

Từ và ký tự dễ đếm với con người, nhưng mô hình tính phí và giới hạn theo token. 1.000 từ tiếng Anh tương đương khoảng 1.300 token, và 1.000 token khoảng 750 từ. Con số chính xác tùy vào từ ngữ, ngôn ngữ và định dạng — dán văn bản thật để có số liệu chính xác.

Vì sao nên đếm token trước khi gọi API

Đếm trước giúp bạn ở trong cửa sổ ngữ cảnh (tránh câu trả lời bị cắt), dự báo chi phí chính xác và cắt gọn prompt quá dài. Đây là cách nhanh nhất để kiểm soát cả chất lượng lẫn chi phí khi xây dựng với LLM.

Cách dùng

Dán văn bản — Bỏ bất kỳ prompt, bài viết hay mã nguồn nào vào ô.
Chọn mô hình — Chọn mô hình cho con số chính, hoặc xem bảng để so sánh tất cả.
Dùng các con số — Ở trong cửa sổ ngữ cảnh và ước tính chi phí trước khi gọi API.
Sao chép hoặc xóa — Sao chép văn bản đi nơi khác, hoặc xóa và thử prompt mới.

Câu hỏi thường gặp

Token trong AI là gì?

Token là một mẩu văn bản, thường là một phần của từ. Với tiếng Anh: 1 token ≈ 4 ký tự ≈ ¾ từ; CJK và mã nguồn thì dày hơn.

Mô hình nào cho số liệu chính xác?

Mô hình OpenAI/GPT dùng mã hóa tiktoken chính xác. Claude, Gemini, DeepSeek và Llama là ước tính sát vì tokenizer của chúng không công khai cho trình duyệt.

1.000 từ là bao nhiêu token?

Khoảng 1.300 token trong tiếng Anh. Dán văn bản phía trên để có con số chính xác cho từng mô hình.

Bộ đếm token AI này miễn phí chứ?

Đúng — hoàn toàn miễn phí, không đăng ký, không cài đặt. Nó chạy trên trình duyệt.

Có chạy offline và riêng tư không?

Việc đếm chạy cục bộ và văn bản không bao giờ được tải lên. Bộ mã hóa GPT chính xác tải một lần từ CDN; nếu không được thì dùng ước tính.

Vì sao các mô hình hiển thị số khác nhau?

Mỗi mô hình dùng tokenizer riêng, nên cùng một văn bản sẽ tách thành số token khác nhau. Hãy so sánh đúng mô hình bạn dùng.