Công cụ token AI

Bộ đếm token từ tệp — Đếm token trong PDF, Word, Excel & ảnh

Đếm token cho cả một tệp. Thả PDF, tài liệu Word, bảng Excel, tệp văn bản hoặc ảnh vào và xem nó là bao nhiêu token với ChatGPT/GPT-4o, Claude, Gemini, DeepSeek và Llama — mọi thứ được đọc cục bộ ngay trên trình duyệt.

Tệp hỗ trợ: PDF · DOCX · XLSX · TXT/MD/CSV · ảnh
Độ chính xác văn bản: GPT chính xác (tiktoken)
Ảnh: Ước tính token thị giác
Riêng tư: Xử lý trên trình duyệt

Giới thiệu công cụ

Dán một tài liệu dài vào bộ đếm token khá bất tiện. Công cụ này đọc tệp giúp bạn: trích văn bản từ PDF, Word và Excel (cùng văn bản hay mã nguồn), rồi đếm token đúng theo cách mô hình làm — nên bạn biết trước nó có vừa cửa sổ ngữ cảnh không và tốn bao nhiêu.

Mọi thứ chạy trên trình duyệt. Tệp được mở cục bộ bằng JavaScript và văn bản không bao giờ được tải lên server. Số liệu OpenAI/GPT dùng mã hóa tiktoken chính xác; Claude, Gemini, DeepSeek và Llama là ước tính sát.

Với ảnh, mô hình không đọc điểm ảnh thành văn bản — chúng tính token đầu vào dựa trên kích thước ảnh. Công cụ này ước tính các token thị giác đó cho những mô hình lớn để bạn cũng dự trù được prompt có ảnh.

Những loại tệp được hỗ trợ

Tệp dạng văn bản sẽ được trích và đếm chính xác: PDF (số, không phải scan), Word .docx, Excel .xlsx/.xls/.csv và tệp .txt/.md/mã nguồn. PDF scan hay ảnh chụp chữ không có văn bản chọn được, nên tính như ảnh (token thị giác) thay vì từ.

Cách đếm token ảnh (thị giác)

Mô hình thị giác chia ảnh thành các ô và tính một chi phí nền cộng chi phí mỗi ô, co giãn theo chiều rộng và cao — ảnh lớn hơn tốn nhiều token hơn. Con số hiển thị ở đây là ước tính token đầu vào theo từng mô hình; số chính xác thay đổi đôi chút theo công thức hiện hành của nhà cung cấp và mức chi tiết bạn chọn.

Vì sao nên đếm token của tệp trước khi gửi

PDF và bảng tính dài có thể vượt cửa sổ ngữ cảnh hoặc đội hóa đơn bất ngờ. Đếm trước cho biết nên chia nhỏ tài liệu, tóm tắt, hay chọn mô hình có cửa sổ ngữ cảnh lớn hơn — và giúp dự báo chi phí API từ sớm.

Cách dùng

Thả hoặc chọn tệp — Kéo PDF, Word, Excel, văn bản hoặc ảnh vào ô, hoặc bấm để duyệt tệp.
Đọc số token — Văn bản được trích ngay trên trình duyệt và đếm trực tiếp, kèm so sánh theo từng mô hình.
Chọn mô hình — Đổi mô hình để xem số GPT chính xác hoặc ước tính cho Claude, Gemini, DeepSeek và Llama.
Hành động theo con số — Chia nhỏ, tóm tắt hoặc chọn cửa sổ ngữ cảnh lớn hơn nếu tệp quá lớn.

Câu hỏi thường gặp

Tôi có đếm được token trong PDF không?

Có. Thả một PDF dạng văn bản (số) và công cụ trích văn bản ngay trên trình duyệt để đếm token. PDF scan không có văn bản chọn được nên được coi là ảnh.

Có dùng được cho Word và Excel không?

Có — tài liệu Word .docx và bảng tính .xlsx/.xls/.csv được đọc cục bộ và đếm văn bản. Tệp .doc nhị phân cũ có thể trích không sạch; hãy lưu dưới dạng .docx.

Token ảnh được đếm thế nào?

Ảnh được mô hình thị giác tính là token đầu vào dựa trên kích thước. Công cụ ước tính token đó theo từng mô hình từ chiều rộng và chiều cao.

Tệp của tôi có bị tải lên đâu không?

Không. Tệp được mở và phân tích hoàn toàn trên trình duyệt bằng JavaScript — không có gì được gửi đi hay lưu trữ.

Số token của tệp có chính xác không?

Với văn bản trích ra, số liệu OpenAI/GPT là chính xác (tiktoken); các mô hình khác là ước tính sát. Token thị giác của ảnh là ước tính cho mọi mô hình.

Có giới hạn dung lượng tệp không?

Không có giới hạn cứng, nhưng tệp rất lớn được phân tích trên trình duyệt nên PDF hay bảng tính khổng lồ có thể mất vài giây và tốn nhiều bộ nhớ hơn.