AI Token 工具
文件 Token 计数器 — 统计 PDF、Word、Excel 和图片的 token
统计整个文件的 token。拖入 PDF、Word 文档、Excel 表格、文本文件或图片,查看它在 ChatGPT/GPT-4o、Claude、Gemini、DeepSeek 与 Llama 中是多少 token——一切都在你的浏览器本地读取。
- 支持的文件
- PDF · DOCX · XLSX · TXT/MD/CSV · 图片
- 文本精度
- GPT 精确(tiktoken)
- 图片
- 估算视觉 token
- 隐私
- 在浏览器中处理
关于此工具
把长文档粘贴到 token 计数器很麻烦。这个工具替你读取文件:从 PDF、Word 和 Excel(以及文本或代码)中提取文字,再按模型的方式精确统计 token——这样在发送前你就知道它是否容得下上下文窗口、可能花多少钱。
一切都在浏览器中运行。文件用 JavaScript 在本地打开,文字绝不会上传到服务器。OpenAI/GPT 计数使用精确的 tiktoken 编码;Claude、Gemini、DeepSeek 和 Llama 为接近的估算。
对图片而言,模型并不把像素当文字读——它们按图片尺寸计费输入 token。本工具为主流模型估算这些视觉 token,让你也能为图片提示词做预算。
支持哪些文件类型
基于文本的文件会被精确提取并计数:PDF(数字版,非扫描)、Word .docx、Excel .xlsx/.xls/.csv 以及 .txt/.md/代码文件。扫描版 PDF 或文字照片没有可选择的文字,因此按图片(视觉 token)计算,而非词。
图片(视觉)token 如何计算
视觉模型把图片切成方块,按基础成本加每块成本计费,并随宽高缩放——图片越大,token 越多。此处显示的数字是各模型这些输入 token 的估算;确切数值会随各服务商当前公式和你的细节设置略有不同。
为什么发送前先统计文件 token
长 PDF 和表格可能超出上下文窗口,或带来意外账单。先统计能告诉你应拆分文档、做摘要,还是选用更大上下文窗口的模型——并让你提前预估 API 费用。
使用方法
- 拖入或选择文件 — 把 PDF、Word、Excel、文本或图片拖到框内,或点击浏览。
- 查看计数 — 文字在浏览器中提取并实时计数,附带各模型对比。
- 选择模型 — 切换模型以查看精确的 GPT 计数,或 Claude、Gemini、DeepSeek 与 Llama 的估算。
- 据此行动 — 若文件过大,则拆分、做摘要或改用更大上下文窗口的模型。
常见问题
可以统计 PDF 的 token 吗?
可以。拖入基于文本的(数字版)PDF,工具会在浏览器中提取其文字来统计 token。扫描版 PDF 没有可选择文字,会按图片处理。
支持 Word 和 Excel 吗?
支持——Word .docx 文档和 .xlsx/.xls/.csv 表格在本地读取并统计文字。旧的二进制 .doc 可能提取不干净;请另存为 .docx。
图片 token 如何计算?
图片由视觉模型按尺寸计为输入 token。工具根据宽高为各模型估算这些 token。
我的文件会被上传吗?
不会。文件完全在浏览器中用 JavaScript 打开并分析——不上传、不存储任何内容。
文件的 token 计数精确吗?
对提取出的文字,OpenAI/GPT 计数精确(tiktoken);其他模型为接近估算。图片视觉 token 对所有模型均为估算。
有文件大小限制吗?
没有硬性限制,但很大的文件在浏览器中分析:超大 PDF 或表格可能需要几秒并占用更多内存。