ИИ-инструменты для токенов

Счётчик токенов файла — Подсчёт токенов в PDF, Word, Excel и изображениях

Подсчитайте токены целого файла. Перетащите PDF, документ Word, лист Excel, текстовый файл или изображение и узнайте, сколько это токенов для ChatGPT/GPT-4o, Claude, Gemini, DeepSeek и Llama — всё читается локально в браузере.

Поддерживаемые файлы
PDF · DOCX · XLSX · TXT/MD/CSV · изображения
Точность текста
GPT точно (tiktoken)
Изображения
Оценка токенов зрения
Конфиденциальность
Обработка в браузере

Об этом инструменте

Вставлять длинный документ в счётчик токенов неудобно. Этот инструмент читает файл за вас: извлекает текст из PDF, Word и Excel (а также из текста или кода) и считает токены так же, как это сделала бы модель — вы заранее знаете, поместится ли он в окно контекста и сколько может стоить.

Всё работает в браузере. Файл открывается локально с помощью JavaScript, а текст никогда не загружается на сервер. Подсчёт OpenAI/GPT использует точную кодировку tiktoken; Claude, Gemini, DeepSeek и Llama — близкие оценки.

Для изображений модели не читают пиксели как текст — они тарифицируют входные токены по размерам изображения. Этот инструмент оценивает такие токены зрения для крупных моделей, чтобы вы могли планировать и запросы с изображениями.

Какие типы файлов поддерживаются

У текстовых файлов текст извлекается и считается точно: PDF (цифровой, не скан), Word .docx, Excel .xlsx/.xls/.csv и файлы .txt/.md/код. Сканы PDF или фото текста не содержат выделяемого текста, поэтому считаются изображением (токены зрения), а не словами.

Как считаются токены изображения (зрения)

Модели зрения делят изображение на тайлы и тарифицируют базовую стоимость плюс стоимость за тайл, масштабируясь по ширине и высоте — большее изображение стоит больше токенов. Показанное здесь число — оценка этих входных токенов по моделям; точное значение немного меняется в зависимости от текущей формулы провайдера и уровня детализации.

Зачем считать токены файла перед отправкой

Длинные PDF и таблицы могут превысить окно контекста или неожиданно увеличить счёт. Подсчёт заранее подсказывает, разбить ли документ, сжать его или выбрать модель с бóльшим окном контекста — и позволяет заранее оценить стоимость API.

Как пользоваться

  1. Перетащите или выберите файл — Перетащите PDF, Word, Excel, текст или изображение в поле либо нажмите для выбора.
  2. Прочитайте число — Текст извлекается в браузере и считается в реальном времени, со сравнением по моделям.
  3. Выберите модель — Переключайте модели, чтобы увидеть точный подсчёт GPT или оценку для Claude, Gemini, DeepSeek и Llama.
  4. Действуйте по числу — Разбейте, сожмите или выберите бóльшее окно контекста, если файл слишком велик.

Частые вопросы

Можно ли подсчитать токены в PDF?

Да. Перетащите текстовый (цифровой) PDF — инструмент извлечёт его текст в браузере и подсчитает токены. У сканов PDF нет выделяемого текста, поэтому они считаются изображениями.

Работает ли для Word и Excel?

Да — документы Word .docx и таблицы .xlsx/.xls/.csv читаются локально, а их текст считается. Старый бинарный .doc может извлечься некорректно; сохраните как .docx.

Как считаются токены изображения?

Изображения тарифицируются моделями зрения как входные токены по их размерам. Инструмент оценивает эти токены по моделям из ширины и высоты.

Загружается ли мой файл куда-либо?

Нет. Файл открывается и анализируется полностью в браузере на JavaScript — ничего не отправляется и не сохраняется.

Точен ли подсчёт токенов файла?

Для извлечённого текста подсчёт OpenAI/GPT точный (tiktoken); другие модели — близкие оценки. Токены зрения изображений — оценки для всех моделей.

Есть ли ограничение на размер файла?

Жёсткого ограничения нет, но очень большие файлы анализируются в браузере: огромный PDF или таблица может занять несколько секунд и больше памяти.