Narzędzia tokenów AI

Licznik tokenów z pliku — Policz tokeny w PDF, Word, Excel i obrazach

Policz tokeny całego pliku. Upuść PDF, dokument Word, arkusz Excel, plik tekstowy lub obraz i zobacz, ile to tokenów dla ChatGPT/GPT-4o, Claude, Gemini, DeepSeek i Llama — wszystko jest czytane lokalnie w przeglądarce.

Obsługiwane pliki: PDF · DOCX · XLSX · TXT/MD/CSV · obrazy
Dokładność tekstu: GPT dokładnie (tiktoken)
Obrazy: Szacowane tokeny wizji
Prywatność: Przetwarzane w przeglądarce

O tym narzędziu

Wklejanie długiego dokumentu do licznika tokenów jest niewygodne. To narzędzie czyta plik za Ciebie: wyodrębnia tekst z PDF, Word i Excel (oraz tekstu lub kodu), a następnie liczy tokeny dokładnie tak, jak zrobiłby to model — więc wiesz z góry, czy zmieści się w oknie kontekstu i ile może kosztować.

Wszystko działa w przeglądarce. Plik jest otwierany lokalnie w JavaScript, a tekst nigdy nie jest wysyłany na serwer. Liczby OpenAI/GPT używają dokładnego kodowania tiktoken; Claude, Gemini, DeepSeek i Llama to bliskie szacunki.

W przypadku obrazów modele nie czytają pikseli jako tekstu — naliczają tokeny wejściowe na podstawie wymiarów obrazu. To narzędzie szacuje te tokeny wizji dla dużych modeli, abyś mógł też budżetować prompty z obrazami.

Jakie typy plików są obsługiwane

Pliki tekstowe mają tekst wyodrębniony i liczony dokładnie: PDF (cyfrowy, nie skan), Word .docx, Excel .xlsx/.xls/.csv oraz pliki .txt/.md/kod. Zeskanowane PDF-y lub zdjęcia tekstu nie mają zaznaczalnego tekstu, więc liczą się jako obraz (tokeny wizji), a nie słowa.

Jak liczone są tokeny obrazu (wizji)

Modele wizyjne dzielą obraz na kafelki i naliczają koszt bazowy plus koszt za kafelek, skalowany do szerokości i wysokości — większy obraz kosztuje więcej tokenów. Pokazana tu liczba to szacunek tych tokenów wejściowych na model; dokładna liczba różni się nieco zależnie od aktualnej formuły dostawcy i poziomu szczegółów.

Po co liczyć tokeny pliku przed wysłaniem

Długie PDF-y i arkusze mogą przekroczyć okno kontekstu lub zawyżyć rachunek. Policzenie najpierw mówi, czy podzielić dokument, streścić go, czy wybrać model z większym oknem kontekstu — i pozwala przewidzieć koszt API z wyprzedzeniem.

Jak używać

Upuść lub wybierz plik — Przeciągnij PDF, Word, Excel, tekst lub obraz na pole albo kliknij, by przeglądać.
Odczytaj liczbę — Tekst jest wyodrębniany w przeglądarce i liczony na żywo, z porównaniem per model.
Wybierz model — Zmień model, aby zobaczyć dokładną liczbę GPT lub szacunek dla Claude, Gemini, DeepSeek i Llama.
Działaj na podstawie liczby — Podziel, streść lub wybierz większe okno kontekstu, jeśli plik jest za duży.

Najczęstsze pytania

Czy mogę policzyć tokeny w PDF?

Tak. Upuść tekstowy (cyfrowy) PDF, a narzędzie wyodrębni jego tekst w przeglądarce, by policzyć tokeny. Zeskanowane PDF-y nie mają zaznaczalnego tekstu, więc traktowane są jak obrazy.

Czy działa dla Word i Excel?

Tak — dokumenty Word .docx i arkusze .xlsx/.xls/.csv są czytane lokalnie, a ich tekst liczony. Stare binarne .doc może się nie wyodrębnić poprawnie; zapisz jako .docx.

Jak liczone są tokeny obrazu?

Obrazy są naliczane przez modele wizyjne jako tokeny wejściowe według wymiarów. Narzędzie szacuje te tokeny per model na podstawie szerokości i wysokości.

Czy mój plik jest gdziekolwiek wysyłany?

Nie. Plik jest otwierany i analizowany w całości w przeglądarce w JavaScript — nic nie jest wysyłane ani przechowywane.

Czy liczba tokenów pliku jest dokładna?

Dla wyodrębnionego tekstu liczby OpenAI/GPT są dokładne (tiktoken); inne modele to bliskie szacunki. Tokeny wizji obrazów to szacunki dla wszystkich modeli.

Czy jest limit rozmiaru pliku?

Brak twardego limitu, ale bardzo duże pliki są analizowane w przeglądarce: ogromny PDF lub arkusz może zająć kilka sekund i więcej pamięci.