Instrumente token AI
Contor de tokenuri din fișier — Numără tokenuri în PDF, Word, Excel și imagini
Numără tokenurile unui fișier întreg. Trage un PDF, document Word, foaie Excel, fișier text sau imagine și vezi câte tokenuri sunt pentru ChatGPT/GPT-4o, Claude, Gemini, DeepSeek și Llama — totul este citit local în browser.
- Fișiere acceptate
- PDF · DOCX · XLSX · TXT/MD/CSV · imagini
- Precizie text
- GPT exact (tiktoken)
- Imagini
- Tokenuri de viziune estimate
- Confidențialitate
- Procesat în browser
Despre acest instrument
Lipirea unui document lung într-un contor de tokenuri e incomodă. Acest instrument citește fișierul pentru tine: extrage textul din PDF, Word și Excel (și text sau cod), apoi numără tokenurile exact cum ar face modelul — așa știi dinainte dacă încape în fereastra de context și cât poate costa.
Totul rulează în browser. Fișierul este deschis local în JavaScript și textul nu este niciodată încărcat pe un server. Numărătorile OpenAI/GPT folosesc codarea exactă tiktoken; Claude, Gemini, DeepSeek și Llama sunt estimări apropiate.
La imagini, modelele nu citesc pixelii ca text — taxează tokenuri de intrare în funcție de dimensiunile imaginii. Acest instrument estimează acele tokenuri de viziune pentru modelele mari, ca să-ți poți bugeta și prompturile cu imagini.
Ce tipuri de fișiere sunt acceptate
Fișierelor text li se extrage și numără textul exact: PDF (digital, nu scanat), Word .docx, Excel .xlsx/.xls/.csv și fișiere .txt/.md/cod. PDF-urile scanate sau pozele cu text nu au text selectabil, deci se numără ca imagine (tokenuri de viziune), nu ca cuvinte.
Cum se numără tokenurile de imagine (viziune)
Modelele de viziune împart imaginea în plăci și taxează un cost de bază plus un cost per placă, scalat după lățime și înălțime — o imagine mai mare costă mai multe tokenuri. Numărul afișat aici este o estimare a acestor tokenuri de intrare per model; valoarea exactă variază ușor cu formula actuală a furnizorului și nivelul tău de detaliu.
De ce să numeri tokenurile unui fișier înainte de a-l trimite
PDF-urile și foile de calcul lungi pot depăși fereastra de context sau umfla factura. Numărarea în avans îți spune dacă să împarți documentul, să-l rezumi sau să alegi un model cu fereastră de context mai mare — și îți permite să prevezi costul API dinainte.
Cum se folosește
- Trage sau alege un fișier — Trage un PDF, Word, Excel, text sau imagine pe casetă ori dă clic pentru a răsfoi.
- Citește numărul — Textul este extras în browser și numărat live, cu o comparație per model.
- Alege modelul — Schimbă modelul pentru a vedea numărul exact GPT sau estimarea pentru Claude, Gemini, DeepSeek și Llama.
- Acționează în funcție de număr — Împarte, rezumă sau alege o fereastră de context mai mare dacă fișierul e prea mare.
Întrebări frecvente
Pot număra tokenuri într-un PDF?
Da. Trage un PDF text (digital) și instrumentul îi extrage textul în browser pentru a număra tokenurile. PDF-urile scanate nu au text selectabil, deci sunt tratate ca imagini.
Funcționează pentru Word și Excel?
Da — documentele Word .docx și foile .xlsx/.xls/.csv sunt citite local și textul lor numărat. .doc-ul binar vechi s-ar putea să nu se extragă curat; salvează ca .docx.
Cum se numără tokenurile de imagine?
Imaginile sunt taxate de modelele de viziune ca tokenuri de intrare după dimensiuni. Instrumentul estimează acele tokenuri per model din lățime și înălțime.
Fișierul meu este încărcat undeva?
Nu. Fișierul este deschis și analizat integral în browser, în JavaScript — nimic nu este trimis sau stocat.
Numărul de tokenuri al fișierului este exact?
Pentru textul extras, numărătorile OpenAI/GPT sunt exacte (tiktoken); alte modele sunt estimări apropiate. Tokenurile de viziune ale imaginilor sunt estimări pentru toate modelele.
Există o limită de mărime?
Nu există o limită strictă, dar fișierele foarte mari sunt analizate în browser: un PDF sau o foaie enormă poate dura câteva secunde și folosi mai multă memorie.