Alat Token AI

Pengira Token Fail — Kira Token dalam PDF, Word, Excel & Imej

Kira token bagi keseluruhan fail. Lepaskan PDF, dokumen Word, helaian Excel, fail teks atau imej dan lihat berapa tokennya untuk ChatGPT/GPT-4o, Claude, Gemini, DeepSeek dan Llama — semuanya dibaca setempat dalam pelayar anda.

Fail disokong: PDF · DOCX · XLSX · TXT/MD/CSV · imej
Ketepatan teks: GPT tepat (tiktoken)
Imej: Anggaran token penglihatan
Privasi: Diproses dalam pelayar

Tentang alat ini

Menampal dokumen panjang ke pengira token agak menyusahkan. Alat ini membaca fail untuk anda: ia mengekstrak teks daripada PDF, Word dan Excel (serta teks atau kod), kemudian mengira token sama seperti yang dilakukan model — jadi anda tahu lebih awal sama ada ia muat dalam tetingkap konteks dan berapa kosnya.

Semuanya berjalan dalam pelayar. Fail dibuka setempat dengan JavaScript dan teks tidak pernah dimuat naik ke pelayan. Kiraan OpenAI/GPT menggunakan pengekodan tiktoken yang tepat; Claude, Gemini, DeepSeek dan Llama ialah anggaran hampir.

Untuk imej, model tidak membaca piksel sebagai teks — ia mengecaj token input berdasarkan dimensi imej. Alat ini menganggar token penglihatan tersebut untuk model besar supaya anda boleh membelanjawankan prompt imej juga.

Jenis fail yang disokong

Fail berasaskan teks akan diekstrak dan dikira teksnya dengan tepat: PDF (digital, bukan imbasan), Word .docx, Excel .xlsx/.xls/.csv dan fail .txt/.md/kod. PDF imbasan atau foto teks tiada teks boleh pilih, jadi dikira sebagai imej (token penglihatan) dan bukan perkataan.

Bagaimana token imej (penglihatan) dikira

Model penglihatan membahagikan imej kepada jubin dan mengecaj kos asas tambah kos setiap jubin, berskala mengikut lebar dan tinggi — imej lebih besar memakan lebih banyak token. Angka yang dipaparkan di sini ialah anggaran token input setiap model; angka tepat berbeza sedikit mengikut formula semasa penyedia dan tetapan perincian anda.

Mengapa kira token fail sebelum menghantar

PDF dan hamparan panjang boleh melebihi tetingkap konteks atau membengkakkan bil. Mengira dahulu memberitahu sama ada perlu memecah dokumen, meringkaskannya, atau memilih model dengan tetingkap konteks lebih besar — dan membolehkan anda meramal kos API lebih awal.

Cara guna

Lepaskan atau pilih fail — Seret PDF, Word, Excel, teks atau imej ke kotak, atau klik untuk semak imbas.
Baca kiraannya — Teks diekstrak dalam pelayar dan dikira secara langsung, dengan perbandingan setiap model.
Pilih model — Tukar model untuk melihat kiraan GPT tepat atau anggaran untuk Claude, Gemini, DeepSeek dan Llama.
Bertindak atas angka — Pecah, ringkas atau pilih tetingkap konteks lebih besar jika fail terlalu besar.

Soalan lazim

Boleh kira token dalam PDF?

Boleh. Lepaskan PDF berasaskan teks (digital) dan alat mengekstrak teksnya dalam pelayar untuk mengira token. PDF imbasan tiada teks boleh pilih, jadi dianggap imej.

Adakah ia berfungsi untuk Word dan Excel?

Ya — dokumen Word .docx dan helaian .xlsx/.xls/.csv dibaca setempat dan teksnya dikira. .doc binari lama mungkin tidak terekstrak kemas; simpan sebagai .docx.

Bagaimana token imej dikira?

Imej dicaj oleh model penglihatan sebagai token input mengikut dimensinya. Alat menganggar token tersebut setiap model daripada lebar dan tinggi.

Adakah fail saya dimuat naik ke mana-mana?

Tidak. Fail dibuka dan dianalisis sepenuhnya dalam pelayar dengan JavaScript — tiada apa-apa dihantar atau disimpan.

Adakah kiraan token fail tepat?

Untuk teks yang diekstrak, kiraan OpenAI/GPT tepat (tiktoken); model lain ialah anggaran hampir. Token penglihatan imej ialah anggaran untuk semua model.

Adakah had saiz fail?

Tiada had keras, tetapi fail sangat besar dianalisis dalam pelayar: PDF atau hamparan besar mungkin mengambil beberapa saat dan lebih banyak memori.