AI टोकन टूल

फ़ाइल टोकन काउंटर — PDF, Word, Excel और इमेज में टोकन गिनें

पूरी फ़ाइल के टोकन गिनें। PDF, Word दस्तावेज़, Excel शीट, टेक्स्ट फ़ाइल या इमेज छोड़ें और देखें कि यह ChatGPT/GPT-4o, Claude, Gemini, DeepSeek और Llama के लिए कितने टोकन है — सब कुछ आपके ब्राउज़र में स्थानीय रूप से पढ़ा जाता है।

समर्थित फ़ाइलें
PDF · DOCX · XLSX · TXT/MD/CSV · इमेज
टेक्स्ट सटीकता
GPT सटीक (tiktoken)
इमेज
अनुमानित विज़न टोकन
गोपनीयता
ब्राउज़र में संसाधित

इस टूल के बारे में

लंबा दस्तावेज़ टोकन काउंटर में पेस्ट करना झंझट है। यह टूल आपके लिए फ़ाइल पढ़ता है: PDF, Word और Excel (तथा टेक्स्ट या कोड) से टेक्स्ट निकालता है, फिर ठीक वैसे ही टोकन गिनता है जैसे मॉडल करता — तो आप पहले से जान जाते हैं कि यह कॉन्टेक्स्ट विंडो में आता है या नहीं और कितना खर्च होगा।

सब कुछ ब्राउज़र में चलता है। फ़ाइल JavaScript से स्थानीय रूप से खुलती है और टेक्स्ट कभी सर्वर पर अपलोड नहीं होता। OpenAI/GPT की गिनती सटीक tiktoken एन्कोडिंग उपयोग करती है; Claude, Gemini, DeepSeek और Llama निकट अनुमान हैं।

इमेज में मॉडल पिक्सेल को टेक्स्ट की तरह नहीं पढ़ते — वे इमेज के आयाम के आधार पर इनपुट टोकन लेते हैं। यह टूल बड़े मॉडलों के लिए वे विज़न टोकन अनुमानित करता है ताकि आप इमेज प्रॉम्प्ट का भी बजट बना सकें।

कौन-से फ़ाइल प्रकार समर्थित हैं

टेक्स्ट-आधारित फ़ाइलों का टेक्स्ट सटीक रूप से निकालकर गिना जाता है: PDF (डिजिटल, स्कैन नहीं), Word .docx, Excel .xlsx/.xls/.csv और .txt/.md/कोड फ़ाइलें। स्कैन किए गए PDF या टेक्स्ट की तस्वीरों में चयन योग्य टेक्स्ट नहीं होता, इसलिए वे शब्दों के बजाय इमेज (विज़न टोकन) के रूप में गिने जाते हैं।

इमेज (विज़न) टोकन कैसे गिने जाते हैं

विज़न मॉडल इमेज को टाइलों में बाँटते हैं और एक आधार लागत के साथ प्रति टाइल लागत लेते हैं, जो चौड़ाई और ऊँचाई के अनुसार स्केल होती है — बड़ी इमेज अधिक टोकन लेती है। यहाँ दिखाई संख्या प्रति मॉडल इन इनपुट टोकन का अनुमान है; सटीक संख्या प्रदाता के मौजूदा फ़ॉर्मूले और आपकी डिटेल सेटिंग के अनुसार थोड़ी बदलती है।

भेजने से पहले फ़ाइल के टोकन क्यों गिनें

लंबे PDF और स्प्रेडशीट कॉन्टेक्स्ट विंडो पार कर सकते हैं या बिल अचानक बढ़ा सकते हैं। पहले गिनना बताता है कि दस्तावेज़ बाँटें, सारांश बनाएँ या बड़ी कॉन्टेक्स्ट विंडो वाला मॉडल चुनें — और API लागत का पहले से अनुमान लगाने देता है।

उपयोग कैसे करें

  1. फ़ाइल छोड़ें या चुनें — PDF, Word, Excel, टेक्स्ट या इमेज को बॉक्स पर खींचें, या ब्राउज़ करने के लिए क्लिक करें।
  2. संख्या पढ़ें — टेक्स्ट आपके ब्राउज़र में निकाला जाता है और प्रति मॉडल तुलना के साथ लाइव गिना जाता है।
  3. मॉडल चुनें — सटीक GPT गिनती या Claude, Gemini, DeepSeek और Llama का अनुमान देखने के लिए मॉडल बदलें।
  4. संख्या पर कार्य करें — यदि फ़ाइल बहुत बड़ी है तो बाँटें, सारांश बनाएँ या बड़ी कॉन्टेक्स्ट विंडो चुनें।

अक्सर पूछे जाने वाले प्रश्न

क्या मैं PDF में टोकन गिन सकता हूँ?

हाँ। टेक्स्ट-आधारित (डिजिटल) PDF छोड़ें और टूल उसका टेक्स्ट ब्राउज़र में निकालकर टोकन गिनता है। स्कैन किए PDF में चयन योग्य टेक्स्ट नहीं होता, इसलिए उन्हें इमेज माना जाता है।

क्या यह Word और Excel के लिए काम करता है?

हाँ — Word .docx दस्तावेज़ और .xlsx/.xls/.csv शीट स्थानीय रूप से पढ़े जाते हैं और उनका टेक्स्ट गिना जाता है। पुराना बाइनरी .doc ठीक से न निकले; .docx के रूप में सहेजें।

इमेज टोकन कैसे गिने जाते हैं?

इमेज को विज़न मॉडल उनके आयाम के अनुसार इनपुट टोकन के रूप में लेते हैं। टूल चौड़ाई और ऊँचाई से प्रति मॉडल वे टोकन अनुमानित करता है।

क्या मेरी फ़ाइल कहीं अपलोड होती है?

नहीं। फ़ाइल पूरी तरह आपके ब्राउज़र में JavaScript से खुलती और विश्लेषित होती है — कुछ भी भेजा या संग्रहीत नहीं होता।

क्या फ़ाइल टोकन गिनती सटीक है?

निकाले गए टेक्स्ट के लिए OpenAI/GPT गिनती सटीक है (tiktoken); अन्य मॉडल निकट अनुमान हैं। इमेज विज़न टोकन सभी मॉडलों के लिए अनुमान हैं।

क्या फ़ाइल आकार की सीमा है?

कोई कठोर सीमा नहीं, पर बहुत बड़ी फ़ाइलें ब्राउज़र में विश्लेषित होती हैं: विशाल PDF या स्प्रेडशीट में कुछ सेकंड लग सकते हैं और अधिक मेमोरी लग सकती है।