AI टोकन टूल
फ़ाइल टोकन काउंटर — PDF, Word, Excel और इमेज में टोकन गिनें
पूरी फ़ाइल के टोकन गिनें। PDF, Word दस्तावेज़, Excel शीट, टेक्स्ट फ़ाइल या इमेज छोड़ें और देखें कि यह ChatGPT/GPT-4o, Claude, Gemini, DeepSeek और Llama के लिए कितने टोकन है — सब कुछ आपके ब्राउज़र में स्थानीय रूप से पढ़ा जाता है।
- समर्थित फ़ाइलें
- PDF · DOCX · XLSX · TXT/MD/CSV · इमेज
- टेक्स्ट सटीकता
- GPT सटीक (tiktoken)
- इमेज
- अनुमानित विज़न टोकन
- गोपनीयता
- ब्राउज़र में संसाधित
इस टूल के बारे में
लंबा दस्तावेज़ टोकन काउंटर में पेस्ट करना झंझट है। यह टूल आपके लिए फ़ाइल पढ़ता है: PDF, Word और Excel (तथा टेक्स्ट या कोड) से टेक्स्ट निकालता है, फिर ठीक वैसे ही टोकन गिनता है जैसे मॉडल करता — तो आप पहले से जान जाते हैं कि यह कॉन्टेक्स्ट विंडो में आता है या नहीं और कितना खर्च होगा।
सब कुछ ब्राउज़र में चलता है। फ़ाइल JavaScript से स्थानीय रूप से खुलती है और टेक्स्ट कभी सर्वर पर अपलोड नहीं होता। OpenAI/GPT की गिनती सटीक tiktoken एन्कोडिंग उपयोग करती है; Claude, Gemini, DeepSeek और Llama निकट अनुमान हैं।
इमेज में मॉडल पिक्सेल को टेक्स्ट की तरह नहीं पढ़ते — वे इमेज के आयाम के आधार पर इनपुट टोकन लेते हैं। यह टूल बड़े मॉडलों के लिए वे विज़न टोकन अनुमानित करता है ताकि आप इमेज प्रॉम्प्ट का भी बजट बना सकें।
कौन-से फ़ाइल प्रकार समर्थित हैं
टेक्स्ट-आधारित फ़ाइलों का टेक्स्ट सटीक रूप से निकालकर गिना जाता है: PDF (डिजिटल, स्कैन नहीं), Word .docx, Excel .xlsx/.xls/.csv और .txt/.md/कोड फ़ाइलें। स्कैन किए गए PDF या टेक्स्ट की तस्वीरों में चयन योग्य टेक्स्ट नहीं होता, इसलिए वे शब्दों के बजाय इमेज (विज़न टोकन) के रूप में गिने जाते हैं।
इमेज (विज़न) टोकन कैसे गिने जाते हैं
विज़न मॉडल इमेज को टाइलों में बाँटते हैं और एक आधार लागत के साथ प्रति टाइल लागत लेते हैं, जो चौड़ाई और ऊँचाई के अनुसार स्केल होती है — बड़ी इमेज अधिक टोकन लेती है। यहाँ दिखाई संख्या प्रति मॉडल इन इनपुट टोकन का अनुमान है; सटीक संख्या प्रदाता के मौजूदा फ़ॉर्मूले और आपकी डिटेल सेटिंग के अनुसार थोड़ी बदलती है।
भेजने से पहले फ़ाइल के टोकन क्यों गिनें
लंबे PDF और स्प्रेडशीट कॉन्टेक्स्ट विंडो पार कर सकते हैं या बिल अचानक बढ़ा सकते हैं। पहले गिनना बताता है कि दस्तावेज़ बाँटें, सारांश बनाएँ या बड़ी कॉन्टेक्स्ट विंडो वाला मॉडल चुनें — और API लागत का पहले से अनुमान लगाने देता है।
उपयोग कैसे करें
- फ़ाइल छोड़ें या चुनें — PDF, Word, Excel, टेक्स्ट या इमेज को बॉक्स पर खींचें, या ब्राउज़ करने के लिए क्लिक करें।
- संख्या पढ़ें — टेक्स्ट आपके ब्राउज़र में निकाला जाता है और प्रति मॉडल तुलना के साथ लाइव गिना जाता है।
- मॉडल चुनें — सटीक GPT गिनती या Claude, Gemini, DeepSeek और Llama का अनुमान देखने के लिए मॉडल बदलें।
- संख्या पर कार्य करें — यदि फ़ाइल बहुत बड़ी है तो बाँटें, सारांश बनाएँ या बड़ी कॉन्टेक्स्ट विंडो चुनें।
अक्सर पूछे जाने वाले प्रश्न
क्या मैं PDF में टोकन गिन सकता हूँ?
हाँ। टेक्स्ट-आधारित (डिजिटल) PDF छोड़ें और टूल उसका टेक्स्ट ब्राउज़र में निकालकर टोकन गिनता है। स्कैन किए PDF में चयन योग्य टेक्स्ट नहीं होता, इसलिए उन्हें इमेज माना जाता है।
क्या यह Word और Excel के लिए काम करता है?
हाँ — Word .docx दस्तावेज़ और .xlsx/.xls/.csv शीट स्थानीय रूप से पढ़े जाते हैं और उनका टेक्स्ट गिना जाता है। पुराना बाइनरी .doc ठीक से न निकले; .docx के रूप में सहेजें।
इमेज टोकन कैसे गिने जाते हैं?
इमेज को विज़न मॉडल उनके आयाम के अनुसार इनपुट टोकन के रूप में लेते हैं। टूल चौड़ाई और ऊँचाई से प्रति मॉडल वे टोकन अनुमानित करता है।
क्या मेरी फ़ाइल कहीं अपलोड होती है?
नहीं। फ़ाइल पूरी तरह आपके ब्राउज़र में JavaScript से खुलती और विश्लेषित होती है — कुछ भी भेजा या संग्रहीत नहीं होता।
क्या फ़ाइल टोकन गिनती सटीक है?
निकाले गए टेक्स्ट के लिए OpenAI/GPT गिनती सटीक है (tiktoken); अन्य मॉडल निकट अनुमान हैं। इमेज विज़न टोकन सभी मॉडलों के लिए अनुमान हैं।
क्या फ़ाइल आकार की सीमा है?
कोई कठोर सीमा नहीं, पर बहुत बड़ी फ़ाइलें ब्राउज़र में विश्लेषित होती हैं: विशाल PDF या स्प्रेडशीट में कुछ सेकंड लग सकते हैं और अधिक मेमोरी लग सकती है।