เครื่องมือโทเค็น AI
ตัวนับโทเค็น AI — ChatGPT, Claude, Gemini และอื่น ๆ (ฟรี)
นับโทเค็นของทุกโมเดล AI ใหญ่พร้อมกัน วางข้อความแล้วเปรียบเทียบ ChatGPT/GPT-4o, Claude, Gemini, DeepSeek และ Llama เคียงกัน พร้อมจำนวนอักขระและคำแบบเรียลไทม์
- โมเดลที่เทียบ
- GPT · Claude · Gemini · DeepSeek · Llama
- ความแม่นยำ GPT
- แม่นยำ (tiktoken)
- ความเป็นส่วนตัว
- ทำงานในเบราว์เซอร์
- หลักทั่วไป
- 1 โทเค็น ≈ 4 อักขระ ≈ ¾ คำ
เกี่ยวกับเครื่องมือนี้
โมเดลภาษาขนาดใหญ่อ่านข้อความเป็นโทเค็น — หนึ่งโทเค็นประมาณ ¾ ของคำภาษาอังกฤษ หรือราว 4 อักขระ โมเดลคิดค่าบริการต่อโทเค็นและกำหนดขีดจำกัดกรอบบริบทเป็นโทเค็น จำนวนโทเค็นจึงบอกว่าพรอมป์ต์จะใส่ได้ไหมและอาจมีค่าใช้จ่ายเท่าใด
ตัวนับนี้เปรียบเทียบหลายโมเดลในมุมมองเดียว ตัวเลข OpenAI (GPT) แม่นยำ (การเข้ารหัส BPE ของ tiktoken) ส่วน Claude, Gemini, DeepSeek และ Llama เป็นการประมาณใกล้เคียง เพราะตัวแยกโทเค็นไม่ได้เผยแพร่ให้เบราว์เซอร์ ทุกอย่างทำงานในเครื่อง — ข้อความไม่ออกจากอุปกรณ์ของคุณ
โมเดลต่างกันแยกโทเค็นข้อความเดียวกันต่างกันเล็กน้อย ตัวเลขในตารางจึงไม่เท่ากัน สำหรับงบประมาณและกรอบบริบท ให้เทียบโมเดลที่คุณใช้จริง
โทเค็นคืออะไร?
โทเค็นคือชิ้นส่วนข้อความที่โมเดลประมวลผลเป็นหน่วยเดียว — มักเป็นคำที่พบบ่อยทั้งคำ บางครั้งเป็นส่วนของคำที่ยาวหรือหายาก และนับช่องว่างกับเครื่องหมายวรรคตอนแยกต่างหาก เป็นแนวทาง: ภาษาอังกฤษราว 4 อักขระต่อโทเค็น ภาษากลุ่ม CJK และซอร์สโค้ดหนาแน่นกว่าและใช้โทเค็นมากกว่า
โทเค็น เทียบกับ คำ และ อักขระ
คำและอักขระมนุษย์นับง่าย แต่โมเดลคิดค่าและจำกัดด้วยโทเค็น 1,000 คำภาษาอังกฤษราว 1,300 โทเค็น และ 1,000 โทเค็นราว 750 คำ ตัวเลขที่แน่นอนขึ้นกับคำศัพท์ ภาษา และรูปแบบ — วางข้อความจริงเพื่อให้นับได้แม่นยำ
ทำไมต้องนับโทเค็นก่อนเรียก API
การนับก่อนช่วยให้อยู่ในกรอบบริบท (ไม่ถูกตัดคำตอบ) ทำนายค่าใช้จ่ายได้แม่น และตัดพรอมป์ต์ที่ยาวเกินไป เป็นวิธีที่เร็วที่สุดในการคุมทั้งคุณภาพและค่าใช้จ่ายเมื่อพัฒนาด้วย LLM
วิธีใช้
- วางข้อความ — ใส่พรอมป์ต์ บทความ หรือโค้ดใดก็ได้ลงในกล่อง
- เลือกโมเดล — เลือกโมเดลสำหรับตัวเลขหลัก หรืออ่านตารางเพื่อเทียบทั้งหมด
- ใช้ตัวเลข — อยู่ในกรอบบริบทและประเมินค่าใช้จ่ายก่อนเรียก API
- คัดลอกหรือล้าง — คัดลอกข้อความไปที่อื่น หรือล้างแล้วลองพรอมป์ต์ใหม่
คำถามที่พบบ่อย
โทเค็นใน AI คืออะไร?
โทเค็นคือชิ้นส่วนข้อความ มักเป็นส่วนของคำ ในภาษาอังกฤษ: 1 โทเค็น ≈ 4 อักขระ ≈ ¾ คำ ส่วน CJK และโค้ดหนาแน่นกว่า
โมเดลใดให้จำนวนแม่นยำ?
โมเดล OpenAI/GPT ใช้การเข้ารหัส tiktoken ที่แม่นยำ ส่วน Claude, Gemini, DeepSeek และ Llama เป็นการประมาณใกล้เคียงเพราะตัวแยกโทเค็นไม่เปิดให้เบราว์เซอร์
1,000 คำกี่โทเค็น?
ภาษาอังกฤษราว 1,300 โทเค็น วางข้อความด้านบนเพื่อดูตัวเลขแม่นยำของแต่ละโมเดล
ตัวนับโทเค็น AI นี้ฟรีไหม?
ฟรี — ฟรีทั้งหมด ไม่ต้องสมัครหรือติดตั้ง ทำงานในเบราว์เซอร์
ทำงานออฟไลน์และเป็นส่วนตัวไหม?
การนับทำในเครื่องและข้อความไม่ถูกอัปโหลด ตัวเข้ารหัส GPT ที่แม่นยำโหลดครั้งเดียวจาก CDN หากโหลดไม่ได้จะใช้การประมาณ
ทำไมโมเดลต่างกันแสดงจำนวนต่างกัน?
แต่ละโมเดลใช้ตัวแยกโทเค็นของตน ข้อความเดียวกันจึงแยกเป็นจำนวนโทเค็นต่างกัน ให้เทียบโมเดลที่คุณใช้จริง