เครื่องมือโทเค็น AI

ตัวนับโทเค็น Llama — นับโทเค็นออนไลน์ (ฟรี)

นับว่าข้อความของคุณใช้กี่โทเค็นกับ Llama วางหรือพิมพ์ด้านล่าง จำนวนโทเค็นจะอัปเดตแบบเรียลไทม์ เหมาะสำหรับอยู่ในกรอบบริบทของ Llama ตัดทอนพรอมป์ต์ และประเมินค่าใช้จ่าย API ก่อนส่งคำขอ

ผู้พัฒนา: Meta
กรอบบริบท: 128K โทเค็น
ตัวแยกโทเค็น: Llama BPE (estimated here)
ความแม่นยำที่นี่: ประมาณใกล้เคียง

เกี่ยวกับเครื่องมือนี้

โทเค็นคือหน่วยพื้นฐานที่โมเดลภาษาอ่าน มักเป็นชิ้นส่วนสั้น ๆ ของคำ — ในภาษาอังกฤษ หนึ่งโทเค็นประมาณ 4 อักขระ หรือราว ¾ ของคำ Llama วัดทุกอย่างเป็นโทเค็น ทั้งกรอบบริบท (ข้อความที่ใส่ได้ในหนึ่งคำขอ) และการคิดค่าบริการ API

การรู้จำนวนโทเค็นของ Llama ล่วงหน้ามีสามประโยชน์: หลีกเลี่ยงการเกินกรอบบริบทและถูกตัด ทำนายค่าใช้จ่ายของการเรียก API ได้ และตัดพรอมป์ต์ที่ยาวเพื่อให้โมเดลมีพื้นที่ตอบมากขึ้น

ตัวนับโทเค็น Llama นี้ทำงานในเบราว์เซอร์ของคุณทั้งหมด — ข้อความของคุณจะไม่ถูกอัปโหลดหรือจัดเก็บ การนับของ OpenAI (GPT) ใช้การเข้ารหัส tiktoken ที่แม่นยำ ส่วน Llama แสดงเป็นการประมาณใกล้เคียง เพราะตัวแยกโทเค็นทางการไม่ได้เผยแพร่ให้รันบนเบราว์เซอร์ สำหรับข้อความทั่วไป การประมาณมักคลาดเคลื่อนไม่กี่เปอร์เซ็นต์

Llama แปลงข้อความเป็นโทเค็นอย่างไร

Llama ไม่ได้อ่านคำหรือตัวอักษรโดยตรง แต่แบ่งข้อความเป็นโทเค็นด้วยตัวแยกระดับคำย่อย (Llama BPE (estimated here)) คำที่พบบ่อยมักเป็นหนึ่งโทเค็น ส่วนคำที่หายากหรือยาว อิโมจิ และโค้ดจะถูกแบ่งเป็นหลายโทเค็น ช่องว่างและเครื่องหมายวรรคตอนก็นับด้วย จึงทำให้ "hello world" กับ "helloworld" อาจให้จำนวนต่างกัน

ข้อความที่ไม่ใช่ภาษาอังกฤษมักใช้โทเค็นต่ออักขระมากกว่า ภาษาจีน ญี่ปุ่น เกาหลี และไทยมีความหนาแน่นเป็นพิเศษ — อักขระเดียวอาจเป็นหนึ่งหรือหลายโทเค็น — ความหมายเดียวกันจึงอาจกินโทเค็นมากกว่าภาษาอังกฤษอย่างชัดเจน

กรอบบริบทและขีดจำกัดโทเค็นของ Llama

Llama มีกรอบบริบทราว 128K โทเค็น แบ่งกันระหว่างอินพุต (พรอมป์ต์ ข้อความระบบ ประวัติ ไฟล์แนบ) และเอาต์พุต หากรวมเกินกรอบ เนื้อหาเก่าสุดจะถูกตัดทิ้งหรือคำขอถูกปฏิเสธ — การนับก่อนช่วยป้องกัน

เคล็ดลับ: เผื่อพื้นที่ให้คำตอบ ถ้าต้องการคำตอบยาว ให้คุมพรอมป์ต์ต่ำกว่าขีดจำกัดมาก ๆ เพื่อให้โมเดลเหลือโทเค็นไว้ตอบ

เคล็ดลับใช้โทเค็นน้อยลงกับ Llama

ลบคำสั่งและข้อความสำเร็จรูปที่ซ้ำซ้อน สรุปบริบทยาวแทนการวางทั้งหมด ตัดตัวอย่างที่ไม่จำเป็น และอย่าทวนข้อความระบบเดิมทุกครั้ง การลดโทเค็นช่วยให้ตอบเร็วขึ้นและลดค่าใช้จ่าย

วิธีใช้

วางข้อความ — พิมพ์หรือวางพรอมป์ต์ เอกสาร หรือโค้ดใดก็ได้ลงในกล่อง
อ่านจำนวน — ตัวเลขใหญ่คือจำนวนโทเค็นของ Llama อัปเดตแบบเรียลไทม์ พร้อมจำนวนอักขระและคำข้าง ๆ
เปรียบเทียบโมเดล — ใช้ตารางเปรียบเทียบจำนวนกับโมเดลอื่นเคียงกัน
คัดลอกหรือล้าง — คัดลอกข้อความไปใช้ที่อื่น หรือล้างแล้วเริ่มใหม่

คำถามที่พบบ่อย

ข้อความของฉันใน Llama มีกี่โทเค็น?

วางด้านบน — ตัวนับจะแสดงจำนวนโทเค็นของ Llama ทันที พร้อมจำนวนอักขระและคำ

จำนวนโทเค็นของ Llama แม่นยำไหม?

เป็นการประมาณใกล้เคียง ตัวแยกโทเค็นทางการของ Llama ไม่ทำงานบนเบราว์เซอร์ เราจึงประมาณค่า สำหรับข้อความทั่วไปมักคลาดเคลื่อนไม่กี่เปอร์เซ็นต์ ส่วนตัวเลข OpenAI/GPT ในตารางนั้นแม่นยำ

กรอบบริบทของ Llama เท่าไร?

ราว 128K โทเค็น แบ่งกันระหว่างอินพุตและเอาต์พุต ให้คุมยอดรวมต่ำกว่าขีดจำกัดนี้เพื่อเลี่ยงการตัด

จะนับโทเค็น Llama ออนไลน์ฟรีได้อย่างไร?

หน้านี้คือตัวนับโทเค็น Llama ออนไลน์ฟรี — ไม่ต้องมีบัญชีหรือติดตั้ง ทุกอย่างคำนวณในเบราว์เซอร์

ทำไมโทเค็นจึงสำคัญกับ Llama?

Llama คิดค่าบริการต่อโทเค็นและจำกัดคำขอด้วยโทเค็น จำนวนโทเค็นจึงตัดสินว่าพรอมป์ต์ของคุณใส่ได้หรือไม่และมีค่าใช้จ่ายเท่าไร

ข้อความของฉันถูกส่งไปเซิร์ฟเวอร์ไหม?

ไม่ การนับเกิดขึ้นในเบราว์เซอร์ทั้งหมด — ไม่มีการอัปโหลด บันทึก หรือจัดเก็บใด ๆ

จะลดการใช้โทเค็นอย่างไร?

ย่อพรอมป์ต์ สรุปบริบทยาว ลบคำสั่งที่ซ้ำ และตัดตัวอย่างออก โทเค็นน้อยลงหมายถึงคำขอที่เร็วและถูกลง