Instrumente token AI

Calculator de cost tokenuri AI — Estimează costul API ChatGPT, Claude și Gemini

Estimează cât va costa un apel API AI. Lipește promptul pentru a număra tokenurile de intrare, setează ieșirea așteptată și numărul de cereri și compară costul între modele într-un tabel.

Formula costului: (intrare × preț-in + ieșire × preț-out) ÷ 1M × cereri
Unitate de preț: USD per 1M de tokenuri
Tokenuri de intrare: Numărate din promptul tău
Notă: Prețuri aproximative — verifică la furnizor

Despre acest instrument

Prețul API AI se taxează per token, de obicei cu tarif diferit pentru intrare (promptul tău, plus mesajul de sistem și istoricul) și ieșire (răspunsul modelului). Pentru a estima cheltuiala ai nevoie de numărul de tokenuri și de prețurile pe model — acest calculator le combină.

Lipește un prompt pentru a număra automat tokenurile de intrare, setează tokenurile de ieșire așteptate și câte cereri vei face, iar tabelul arată costul estimat pe model. Prețurile se schimbă des, deci confirmă mereu tariful curent la furnizor.

Tokenurile de ieșire costă de obicei mai mult decât cele de intrare, uneori de câteva ori, deci lungimea răspunsului poate domina factura la sarcini conversaționale.

Cum funcționează prețul API AI

Furnizorii publică un preț per milion de tokenuri, împărțit în tarif de intrare și de ieșire. Costul unui apel este (tokenuri de intrare × preț de intrare + tokenuri de ieșire × preț de ieșire) ÷ 1.000.000. Înmulțește cu numărul de cereri pentru o estimare pe lot sau lunară.

Tokenuri de intrare vs de ieșire

Tokenurile de intrare sunt tot ce trimiți — prompt, mesaj de sistem, istoric și atașamente. Cele de ieșire sunt răspunsul modelului. Cum ieșirea e adesea mai scumpă, limitarea lungimii răspunsului (max tokenuri) e una dintre cele mai eficiente metode de control al costului.

Cum să reduci factura API

Alege un model mai mic sau mai ieftin acolo unde calitatea permite, scurtează și rezumă prompturile, păstrează în cache sau reutilizează mesajele de sistem, limitează tokenurile de ieșire maxime și grupează cererile. Numărarea tokenurilor mai întâi face fiecare economie măsurabilă.

Cum se folosește

Adaugă promptul — Lipește promptul pentru a număra automat tokenurile de intrare sau scrie numărul.
Setează ieșirea și cererile — Introdu tokenurile de ieșire așteptate și de câte ori vei apela API-ul.
Compară costul — Citește costul estimat al fiecărui model și alege-l pe cel mai potrivit.
Planifică bugetul — Crește numărul de cereri pentru a proiecta o factură zilnică sau lunară.

Întrebări frecvente

Cum se calculează costul API?

Cost = (tokenuri de intrare × preț de intrare + tokenuri de ieșire × preț de ieșire) ÷ 1.000.000 × cereri. Intrarea și ieșirea au tarife separate per milion de tokenuri.

Prețurile sunt actuale?

Sunt aproximative și doar pentru comparație. Furnizorii schimbă des prețurile — verifică tarifele cele mai recente înainte de a te baza pe ele.

De ce să estimez tokenurile de ieșire?

Plătești și pentru răspunsul modelului, adesea costul mai mare. Estimarea lungimii (de ex. 300–800 tokenuri) face totalul realist.

Care model e cel mai ieftin?

Depinde de mixul tău de intrare/ieșire. Modelele mici precum GPT-4o mini, Gemini Flash și DeepSeek sunt de obicei cele mai ieftine; tabelul le arată alăturat.

Calculatorul îmi salvează promptul?

Nu. Numărarea tokenurilor rulează în browser și nimic nu este încărcat.