Ferramentas de tokens de IA

Calculadora de custo de tokens de IA — Estime o custo de API do ChatGPT, Claude e Gemini

Estime quanto custará uma chamada de API de IA. Cole seu prompt para contar tokens de entrada, defina a saída esperada e o número de requisições, e compare o custo entre modelos numa tabela.

Fórmula de custo
(entrada × preço-ent + saída × preço-saí) ÷ 1M × requisições
Unidade de preço
USD por 1M de tokens
Tokens de entrada
Contados do seu prompt
Nota
Preços aproximados — verifique no provedor

Sobre esta ferramenta

O preço da API de IA é cobrado por token, geralmente com tarifa diferente para entrada (seu prompt, mais mensagem de sistema e histórico) e saída (a resposta do modelo). Para estimar o gasto você precisa das contagens de tokens e dos preços por modelo — esta calculadora combina os dois.

Cole um prompt para contar os tokens de entrada automaticamente, defina os tokens de saída esperados e quantas requisições fará, e a tabela mostra o custo estimado por modelo. Os preços mudam com frequência, então confirme sempre a tarifa atual com o provedor.

Tokens de saída costumam custar mais que os de entrada, às vezes várias vezes mais, então o comprimento da resposta pode dominar a conta em cargas conversacionais.

Como funciona o preço das APIs de IA

Os provedores publicam um preço por milhão de tokens, dividido em tarifa de entrada e de saída. O custo de uma chamada é (tokens de entrada × preço de entrada + tokens de saída × preço de saída) ÷ 1.000.000. Multiplique pelo número de requisições para uma estimativa por lote ou mensal.

Tokens de entrada vs de saída

Tokens de entrada são tudo o que você envia — prompt, mensagem de sistema, histórico e anexos. Os de saída são a resposta do modelo. Como a saída costuma ser mais cara, limitar o comprimento da resposta (máx. tokens) é uma das formas mais eficazes de controlar o custo.

Como reduzir sua conta de API

Escolha um modelo menor ou mais barato quando a qualidade permitir, encurte e resuma prompts, faça cache ou reutilize mensagens de sistema, limite os tokens de saída máximos e agrupe requisições. Contar tokens primeiro torna cada economia mensurável.

Como usar

  1. Adicione seu prompt — Cole o prompt para contar tokens de entrada automaticamente, ou digite o número.
  2. Defina saída e requisições — Informe os tokens de saída esperados e quantas vezes chamará a API.
  3. Compare o custo — Veja o custo estimado de cada modelo e escolha o mais adequado.
  4. Planeje o orçamento — Aumente o número de requisições para projetar uma conta diária ou mensal.

Perguntas frequentes

Como o custo da API é calculado?

Custo = (tokens de entrada × preço de entrada + tokens de saída × preço de saída) ÷ 1.000.000 × requisições. Entrada e saída têm tarifas separadas por milhão de tokens.

Os preços estão atualizados?

São aproximados e apenas para comparação. Os provedores mudam preços com frequência — verifique as tarifas mais recentes antes de confiar num número.

Por que estimar os tokens de saída?

Você também paga pela resposta do modelo, muitas vezes o maior custo. Estimar o comprimento (ex.: 300–800 tokens) torna o total realista.

Qual modelo é o mais barato?

Depende da sua mistura de entrada/saída. Modelos menores como GPT-4o mini, Gemini Flash e DeepSeek costumam ser os mais baratos; a tabela os mostra lado a lado.

A calculadora guarda meu prompt?

Não. A contagem de tokens roda no navegador e nada é enviado.