Herramientas de tokens de IA
Calculadora de coste de tokens de IA — Estima el coste de API de ChatGPT, Claude y Gemini
Estima cuánto costará una llamada a la API de IA. Pega tu prompt para contar tokens de entrada, fija la salida esperada y el número de solicitudes, y compara el coste entre modelos en una tabla.
- Fórmula de coste
- (entrada × precio-ent + salida × precio-sal) ÷ 1M × solicitudes
- Unidad de precio
- USD por 1M de tokens
- Tokens de entrada
- Contados de tu prompt
- Nota
- Precios aproximados — verifica con el proveedor
Acerca de esta herramienta
El precio de la API de IA se cobra por token, normalmente a una tarifa distinta para la entrada (tu prompt, más el mensaje de sistema y el historial) y la salida (la respuesta del modelo). Para estimar el gasto necesitas los recuentos de tokens y los precios por modelo — esta calculadora combina ambos.
Pega un prompt para contar tokens de entrada automáticamente, fija los tokens de salida que esperas y cuántas solicitudes harás, y la tabla muestra el coste estimado por modelo. Los precios cambian a menudo, así que confirma siempre la tarifa actual con el proveedor.
Los tokens de salida suelen costar más que los de entrada, a veces varias veces más, así que la longitud de la respuesta puede dominar tu factura en cargas conversacionales.
Cómo funciona el precio de las API de IA
Los proveedores publican un precio por millón de tokens, dividido en tarifa de entrada y de salida. El coste de una llamada es (tokens de entrada × precio de entrada + tokens de salida × precio de salida) ÷ 1.000.000. Multiplica por el número de solicitudes para una estimación por lote o mensual.
Tokens de entrada vs de salida
Los tokens de entrada son todo lo que envías — prompt, mensaje de sistema, historial y adjuntos. Los de salida son la respuesta del modelo. Como la salida suele ser más cara, limitar la longitud de respuesta (máx. tokens) es una de las formas más eficaces de controlar el coste.
Cómo reducir tu factura de API
Elige un modelo más pequeño o barato cuando la calidad lo permita, acorta y resume los prompts, cachea o reutiliza los mensajes de sistema, limita los tokens de salida máximos y agrupa solicitudes. Contar tokens primero hace medible cada ahorro.
Cómo usar
- Añade tu prompt — Pega el prompt para contar tokens de entrada automáticamente, o escribe el número.
- Fija salida y solicitudes — Indica los tokens de salida esperados y cuántas veces llamarás a la API.
- Compara el coste — Lee el coste estimado de cada modelo y elige el más adecuado.
- Planifica el presupuesto — Sube el número de solicitudes para proyectar una factura diaria o mensual.
Preguntas frecuentes
¿Cómo se calcula el coste de la API?
Coste = (tokens de entrada × precio de entrada + tokens de salida × precio de salida) ÷ 1.000.000 × solicitudes. Entrada y salida tienen tarifas distintas por millón de tokens.
¿Los precios están actualizados?
Son aproximados y solo para comparar. Los proveedores cambian precios a menudo — verifica las tarifas más recientes antes de fiarte de una cifra.
¿Por qué estimar los tokens de salida?
También pagas la respuesta del modelo, a menudo el mayor coste. Estimar la longitud (p. ej. 300–800 tokens) hace realista el total.
¿Qué modelo es el más barato?
Depende de tu mezcla de entrada/salida. Modelos pequeños como GPT-4o mini, Gemini Flash y DeepSeek suelen ser los más baratos; la tabla los muestra en paralelo.
¿La calculadora guarda mi prompt?
No. El conteo de tokens se hace en tu navegador y nada se sube.