Skip to content

Contador de Tokens y Calculadora de Coste API

Tokens en tu prompt, dólares en tu factura — ambos estimados mientras escribes.

Buğra SözeriHerramientas de IA
Updated · Published
Reviewed by Equipo editorial de Convertitive

El número de tokens y el gasto en API escalan de forma lineal. Conocer el recuento de antemano te permite dimensionar correctamente las ventanas de contexto, presupuestar las ejecuciones de API y detectar prompts que no cabrán. El widget de abajo estima los tokens de forma heurística (sin tokenizador en el navegador), aplica el resultado a los precios actuales por millón para los principales modelos alojados y calcula un coste por llamada basado en un ratio elegido de salida a entrada.

Characters
219
Words
33
Tokens (est.)
55
Style detected
Prose

Per-call API cost

Estimates assume the input above plus an output of length 1× the input.

Input cost
$0.000165
Output cost
$0.000825
Total per call
$0.00099

Claude Sonnet 4.6 pricing — $3.00 / 1M input, $15.00 / 1M output. Context window: 200k tokens.

Token counts are heuristic (~4 chars / token for prose, ~3.5 for code). Real tokenizer output may differ by ±10% — the ‘exact’ count needs the model’s BPE tables, which we don’t ship in the browser.

How to use

  1. Pega tu prompt

    Todo lo que enviarías al modelo: prompt de sistema, mensaje de usuario, definiciones de herramientas, etc. El recuento de tokens y la detección de estilo se actualizan mientras escribes.

  2. Elige el modelo y el ratio de salida

    Los tokens de salida cuestan entre 3 y 5 veces más que los de entrada en la mayoría de proveedores, por lo que el ratio importa. 1× es un valor seguro por defecto para respuestas cortas; 0,3× para tareas de clasificación; 3–5× para generación de código.

  3. Lee la fila de costes

    Coste de entrada + coste de salida = total por llamada. Multiplica por el volumen de solicitudes esperado para proyectar el gasto mensual.

Frequently asked questions

¿Por qué el recuento no es exacto?
La tokenización exacta requiere la tabla BPE / SentencePiece propia del modelo. OpenAI incluye tiktoken; Anthropic y Google tienen sus propios SDK. Cargar esas tablas en un navegador añadiría ~10 MB de JavaScript por modelo, lo que no merece la pena para una estimación rápida. La heurística se mantiene dentro del 10% para texto en inglés y código.
¿Cómo se detecta el estilo?
Si más del 6% de los caracteres son símbolos típicos de código o JSON ({ } [ ] < > ; : = ( ) | ", '), el estilo se clasifica como 'código' y el ratio de caracteres por token baja de 4 a 3,5. Todo lo demás se trata como prosa.
¿Los precios están actualizados?
Los precios se actualizan periódicamente y reflejan el precio de lista público de cada proveedor para el acceso directo a la API. No se aplican descuentos (API por lotes, caché de prompts, contratos empresariales). Verifica la página de precios del proveedor antes de firmar un contrato.
¿Qué significa 'ratio de salida'?
Qué tan larga será la respuesta del modelo en relación con tu prompt. Un ratio de 1× significa que la salida tiene aproximadamente la misma longitud que la entrada. Las tareas de clasificación tienen ratios de ~0,05; la generación de código de 2–5×; la reescritura de formato largo de 1,5–3×.
¿El coste incluye la ventana de contexto?
Sí. La facturación moderna de API cobra por cada token de la conversación, incluidos el prompt de sistema, los turnos anteriores y las definiciones de herramientas. Pasa tu prompt completo ensamblado por el widget para obtener la estimación más precisa.
¿Qué hay del caché de prompts?
La mayoría de los grandes proveedores ofrecen ahora una tarifa con descuento (50–90% de descuento) para las partes repetidas de un prompt. Esta calculadora no aplica descuentos de caché porque dependen de la tasa de aciertos; para un sistema en producción, modela la parte en caché por separado al precio de entrada en caché del proveedor.
¿El texto en otro idioma es más caro?
Sí, significativamente. Los tokenizadores se entrenaron predominantemente en inglés; los scripts latinos no ingleses pagan una prima del 10–20% en tokens, y los scripts CJK pueden pagar entre 2 y 4 veces la tasa por carácter. Hasta que incluyamos un tokenizador real, trata la heurística como un límite inferior para el contenido en idiomas distintos del inglés.

About

Por qué tokens y no caracteres

Los grandes modelos de lenguaje cobran por tokens porque esa es la unidad de cómputo. Un tokenizador BPE divide el texto en fragmentos de sub-palabras: las palabras comunes suelen ser un solo token, mientras que las palabras raras o compuestas pueden ser varios. 'Convertitive', por ejemplo, suele ser 4 tokens, mientras que 'the' es 1 — no hay una regla limpia por carácter o por palabra. La heurística aquí es una calibración que funciona porque, promediada sobre suficiente texto, la ratio es estable.

Notas para planificación de costes

Para un producto de chat que espera 100K conversaciones al día con ~3K tokens de entrada y ~600 tokens de salida por turno a tarifas de GPT-4o: 100.000 × 3.000 × 2,50 $ / 1M = 750 $/día de entrada, 100.000 × 600 × 10 $ / 1M = 600 $/día de salida. Total ≈ 1.350 $/día o ~40.000 $/mes. Reduce a la mitad con GPT-4o mini, y a la mitad de nuevo con caché de prompts.

Herramientas relacionadas