- ¿Por qué el recuento no es exacto?
- La tokenización exacta requiere la tabla BPE / SentencePiece propia del modelo. OpenAI incluye tiktoken; Anthropic y Google tienen sus propios SDK. Cargar esas tablas en un navegador añadiría ~10 MB de JavaScript por modelo, lo que no merece la pena para una estimación rápida. La heurística se mantiene dentro del 10% para texto en inglés y código.
- ¿Cómo se detecta el estilo?
- Si más del 6% de los caracteres son símbolos típicos de código o JSON ({ } [ ] < > ; : = ( ) | ", '), el estilo se clasifica como 'código' y el ratio de caracteres por token baja de 4 a 3,5. Todo lo demás se trata como prosa.
- ¿Los precios están actualizados?
- Los precios se actualizan periódicamente y reflejan el precio de lista público de cada proveedor para el acceso directo a la API. No se aplican descuentos (API por lotes, caché de prompts, contratos empresariales). Verifica la página de precios del proveedor antes de firmar un contrato.
- ¿Qué significa 'ratio de salida'?
- Qué tan larga será la respuesta del modelo en relación con tu prompt. Un ratio de 1× significa que la salida tiene aproximadamente la misma longitud que la entrada. Las tareas de clasificación tienen ratios de ~0,05; la generación de código de 2–5×; la reescritura de formato largo de 1,5–3×.
- ¿El coste incluye la ventana de contexto?
- Sí. La facturación moderna de API cobra por cada token de la conversación, incluidos el prompt de sistema, los turnos anteriores y las definiciones de herramientas. Pasa tu prompt completo ensamblado por el widget para obtener la estimación más precisa.
- ¿Qué hay del caché de prompts?
- La mayoría de los grandes proveedores ofrecen ahora una tarifa con descuento (50–90% de descuento) para las partes repetidas de un prompt. Esta calculadora no aplica descuentos de caché porque dependen de la tasa de aciertos; para un sistema en producción, modela la parte en caché por separado al precio de entrada en caché del proveedor.
- ¿El texto en otro idioma es más caro?
- Sí, significativamente. Los tokenizadores se entrenaron predominantemente en inglés; los scripts latinos no ingleses pagan una prima del 10–20% en tokens, y los scripts CJK pueden pagar entre 2 y 4 veces la tasa por carácter. Hasta que incluyamos un tokenizador real, trata la heurística como un límite inferior para el contenido en idiomas distintos del inglés.