- Por que a contagem não é exata?
- A tokenização exata requer a tabela BPE / SentencePiece do próprio modelo. A OpenAI fornece tiktoken; Anthropic e Google fornecem seus próprios SDKs. Carregar essas tabelas em um navegador adicionaria ~10 MB de JavaScript por modelo, o que não vale a pena para uma estimativa rápida. A heurística fica dentro de 10% para texto em inglês e código.
- Como o estilo é detectado?
- Se mais de 6% dos caracteres são símbolos típicos de código ou JSON ({ } [ ] < > ; : = ( ) | ", '), o estilo é classificado como 'código' e a proporção de caracteres por token cai de 4 para 3,5. Todo o resto é tratado como prosa.
- Os preços estão atualizados?
- Os preços são atualizados periodicamente e refletem o preço de lista público de cada fornecedor para acesso direto à API. Descontos (API em lote, cache de prompt, contratos empresariais) não são aplicados. Verifique a página de preços do fornecedor antes de assinar um contrato.
- O que significa 'proporção de saída'?
- Quão longa será a resposta do modelo em relação ao seu prompt. Uma proporção de 1× significa que a saída tem aproximadamente o mesmo tamanho que a entrada. Tarefas de classificação têm proporções de ~0,05; geração de código de 2–5×; reescrita de formato longo de 1,5–3×.
- O custo inclui a janela de contexto?
- Sim. A cobrança moderna de API cobra por cada token na conversa, incluindo qualquer prompt de sistema, turnos anteriores e definições de ferramentas. Execute seu prompt completo montado pelo widget para a estimativa mais precisa.
- E o cache de prompt?
- A maioria dos grandes fornecedores agora oferece uma taxa com desconto (50–90% de desconto) para partes repetidas de um prompt. Esta calculadora não aplica descontos de cache porque dependem da taxa de acerto; para um sistema em produção, modele a parte em cache separadamente ao preço de entrada em cache do fornecedor.
- O texto em outros idiomas é mais caro?
- Sim, significativamente. Os tokenizadores foram treinados predominantemente em inglês; scripts latinos não ingleses pagam um prêmio de 10–20% em tokens, e scripts CJK podem pagar 2–4 vezes a taxa por caractere. Até fornecermos um tokenizador real, trate a heurística como um limite inferior para conteúdo em idiomas diferentes do inglês.