- Pourquoi le comptage n'est-il pas exact ?
- La tokenisation exacte nécessite la table BPE / SentencePiece propre au modèle. OpenAI fournit tiktoken ; Anthropic et Google fournissent leurs propres SDK. Charger ces tables dans un navigateur ajouterait ~10 Mo de JavaScript par modèle, ce qui n'en vaut pas la peine pour une estimation rapide. L'heuristique reste dans les 10 % pour le texte anglais et le code.
- Comment le style est-il détecté ?
- Si plus de 6 % des caractères sont des symboles typiques du code ou du JSON ({ } [ ] < > ; : = ( ) | ", '), le style est classifié comme 'code' et le ratio caractères/token passe de 4 à 3,5. Tout le reste est traité comme de la prose.
- Les prix sont-ils à jour ?
- Les prix sont mis à jour régulièrement et reflètent le prix public de chaque fournisseur pour l'accès direct à l'API. Les remises (API par lot, mise en cache des prompts, contrats d'entreprise) ne sont pas appliquées. Vérifiez la page de tarification du fournisseur avant de signer un contrat.
- Que signifie 'ratio de sortie' ?
- La longueur de la réponse du modèle par rapport à votre prompt. Un ratio de 1× signifie que la sortie a à peu près la même longueur que l'entrée. Les tâches de classification ont des ratios de ~0,05 ; la génération de code de 2–5× ; la réécriture longue de 1,5–3×.
- Le coût inclut-il la fenêtre de contexte ?
- Oui. La facturation moderne de l'API charge chaque token de la conversation, y compris le prompt système, les tours précédents et les définitions d'outils. Faites passer votre prompt complet assemblé dans le widget pour l'estimation la plus précise.
- Qu'en est-il de la mise en cache des prompts ?
- La plupart des grands fournisseurs proposent désormais un tarif réduit (50–90 % de remise) pour les parties répétées d'un prompt. Cette calculatrice n'applique pas les remises de mise en cache car elles dépendent du taux de succès ; pour un système en production, modélisez la partie mise en cache séparément au prix d'entrée en cache du fournisseur.
- Le texte non anglais est-il plus cher ?
- Oui, significativement. Les tokeniseurs ont été entraînés principalement sur l'anglais ; les scripts latins non anglais paient une prime de 10–20 % en tokens, et les scripts CJK peuvent payer 2 à 4 fois le taux par caractère. Jusqu'à ce que nous fournissions un vrai tokeniseur, traitez l'heuristique comme une borne inférieure pour le contenu non anglais.