- Perché il conteggio non è esatto?
- La tokenizzazione esatta richiede la tabella BPE / SentencePiece del modello stesso. OpenAI include tiktoken; Anthropic e Google includono i propri SDK. Caricare queste tabelle in un browser aggiungerebbe ~10 MB di JavaScript per modello, il che non vale la pena per una stima rapida. L'euristica rimane entro il 10% per il testo in inglese e il codice.
- Come viene rilevato lo stile?
- Se più del 6% dei caratteri sono simboli tipici del codice o JSON ({ } [ ] < > ; : = ( ) | ", '), lo stile viene classificato come 'codice' e il rapporto caratteri/token scende da 4 a 3,5. Tutto il resto viene trattato come prosa.
- I prezzi sono aggiornati?
- I prezzi vengono aggiornati periodicamente e riflettono il prezzo di listino pubblico di ciascun fornitore per l'accesso diretto all'API. Non vengono applicati sconti (API batch, caching dei prompt, contratti aziendali). Verifica la pagina dei prezzi del fornitore prima di firmare un contratto.
- Cosa significa 'rapporto di output'?
- Quanto sarà lunga la risposta del modello rispetto al tuo prompt. Un rapporto di 1× significa che l'output ha circa la stessa lunghezza dell'input. I compiti di classificazione hanno rapporti di ~0,05; la generazione di codice di 2–5×; la riscrittura in formato lungo di 1,5–3×.
- Il costo include la finestra di contesto?
- Sì. La fatturazione moderna dell'API addebita ogni token nella conversazione, inclusi eventuali prompt di sistema, turni precedenti e definizioni di strumenti. Esegui il tuo prompt completo assemblato attraverso il widget per la stima più accurata.
- Che dire del caching dei prompt?
- La maggior parte dei principali fornitori offre ora una tariffa scontata (50–90% di sconto) per le parti ripetute di un prompt. Questa calcolatrice non applica sconti di caching perché dipendono dal tasso di successo; per un sistema in produzione, modella la parte in cache separatamente al prezzo di input in cache del fornitore.
- Il testo non inglese è più costoso?
- Sì, sensibilmente. I tokenizer sono stati addestrati prevalentemente sull'inglese; gli script latini non inglesi pagano un premio del 10–20% in token, e gli script CJK possono pagare 2–4 volte il tasso per carattere. Finché non includiamo un vero tokenizer, considera l'euristica come un limite inferiore per i contenuti non in inglese.