- Warum ist die Anzahl nicht exakt?
- Exakte Tokenisierung erfordert die eigene BPE-/SentencePiece-Tabelle des Modells. OpenAI liefert tiktoken; Anthropic und Google liefern ihre eigenen SDKs. Das Laden dieser Tabellen im Browser würde ~10 MB JavaScript pro Modell hinzufügen, was für eine schnelle Schätzung nicht sinnvoll ist. Die Heuristik bleibt für englischen Text und Code innerhalb von 10 %.
- Wie wird der Stil erkannt?
- Wenn mehr als 6 % der Zeichen Symbole sind, die typisch für Code oder JSON sind ({ } [ ] < > ; : = ( ) | ", '), wird der Stil als 'Code' klassifiziert und das Zeichen-zu-Token-Verhältnis sinkt von 4 auf 3,5. Alles andere wird als Fließtext behandelt.
- Sind die Preise aktuell?
- Preise werden regelmäßig aktualisiert und spiegeln den öffentlichen Listenpreis jedes Anbieters für den direkten API-Zugriff wider. Rabatte (Batch-API, Prompt-Caching, Enterprise-Verträge) werden nicht angewendet. Überprüfe die Preisseite des Anbieters vor dem Vertragsabschluss.
- Was bedeutet 'Ausgabeverhältnis'?
- Wie lang die Antwort des Modells im Verhältnis zu deinem Prompt sein wird. Ein Verhältnis von 1× bedeutet, dass die Ausgabe ungefähr gleich lang wie die Eingabe ist. Klassifizierungsaufgaben haben Verhältnisse von ~0,05; Code-Generierung 2–5×; Langform-Umschreibung 1,5–3×.
- Schließt der Preis das Kontextfenster ein?
- Ja. Moderne API-Abrechnung berechnet jeden Token im Gespräch, einschließlich System-Prompt, früherer Gesprächsrunden und Tool-Definitionen. Führe deinen vollständig zusammengestellten Prompt durch das Widget für die genaueste Schätzung.
- Was ist mit Prompt-Caching?
- Die meisten großen Anbieter bieten jetzt einen reduzierten Preis (50–90 % Rabatt) für wiederholte Teile eines Prompts an. Dieser Kalkulator wendet keine Caching-Rabatte an, da sie von der Trefferrate abhängen; für ein Produktionssystem modelliere den gecachten Anteil separat zum Cached-Input-Preis des Anbieters.
- Ist nicht-englischer Text teurer?
- Ja, erheblich. Die Tokenizer wurden hauptsächlich mit englischen Texten trainiert; nicht-englische Lateinschriften zahlen eine Token-Prämie von 10–20 %, und CJK-Schriften können das 2–4-fache des Zeichenpreises zahlen. Bis wir einen echten Tokenizer liefern, behandle die Heuristik als Untergrenze für nicht-englische Inhalte.