- Sayı neden tam değil?
- Tam tokenizasyon modelin kendi BPE / SentencePiece tablosunu gerektirir. OpenAI tiktoken sunar; Anthropic ve Google kendi SDK'larını sunar. Bu tabloları tarayıcıya yüklemek model başına ~10 MB JavaScript ekler; bu da hızlı bir tahmin için fazla maliyetlidir. Sezgisel yöntem İngilizce metin ve kod için %10 içinde kalır.
- Stil nasıl algılanıyor?
- Karakterlerin %6'sından fazlası kod veya JSON'a özgü semboller içeriyorsa ({ } [ ] < > ; : = ( ) | ", '), stil 'kod' olarak sınıflandırılır ve karakter/token oranı 4'ten 3,5'e düşer. Geri kalanı düz metin olarak işlenir.
- Fiyatlar güncel mi?
- Fiyatlar periyodik olarak güncellenir ve her sağlayıcının doğrudan API erişimi için açık liste fiyatını yansıtır. İndirimler (toplu API, prompt önbellekleme, kurumsal sözleşmeler) uygulanmaz. Sözleşme imzalamadan önce sağlayıcının fiyatlandırma sayfasını çapraz kontrol edin.
- 'Çıktı oranı' ne anlama geliyor?
- Modelin yanıtının prompt'unuza göre ne kadar uzun olacağı. 1× oranı çıktının girdiyle yaklaşık aynı uzunlukta olduğu anlamına gelir. Sınıflandırma görevleri ~0,05 orana; kod üretimi 2–5×; uzun biçimli yeniden yazma 1,5–3× orana sahiptir.
- Maliyet bağlam penceresini içeriyor mu?
- Evet. Modern API faturalandırması konuşmadaki her token için ücretlendirir; sistem prompt'u, önceki turlar ve araç tanımları dahil. En doğru tahmin için tam derlenmiş prompt'unuzu araçtan geçirin.
- Prompt önbellekleme nedir?
- Büyük sağlayıcıların çoğu artık bir prompt'un tekrarlanan bölümleri için indirimli oran (%50–90 indirim) sunmaktadır. Bu hesaplayıcı önbellekleme indirimlerini uygulamaz çünkü bunlar isabet oranına bağlıdır; üretim sistemi için önbelleklenen kısmı sağlayıcının önbelleğe alınmış girdi fiyatıyla ayrıca modelleyin.
- İngilizce olmayan metin daha pahalı mı?
- Evet, önemli ölçüde. Tokenizer'lar ağırlıklı olarak İngilizce üzerinde eğitilmiştir; İngilizce olmayan Latin alfabesi yazıları %10–20 token primi öder, CJK yazıları ise karakter başına 2–4× oran ödeyebilir. Gerçek bir tokenizer sunana kadar, İngilizce olmayan içerik için sezgisel yöntemi alt sınır olarak değerlendirin.