Glossary
LLM
Büyük Dil Modeli
By Buğra SözeriPublished Updated
LLM (Büyük Dil Modeli), önceki bağlam verildiğinde bir dizideki bir sonraki token’ı tahmin etmek üzere genellikle yüz milyarlarca kelimeden oluşan devasa miktarda metin üzerinde eğitilmiş bir sinir ağıdır. “Büyük” ifadesi parametre sayısını ifade eder: modern sınır LLM’leri 100 milyardan 2+ trilyona kadar parametre içerir.
Temel mimari: transformer (Vaswani ve ark., 2017); orijinal kodlayıcı-kod çözücü bölünmesinde çeşitlemeler mevcuttur. GPT ailesi yalnızca kod çözücüdür; orijinal BERT yalnızca kodlayıcıydı; T5 her ikisini de korur. 2020’den bu yana sınır modeller büyük ölçüde yalnızca kod çözücüdür.
Eğitim hattı: dil istatistiklerini öğrenmek için geniş bir metin külliyatı üzerinde ön eğitim; ardından modeli yararlı biçimde talimat izlemesi için insan geri bildiriminden pekiştirmeli öğrenme (RLHF) veya yapay zeka geri bildiriminden pekiştirmeli öğrenme (RLAIF) ile talimat ayarlaması.
2026 itibarıyla başlıca LLM aileleri: OpenAI’nin GPT’si (3.5, 4, 4o, 5), Anthropic’in Claude’u (3.5 Sonnet, 4, 4.6, 4.7), Google’ın Gemini’si (1.5, 2, 2.5), Meta’nın Llama’sı (2, 3, 4) ve çeşitli açık ağırlıklı alternatifler (Mistral, Qwen, DeepSeek). API fiyatlandırmasını token sayacımızda karşılaştırın.
LLM’lerin mekanik olarak ne olduğu ve ne olmadığı: çıkarım sırasında LLM, bir token dizisinden bir sonraki token üzerindeki olasılık dağılımına eşleyen bir işlevdir. Üretim bu dağılımdan örnekler (sıcaklık, top-p ve top-k kontrolleriyle), seçilen token’ı ekler ve tekrarlar. Klasik anlamda bir “akıl yürütme modülü” yoktur — matematik kanıtı veya şiir olsun, her çıktı aynı sonraki-token döngüsünden gelir. Düşünce zinciri yönlendirmesi, akıl yürütmeyi bağlama yazmak modelin kendi ara adımlarına daha sonraki token’ları koşullandırmasına izin verdiğinden — farklı bir çıkarım modu tetiklemediğinden — çalışır. Akıl yürütme yanılsaması, zaten akıl yürütme içeren devasa insan metni dağılımı üzerinde eğitimin bir yan etkisidir.
Bağlam penceresi ve tokenizasyonun maliyet için neden önemli olduğu: her API ücreti, girdi ve çıktı başına token üzerindendir; 200 K-token’lık bağlam penceresine sahip model, doldurduğunuz bölüm için ücretlendirir. İsteme dökülen 50 sayfalık bir PDF okumak için birkaç sent, tek paragraflık özet üretmek için birkaç sent tutabilir — faturanın büyük bölümü giriştir. Tokenizasyon sağlayıcıya özgüdür: GPT’nin BPE’si, Claude’un SentencePiece’i ve Gemini’nin tokenizörü aynı metin için farklı token sayıları üretir; bu nedenle token başına $ bazında en ucuz model uygulamada mutlaka en ucuz değildir. Taahhüt vermeden önce sağlayıcılar arasındaki gerçek token sayılarını karşılaştırmak için token sayacımızı kullanın. İlgili: GPT token, bağlam penceresi.
Çalışma örneği
Giriş başına 3 $/milyon token ve çıkış başına 15 $/milyon token fiyatlandırılan bir sınır model kullanarak 40 sayfalık bir hukuki sözleşmeyi (~25.000 kelime ≈ 33.000 token) özetlemek istiyorsunuz; 500 token özet istiyorsunuz. Giriş maliyeti: 33.000 / 1.000.000 × 3$ = 0,099$. Çıkış maliyeti: 500 / 1.000.000 × 15$ = 0,0075$. Toplam: belge başına ~0,107$. Şimdi bunu 10.000 sözleşme için hayal edin: 1.070$ — yeniden denemeler, toplu işlem tasarrufu veya istem önbellekleme indirimleri hesaba katılmadan. Bunun yerine milyon başına 0,25$/1,25$ fiyatlandırmalı daha ucuz bir model kullansanız, belge başına maliyet yaklaşık 0,0095$’a, toplam aynı iş için ~95$’a düşer. Bu aritmetik, üretim LLM sistemlerinin neden kolay görevleri küçük modellere yönlendirip sınır modeli yalnızca en zor %5 için sakladığını açıklar.
Ne zaman ve neden önemlidir
LLM’lerin nasıl çalıştığını bilmek, en yaygın üretim başarısızlıklarını önler. API çağrıları arasında bellekleri yoktur — her istek, ilgili geçmişi bağlam penceresinde taşımalı veya ayrı bir alma sistemi kullanmalıdır. Özellikle yakın zamanlı olaylar, adlandırılmış varlık öznitelikleri ve alıntılar için akla yatkın biçimlendirilmiş ama yanlış olgular üretirler; standart önlemler alım-destekli üretim (RAG), araç kullanımı ve iddia başına dayandırma denetimleridir. Beklenmez biçimlerde istem ifadesine duyarlıdırlar — “adım adım düşün”, aritmetik ve mantık görevlerinde doğruluğu anlamlı biçimde değiştirir; az sayıda örnek, model seçiminden daha fazla cevabı saptırabilir. Referans: Vaswani ve ark. — Dikkat Tek Gereksinim (transformer makalesi).
Frequently asked questions
- Büyük dil modeli (LLM) nedir?
- LLM, dil üretmek ve tahmin etmek için büyük miktarda metin üzerinde eğitilmiş bir sinir ağıdır. GPT-4, Claude ve Gemini gibi modeller milyarlarca parametreye sahiptir; soru yanıtlayabilir, kod yazabilir, belge özetleyebilir ve pek çok dil görevi gerçekleştirebilir.
- LLM metin nasıl üretir?
- Bir LLM, sohbetteki önceki tüm token’lara koşullu olarak, kelime dağarcığı üzerindeki bir olasılık dağılımından örnekleyerek metni birer token oluşturur. Bu otoregresif süreç, bir dizi sonu token’ı üretilene veya uzunluk sınırına ulaşılana dek devam eder.
- LLM ile chatbot arasındaki fark nedir?
- LLM altta yatan modeldir; chatbot ise onun üzerine inşa edilmiş bir üründür. Aynı LLM, farklı sistem istemleri, güvenlik katmanları ve kullanıcı deneyimiyle sohbet, API, IDE eklentisi gibi birden fazla arayüze güç sağlayabilir; temel model ağırlıkları paylaşılır.
- Bir LLM’nin ne kadar bağlam işleyebileceğini ne sınırlar?
- Token cinsinden ölçülen bağlam penceresi, modelin tek bir çıkarım çağrısında işleyebileceği maksimum girdi ve çıktı uzunluğunu tanımlar. Daha uzun bağlamlar, dikkat tabanlı modeller için bellek ve hesaplama maliyetini karesel artırdığından bağlam penceresi boyutu temel bir özellik kriteri hâline gelmiştir.
Related
Published May 14, 2026 · Last reviewed May 31, 2026