Glossary
Kayıpsız sıkıştırma
Her baytı koruyan sıkıştırma
By Buğra SözeriPublished Updated
Kayıpsız sıkıştırma, orijinalin her baytını korurken dosya boyutunu küçültür. Sıkıştırma açıldığında girişle bit özdeş çıktı üretilir. Uzlaşım: kayıplı sıkıştırmaya kıre daha küçük tasarruf — içeriğe bağlı olarak tipik olarak %30-70 boyut küçültme.
Nasıl çalışır: kayıpsız algoritmalar istatistiksel kalıpları (tekrarlanan alt dizeler, tahmin edilebilir diziler) bulur ve bunları daha kısa gösterimlerle kodlar. İki klasik aile:
- Sözlük tabanlı (LZ77, LZ78, LZW): görülen alt dizelerin sözlüğünü oluşturur ve geri referanslar yayar. DEFLATE, gzip, ZIP’in temeli.
- Entropi kodlaması (Huffman, aritmetik kodlama, ANS): daha sık sembollere daha kısa ikili kodlar atar. Genellikle sözlük yöntemleriyle birleştirilir.
Yaygın kayıpsız formatlar:
- PNG — görüntüler (DEFLATE kullanır)
- FLAC — ses (16-24 bit PCM korur; genellikle WAV’ın %50-60’ı boyutunda)
- ZIP, gzip, Brotli, Zstandard — genel veri
- WebP ve AVIF — her ikisi de kayıpsız modları destekler
- Git paket dosyaları — kaynak kod deposu depolama
Bit mükemmelliğinde yeniden üretime ihtiyaç duyduğunuzda, içerik daha fazla düzenlenecekse veya dosya metin/yapılandırılmış veriyse (zaten kayıplı iyi sıkıştırılmaz) kayıpsız kullanın.
Bilgi-teorik tavan: Claude Shannon’ın 1948 tarihli makalesi, kayıpsız sıkıştırmanın kaynağın entropisi — sembol başına ortalama bilgi — altına düşemeyeceğini kanıtladı. Rastgele veri (rastgele baytlar, şifreli metin, zaten sıkıştırılmış dosyalar) için entropi maksimum olduğundan kayıpsız sıkıştırma esasen sıfır tasarruf sağlar. Bu yüzden “gzip image.jpg” neredeyse hiçbir şey kazanmaz; JPEG baytları bir sıkıştırıcıya zaten rastgele görünür. Sonuç: sıkıştırma oranınız yüksek entropi olması gereken veriler üzerinde şüphe uyandıracak kadar iyiyse, muhtemelen bir hata bulmuşsunuzdur.
Kayıplı veri üzerinde kayıpsız — ne zaman kâr eder: yaygın bir kafa karışıklığı, daha iyi ses kalitesi bekleyerek 128 kbps MP3 kaynağı üzerinden FLAC’a ulaşmaktır. MP3 zaten bilgiyi atmıştır; FLAC yalnızca atılmış sürümü kayıpsız biçimde korur. 16 bit PCM’de (CD’ler, stüdyo masterlar) oluşan ses için FLAC doğru arşiv seçimidir. Kayıplı başlayan ses için FLAC’a dönüştürmek yalnızca dosyayı şişirir. Genel kural: masteri kaynağın desteklediği en yüksek kaliteli kayıpsız formatta saklayın; tüketicinin oynatabildiği en iyi kayıplı format aracılığıyla teslim edin. İlgili: DEFLATE, kayıplı. Referans: Shannon CE, A Mathematical Theory of Communication (Bell Syst Tech J, 1948).
Çalışma örneği: 10 MB’lık günlük dosyasını sıkıştırma
Tipik bir 10 MB uygulama günlüğü (zaman damgaları, düzey, mesaj, tekrarlanan alan adlarıyla JSON satırları) son derece gereksizdir. Aynı girişte yapılan son kıyaslamadan gerçek dünya rakamları: varsayılan gzip düzeyi ≈ 1,6 MB (%84 küçültme, 0,2 s kodlama), Brotli düzey 6 ≈ 1,1 MB (%89, 0,5 s), Zstandard düzey 3 ≈ 1,3 MB (%87, 0,05 s), Zstandard düzey 19 ≈ 0,9 MB (%91, 1,8 s). Rastgele baytlar (/dev/urandom’dan 10 MB), her algoritmada 10 MB’ye birkaç bayt yakın sıkıştırılır — yüksek entropi nedeniyle sıkıştırılamaz. Zaten PNG görüntüleri gzip -9 altında yüzde 1-3 daha küçülür; bu nedenle HTTP sunucuları genellikle CPU tasarrufu için PNG/JPEG/MP4 yanıtlarında Content-Encoding: gzip’i atlar.
2026’da algoritma seçimi
Web teslimi için: statik varlıklar için Brotli kalite 5-6 (2017’den bu yana her modern tarayıcıda desteklenen, kabul edilebilir kodlama süresinde en iyi oran); eski istemciler için yedek olarak gzip. İç depolama ve hattı için: çoğu kalite düzeyinde sıkıştırma-oranı-hız Pareto sınırına hâkim olan ve artık tar, Linux çekirdek modülleri, RocksDB ve npm paket formatında varsayılan olan Zstandard. Değiştirilemez masterlerin arşivlenmesi için: hâlâ sağlama toplamı içeren bir sarmalayıcı kullanın (SHA-256 ile xz veya CRC + harici SHA-256 ile zip) — sıkıştırmanın kendisi bit çürümesini algılamaz. Referans: RFC 8878 — Zstandard Sıkıştırma ve application/zstd Medya Türü.
Frequently asked questions
- Kayıpsız sıkıştırma nedir?
- Kayıpsız sıkıştırma, orijinal verilerin tam olarak yeniden oluşturulmasına olanak tanıyan, artıklığı kodlayan algoritmalar (DEFLATE, LZ77 veya Huffman kodlaması gibi) kullanarak dosya boyutunu küçültür. Hiçbir bilgi atılmaz.
- Yaygın kayıpsız format örnekleri nelerdir?
- Görüntüler için PNG ve WebP-lossless, ses için FLAC ve ALAC, dosyalar için ZIP ve GZIP ile GIF (sınırlı palet) hepsi kayıpsızdır. Bunların sıkıştırması açıldığında her zaman orijinale bit bit özdeş veriler elde edilir.
- Kayıpsız ile kayıplı sıkıştırma arasındaki fark nedir?
- Kayıpsız sıkıştırma her biti korur; kayıplı sıkıştırma, daha yüksek sıkıştırma oranları elde etmek için kodlayıcının algılanamaz saydığı bilgileri atar (JPEG niceleme, MP3 frekans maskeleme). Kayıplı dosyalar mükemmel biçimde geri yüklenemez.
- Kayıplı yerine kayıpsızı ne zaman seçmeliyim?
- Kaynak varlıklar, belgeler, kod ve düzenlenecek veya yeniden sıkıştırılacak her şey için kayıpsız kullanın — tekrarlanan kayıplı yeniden kodlama bozukluk biriktirir. Dosya boyutu mükemmel kalite yerine daha önemliyse teslim formatları (web görüntüleri, akış sesi) için kayıplı kullanın.
Related
Published May 15, 2026 · Last reviewed May 31, 2026