Çinli DeepSeek, merakla beklenen V4 yapay zeka modelini tanıttı

0
3

Çin’in yapay zeka girişimi DeepSeek, diğer modellerden daha az maliyetle sunduğu güçlü işlem gücüyle sektörü sarsmasından bir yıl sonra geri döndü.

Küresel yapay zeka yarışı hız kazanırken, Çinli yapay zeka şirketi DeepSeek yeni büyük dil modeli V4’ün ön tanıtımını yaptı.

DeepSeek, ilk modellerini piyasaya sürdükten sonra, geçen yıl en yakından izlenen yapay zeka şirketlerinden biri haline gelmişti; bu modellerin pek çok ABD’li rakibe kıyasla daha düşük maliyetle güçlü performans sunduğu görülmüştü.

Hangzhou merkezli girişim, modeli DeepSeek V4-Pro ve DeepSeek V4-Flash adıyla yayımladı. V4-Pro, daha zorlu görevler için tasarlanmış daha büyük bir modelken, V4-Flash daha hızlı yanıt verecek ve işletme maliyeti daha düşük olacak şekilde tasarlanmış daha küçük bir sürüm.

Şirketten yapılan açıklamada, “Genel bilgi kıyaslamalarında DeepSeek V4-Pro, diğer açık kaynaklı modellerin önemli ölçüde önüne geçiyor ve yalnızca en üst düzey kapalı kaynaklı model Gemini-3.1-Pro tarafından az da olsa geride bırakılıyor,” dendi.

Şirket, yeni yapay zeka modelinin “bir milyon tokenlık bağlam penceresini” desteklediğini, bunun da uzun belgeler veya kodlar gibi çok daha büyük istemleri işleyip yanıt üretebileceğini açıkladı.

Yapay zekada bağlam penceresi, bir modelin aynı anda dikkate alabileceği metin miktarını, token cinsinden ifade ediyor. Daha büyük bir bağlam penceresi, bir yapay zeka modelinin daha uzun girdileri işlemesine ve her çıktıya daha fazla bilgi dahil etmesine imkân tanıyor.

Şirket, açık kaynak yapay zeka platformu Hugging Face’te yaptığı duyuruda “Maliyet etkin 1M bağlam uzunluğu çağına hoş geldiniz,” ifadelerini kullandı.

DeepSeek ayrıca V4’ün “hesaplama ve bellek maliyetlerini çarpıcı biçimde azaltırken dünya çapında lider seviyede uzun bağlam yetenekleri sunduğunu” belirtti.

DeepSeek, V4-Pro’yu OpenAI, Anthropic ve Google’ın rakip modelleriyle karşılaştırdı; ancak bazı testlerde Google’ın Gemini-3.1-Pro’su daha yüksek puan aldı.

Yeni model, Claude Code, OpenClaw ve OpenCode gibi popüler yapay zeka ajanlarıyla birlikte kullanılabiliyor; böylece geliştiriciler modeli DeepSeek’in kendi sohbet botunun dışındaki yazılım görevlerinde de değerlendirebiliyor.

Kapalı yapay zeka modelleri kullanan rakiplerine kıyasla daha açık yaklaşımıyla bilinen DeepSeek, V4’ü de Hugging Face üzerinde indirmeye, test etmeye ve serbestçe uyarlamaya açtı.

Çinli girişim, 2024’ün sonlarında, OpenAI ve Google’ın da aralarında bulunduğu birçok ABD’li rakibe göre daha düşük maliyetle ve daha az güçlü çiplerle çalışmasına rağmen geniş performans sergileyen açık kaynaklı V3 modeliyle dikkat çekmişti.

Küresel yapay zeka yarışı

Şirket, Ocak 2025’te, OpenAI’ın büyük dil modelleriyle aynı düzeyde performans gösterirken daha maliyetsiz olduğunu iddia ettiği R1 adlı akıl yürütme modelini yayımladığında dünya çapında yankı uyandırmıştı.

Ancak İtalya, ABD ve Güney Kore’nin de aralarında bulunduğu bazı ülkeler, ulusal güvenlik kaygılarını gerekçe göstererek geçen yıl devlet kurumlarının DeepSeek’i kullanmasını yasaklamıştı.

Almanya da 2025’te, kullanıcı verilerinin yasa dışı biçimde Çin’e aktarılmasını gerekçe göstererek Apple ve Google uygulama mağazalarında DeepSeek’i yasaklamıştı.

V4’ün piyasaya sürülmesi, ABD’li yapay zeka devi OpenAI’ın en yeni yapay zeka modeli GPT-5.5’i, şimdiye kadarki “en zeki ve en sezgisel” modeli olarak tanımlayarak tanıtmasından bir gün sonrasına denk geldi.

Lansman aynı zamanda Beyaz Saray’ın, Çin’i binlerce vekil hesap kullanarak Amerikan yapay zeka laboratuvarlarının fikri mülkiyetini sanayi ölçeğinde çalmakla suçlamasından bir gün sonra gerçekleşti.

OpenAI, Anthropic ve Google bu yıl Çinli yapay zeka şirketlerinin, Batılı muadillerine model çıkarma saldırıları, diğer adıyla “distilasyon” gerçekleştirdiği uyarısında bulunmştu.

Bu yöntem, modele binlerce soru yöneltip yanıtlarını topluyor ve ardından bu yanıtları, yeni ve daha küçük bir modele benzer şekilde “düşünmeyi” öğretmek için kullanıyor.