• Ziraat Bankası Reklam
BİLİM VE TEKNOLOJİ
Yayınlanma : 02 Ocak 2026 20:07
Düzenleme : 02 Ocak 2026 20:07

DeepSeek'ten devrim niteliğinde yapay zeka mimarisi: Eğitim maliyetleri tarihe mi karışıyor?

DeepSeek'ten devrim niteliğinde yapay zeka mimarisi: Eğitim maliyetleri tarihe mi karışıyor?
Çinli yapay zeka girişimi DeepSeek, büyük dil modellerinin eğitim maliyetlerini düşürmeyi hedefleyen yeni mHC mimarisini tanıttı. Geliştirilen sistem, ölçeklenebilirlik ve verimlilik artışı vaadiyle dikkat çekiyor ve yeni ürün lansmanının h

Çinli yapay zeka girişimi DeepSeek, 2026 yılına damgasını vuracak önemli bir teknik gelişmeyle gündeme geldi. Şirket, büyük dil modellerinin eğitim sürecini daha kararlı ve ekonomik hale getirmek için geliştirdiği yeni bir derin öğrenme mimarisini tanıttı. Yayınlanan teknik makale, DeepSeek'in yakında piyasaya sürmesi beklenen yeni büyük ürününün habercisi olarak yorumlanıyor.

morgan yeni köy

mHC MİMARİSİ İLE MALİYETLER DÜŞÜYOR

Hangzhou merkezli DeepSeek, Manifold-Constrained Hyper-Connections (mHC) adını verdiği yeni bir çerçeveyle yapay sinir ağlarının ölçeklenmesinden kaynaklanan kararsızlık ve maliyet sorunlarına çözüm sunuyor. Şirketin kurucusu Liang Wenfeng ve kıdemli araştırmacıların imzasını taşıyan bu çalışma, mevcut yöntemlere göre belirgin performans artışları ve üstün ölçeklenebilirlik vaat ediyor. Bu yeni sistem, ByteDance araştırmacılarının 2024'te geliştirdiği hiper-bağlantı mimarisinin üzerine inşa edilerek, büyük modellerde karşılaşılan bellek kullanımı sorunlarını ortadan kaldırıyor. DeepSeek, bu bağlantıları belirli bir matematiksel manifold üzerine yansıtarak sinyallerin kaybolmasını veya aşırı büyümesini engelliyor.

ALTUN REKLAM

VERİMLİLİK VE YENİ ÜRÜN BEKLENTİSİ

DeepSeek tarafından geliştirilen mHC mimarisi, 3 milyar, 9 milyar ve 27 milyar parametreli modeller üzerinde test edildi. Elde edilen sonuçlar, sistemin bilgi işlem kapasitesi üzerinde büyük bir yük oluşturmadan etkili bir şekilde ölçeklenebildiğini gösterdi. Bu verimlilik, özellikle yüksek maliyetli yapay zeka eğitim süreçlerinde şirketlere önemli bir avantaj sağlayacak. Uzmanlar, DeepSeek'in bu teknik paylaşımlarının genellikle yeni ürün lansmanlarının bir ön işareti olduğunu belirtiyor. Geçtiğimiz yılki R1 modelinde olduğu gibi, şirketin 17 Şubat'ta başlayacak Bahar Festivali'nden önce yeni bir büyük model duyurması bekleniyor. Kantitatif risk fonu High-Flyer'ın iştiraki olan DeepSeek, ABD'li rakiplerine karşı daha düşük bütçelerle rekabetçi performans sergileyerek Çin yapay zeka ekosistemindeki şeffaf kültürü temsil ediyor.