Motorun İçinde: ARIA-4'ü Farklı Kılan Nedir?
ARIA-4, sadece büyük verilerle beslenen bir model değildir; her bir bileşeni insan bilişselliğinden ilham alınarak tasarlanmış, yaşayan bir mimaridir. Beta sürümümüzün temelini oluşturan teknik prensipler, verimlilik ve derin anlayış üzerine kuruludur.
~230M Aktif Parametre
Hibrit MoE seçiciliğiyle her token için optimize edilmiş aktivasyon.
Bayesçi DCD < 650 ms
Dinamik Çatışma Çözümleme gecikmesi, gerçek kullanım senaryolarında ölçümlü.
Sahada Doğrulanmış Muhakeme
Gerçek kullanıcı görevleri üzerinde tutarlı muhakeme ve geri çağırım.
Odaklanmış Bilgi Evreni: 20 GB Beta Veri Seti
ARIA-4'ün ilk eğitimi için, internetin gürültüsünden arındırılmış, özel olarak kürate edilmiş ve bilişsel gelişimi tetikleyecek şekilde formatlanmış 20 GB'lık bir veri seti kullanıldı. Bu, kaba kuvvetle ezberlemek yerine, temel prensipleri ve nedensel ilişkileri "keşfetmeye" yönelik stratejik bir adımdır.
Parametre Verimliliği: 0.5B Toplam / 0.2B Aktif
Modelimiz toplamda ~480 milyon parametreye sahiptir. Ancak devrim niteliğindeki Hibrit MoE (Mixture of Experts) mimarimiz sayesinde, her bir token'ı işlemek için sadece en ilgili ~230 milyon parametre aktive edilir. Bu, trilyon parametreli devlere kafa tutan bir zekayı, inanılmaz bir verimlilikle sunmamızı sağlar.
Bilişsel Mimari: İnsan Zekasından İlhamla
Standart Transformer bloklarını terk ettik. Yerine, dikkat, soyutlama, hata düzeltme gibi bilişsel fonksiyonları taklit eden özel modüller tasarladık. Bu mimari, modelin sadece kalıpları tanımakla kalmayıp, "akıl yürütmesini" ve kendi mantıksal hatalarını fark edip düzeltmesini sağlar.
Beta Bağlam Penceresi: Maksimum 2048 Token
Beta sürümü, şu an için 2048 token'lık bir bağlam penceresi ile çalışmaktadır. Bu limit, modelin derin muhakeme ve tutarlılık yeteneklerini en kararlı şekilde sergilemesi için belirlenmiştir. Mimarimizin temelindeki verimli dikkat mekanizmaları sayesinde, bu pencere gelecekte katlanarak artma potansiyeline sahiptir.
Kürasyon, temizleme, bilişsel görev şablonlarıyla formatlama ve veri-ajan döngüsü.
Hibrit MoE uzman seçimi, Bayesçi DCD ile çatışma çözümleme ve geri çağırım kalibrasyonu.
Gerçek kullanıcı görevleri, muhakeme tutarlılığı, hız/kalite dengesi ve güvenlik protokolleri.
Derin Muhakeme
Çok adımlı zincir kurma ve kendi kendini denetim.
Diyalog Tutarlılığı
Uzayan konuşmalarda konu sürekliliği ve hedef takibi.
Kavramsal Abstraksiyon
Farklı alanlar arası kavram aktarımı ve genelleme.