OpenAI'dan görsel akıl yürütme yeteneğine sahip yeni modeller: o3 ve o4-mini

G

Gözde Ulukan

Misafir
, yapay zeka alanında önemli bir sıçramaya işaret eden iki yeni modelini : o3 ve o4-mini. Bu modeller, yalnızca metinle değil, aynı zamanda görsellerle "düşünebilen", araçları kendi başına kullanabilen ve çok adımlı görevleri bağımsız şekilde tamamlayabilen yapay zeka sistemleri olarak öne çıkıyor. Şirket, bu yeni nesil modellerin hem zeka hem de pratiklik açısından bugüne kadar geliştirdikleri en yetkin sistemler olduğunu belirtiyor.

İnsan benzeri görsel akıl yürütme​


OpenAI'ın "görselle düşünme" olarak tanımladığı özellik, o3 ve o4-mini'yi benzerlerinden ayıran temel unsur. Kullanıcılar artık bu modellere bir beyaz tahta fotoğrafı, PDF'ten alınmış bir grafik ya da elle çizilmiş bir diyagram yüklediğinde, modeller bu görseli analiz edip onun üzerinden akıl yürütebiliyor. Üstelik bu analiz, görüntü net olmasa bile mümkün.

OpenAI, bu yeteneği "sadece görüntüye bakmıyorlar; onunla düşünüyorlar" diyerek özetliyor. Bu da görsel ve metinsel akıl yürütmenin birleştiği yepyeni bir problem çözme sınıfının önünü açıyor. Modeller görsel üzerinde yakınlaştırma, döndürme, kırpma gibi işlemleri bağımsız şekilde gerçekleştirebiliyor.


Araçlarla entegre, çok adımlı görev yönetimi​


OpenAI, o3 ve o4-mini'nin yalnızca gelişmiş modeller değil, tam teşekküllü yapay zeka sistemleri olduğunu vurguluyor. Modeller, ChatGPT'deki tüm araçları, web tarayıcı, Python kod yürütücüsü, dosya analizörü ve görsel üretici dahil, birbirine zincirleyerek çok adımlı görevleri baştan sona gerçekleştirebiliyor.

Bu özellik, modellerin kullanıcıdan sürekli yönlendirme almadan karmaşık görevleri çözebilmesini sağlıyor. Örneğin kullanıcı, "Kaliforniya'da bu yaz enerji tüketimi geçen yıla göre nasıl değişecek?" diye sorduğunda, model web'den veri arıyor, Python kodu yazıyor, grafik oluşturuyor ve bulgularını bir raporla açıklıyor.

Akademik başarılar ve yazılım geliştirme​


OpenAI'ın o3 modeli, özellikle yazılım geliştirme alanında dikkat çekici bir performans sergiliyor. OpenAI Başkanı Greg Brockman, modelin kendi şirketlerinin kod tabanında bile kendisinden daha iyi yön bulduğunu söyledi. o3, Codeforces, SWE-bench ve MMMU gibi önde gelen testlerde yeni bir standart belirlerken, özellikle yazılım mühendisliği, bilimsel araştırma ve iş analitiği gibi alanlarda güçlü sonuçlar verdi.

Daha küçük ve maliyet odaklı bir model olan o4-mini ise hız ve verimlilik arasında başarılı bir denge kuruyor. 2025 AIME matematik yarışmasında yüzde 99.5 başarı sağlayan model, yüksek hacimli kullanımlar için ideal bir çözüm sunuyor.

Yeni araç: Codex CLI ve geliştiricilere destek programı​


Modellerle birlikte tanıtılan bir diğer yenilik de Codex CLI adındaki hafif terminal tabanlı kodlama yardımcısı oldu. Geliştiriciler, bu aracı kullanarak ekran görüntüsü ya da kabataslak bir çizim gibi girdilerle modellerin kodlama yeteneklerinden faydalanabiliyor. Codex CLI açık kaynak olarak GitHub üzerinden yayınlandı. Ayrıca, bu aracı kullanan projelere destek vermek amacıyla OpenAI, toplam 1 milyon dolarlık bir hibe programı başlattı.

Güvenlik ve etik testler​


OpenAI, o3 ve o4-mini'nin şimdiye kadar uyguladıkları en kapsamlı güvenlik testlerinden geçtiğini duyurdu. Özellikle biyolojik tehditler, kötü amaçlı yazılım üretimi ve jailbreak denemelerine karşı yeni reddetme protokolleri geliştirildi. Şirket, modellerin "yüksek risk" eşiğinin altında kaldığını ve tehlikeli komutlara karşı sistem seviyesinde güvenlik önlemleri bulunduğunu belirtiyor.

Kullanıma sunulma ve fiyatlandırma​


o3 ve o4-mini modelleri, bugünden itibaren ChatGPT'nin Plus, Pro ve Team kullanıcıları tarafından erişilebilir durumda. Enterprise ve Education planları ise bir hafta içinde erişim sağlayacak. Ücretsiz kullanıcılar ise composer'daki "Think" seçeneğini kullanarak o4-mini'yi deneyimleyebilecek.

Geliştiriciler için de modeller, Chat Completions API ve Responses API üzerinden sunulmaya başlandı. o3'ün geliştirici kullanımında fiyatı milyon input token başına 10 dolar, output token başına ise 40 dolar olarak belirlendi. Daha küçük olan o4-mini için ise bu fiyatlar sırasıyla 1.10 ve 4.40 dolar.

OpenAI'ın geleceğe bakışı: GPT-5'e giden yol​


OpenAI CEO'su Sam Altman, bu modellerin ChatGPT'deki son bağımsız akıl yürütme modelleri olabileceğini, çünkü GPT-5 ile birlikte akıl yürütme yetenekleri ve doğal diyalog anlayışının birleşeceğini açıkladı. Bu doğrultuda o3-pro modeli de yolda. GPT-4.1'in kodlama gücünü, o3'ün görsel ve mantıksal zekasıyla birleştiren bir yapı hedefleniyor.

 

Users who are viewing this thread