Düşüncenin Yeni Evresi: OpenAI O3 Mini Modeli ile Tanışın

OpenAI CEO’su Sam Altman, 17 Ocak 2025 tarihinde yeni akıl yürütme modeli o3 modelinin o3 mini versiyonunu tamamladıklarını ve birkaç hafta içerisinde piyasaya süreceklerini aktardı.

GPT ile O modelleri arasındaki farklar

ChatGPT ile tanınan OpenAI, ABD merkezli bir yapay zeka şirketidir. ChatGPT artık neredeyse herkesin bildiği ve kullandığı bir platform olmaya başladı. GPT modelleri daha çok metin tabanlı bir sistem kullandığı için yapabildikleri kısıtlıydı. “o” modelleri ise özel akıl yürütme sistemleri kullanarak daha gerçekçi cevaplar vermeye çalışır. “o” modelleri multimodal sistem kullanır; yani metin, ses, resim gibi birden çok girdi alıp yorumlayabilir ve daha hızlı cevaplar üretebilir. Ayrıca “o” modelleri bilim, matematik, kodlama gibi alanlarda büyük başarılar gösterir.

Özetle; GPT daha geniş bir kullanım yelpazesine sahipken, “o” modelleri uzmanlık isteyen alanlarda başarı gösterir. Bildiğimiz gibi bu tür uygulamalarda doğal dil işleme önemli bir kullanıma sahiptir. Bunun yanında “o” modellerinde kullanılan multimodal sistemlerin doğal dil işleme ile nasıl birleştirildiği hakkında daha fazla bilgi almak isterseniz “NLP’nin Geleceği: 5 Kritik Alan ve Çalışma” yazımızı okuyabilirsiniz.

LLM’ler Nasıl Akıl Yürütür?

“o1” modeli, bir soruya cevap verirken insan gibi akıl yürütür. İnsan akıl yürütürken beynin çeşitli düşünceleri birleştirir ve bir muhakeme sonucunda karar verir. “o1” modeli de bu düşünce zincirlerini kullanarak akıl yürütür. Yapay zekadan beklediğimiz gibi hatalarından ders çıkarır.

o1 Modelinin Performansı ve Başarıları:

Matematik Performansı: o1 modeli, Amerika’nın en zor lise matematik sınavlarından biri olan AIME’de (2024) %93 başarı oranıyla GPT-4o’yu geride bıraktı ve ülke genelinde ilk 500’e girdi.
Bilim Alanlarındaki Başarılar: o1, kimya, fizik ve biyoloji alanlarındaki zorlu GPQA diamond kıyaslamasında doktora derecesine sahip uzmanların performansını geride bıraktı.
Görme Algılama Yeteneği: o1 modeli, MMMU testlerinde %78,2 puan alarak insan uzmanlarla rekabet edebilen ilk model oldu.
Genel Performans: o1, birçok makine öğrenmesi (ML) kıyaslamasında son teknolojiyi geride bıraktı ve 57 MMLU alt kategorisinden 54’ünde GPT-4o’dan daha iyi performans gösterdi.

OpenAI’nın Yenilikleri

Geçtiğimiz ay OpenAI, 12 günlük bir seride her gün farklı bir teknolojisini tanıttı. Serinin 12. gününde “o serisinin” yeni hizalama stratejilerini paylaştı. “o” modellerinde kasıtlı hizalama yöntemlerini kullandıklarını ve bu sayede daha gerçekçi sonuçlar aldıklarını belirttiler. Kasıtlı hizalamada modelin daha doğru sonuç vermesi için bilimsel doğruluk, güvenilirlik ve anlaşılırlık gibi kriterlere göre eğitilmesi sağlanır. Kasıtlı hizalamayı kullanarak, OpenAI’nin iç politikalarından ilgili metni belirlemek ve daha güvenli yanıtlar taslaklamak için düşünce zinciri (CoT) akıl yürütmesini kullanmalarını sağladıklarını aktardılar.

Modern LLM’ler hızlı yanıt oluşturmak zorunda olduğu için çoğu zaman güvenlik açığı oluşturabilir. Örneğin, suç işlemek için yöntem arayan birine fikir vermek gibi. OpenAI, bilinçli hizalama adı verilen bir yöntem ile bu güvenlik açıklarını engellemeye çalışıyor. Bilinçli hizalama (intentional alignment), güvenlik özelliklerinin doğrudan modele öğretilmesi ve bu özellikler üzerinde çıkarım zamanında bilinçli olarak eğitilmesi yaklaşımıdır. Bu, belirli bağlama uygun güvenli yanıtlar üretmeyi amaçlar. Diğer yaklaşımlar, güvenlik özelliklerini yalnızca eğitim etiketi olarak kullanır ve özelliklerin kendisi modele verilmez.

Bilinçli hizalama, modelin çıkarım zamanında güvenlik özellikleri üzerinde karmaşık akıl yürütme yapabilme yeteneğine sahiptir ve bu bakımdan benzersizdir. Diğer stratejiler, belirli akıl yürütme yollarıyla sınırlıdır ve doğrudan güvenlik özellikleri üzerinde akıl yürütmeyi içermez. Sonuç olarak, o1 modeli, GPT-4o, Claude 3.5 Sonnet ve Gemini 1.5 Pro ile karşılaştırıldığında, güvenlik değerlendirmelerinin çoğunda başarılı oluyor. LLM konusundaki yetenekler arttıkça yanlış hizalama ve kötüye kullanma artabilir. Ancak OpenAI, hizalama tekniklerini kullanarak bu sorunu aştıklarını belirtiyor.

o3 Modelinin Diğerlerinden Farkı Ne?

“o” modellerinin özel düşünce zincirleri kullandığından yukarıda bahsettik. “o3” modelinde bu düşünce sistemleri geliştirilmiştir. Bu sayede akıl yürütme anlamında daha üstün performans sağlar. Kullanıcılar bir sorun üzerinde ne kadar düşünmesi gerektiğini üç farklı modla belirleyebilir: düşük, orta ve yüksek modlar sayesinde işlem süresi optimize edilmiş olur. Ayrıca hesaplama gücü daha düşük olduğundan daha hızlı sonuçlar sunar. “o3 mini” ile insan odaklı güvenlik uyumu artırılmıştır. Çocuklara özel bilgi sunma özelliği sayesinde de avantaj sağlar. Hassas konularda daha güvenli bir dil kullanır. Kısacası, “o3 mini” daha düşük işlem gücü ile daha etkili ve güvenli sonuçlar sunmayı hedefliyor.

Kaynak