OpenAI, ChatGPT’ye eklediği yeni genel amaçlı yapay zekâ ajanıyla, kullanıcıların dijital iş yükünü azaltmayı hedefleyen gelişmiş bir asistan sunuyor.
OpenAI, kullanıcılar adına çeşitli bilgisayar tabanlı görevleri yerine getirebilen yeni bir genel amaçlı yapay zekâ ajanını ChatGPT içinde hayata geçiriyor. Şirket, bu yeni aracın kullanıcıların takviminde gezinebildiğini, düzenlenebilir sunum ve slaytlar oluşturabildiğini ve kod çalıştırabildiğini belirtiyor.
TechCrunch’da yer alan habere göre ChatGPT Ajanı adı verilen bu araç, OpenAI’nin daha önceki ajan tabanlı araçlarından bazı yetenekleri bir araya getiriyor. Bunlar arasında, Operator aracının web sitelerinde gezinme becerisi ve Deep Research aracının düzinelerce web sitesinden bilgi sentezleyerek kısa araştırma raporları oluşturma yetisi bulunuyor. OpenAI, kullanıcıların bu ajanla yalnızca doğal dilde ChatGPT’ye talimat vererek etkileşime geçebileceğini söylüyor.
ChatGPT Ajanı, dün OpenAI’nin Pro, Plus ve Team planı abonelerine sunuldu. Aracı etkinleştirmek isteyen kullanıcılar, ChatGPT’nin araçlar menüsünden “ajan modu”nu seçebiliyor. Bu lansman, OpenAI’nin ChatGPT’yi yalnızca soru-cevap veren bir sistem olmaktan çıkarıp, eylem alabilen ve kullanıcıların iş yükünü azaltabilen bir ajan ürününe dönüştürmeye yönelik en iddialı adımı olarak değerlendiriliyor. Son yıllarda OpenAI, Google ve Perplexity gibi Silikon Vadisi şirketleri benzer ajan araçları piyasaya sürdü. Ancak bu erken dönem yapay zekâ ajanlarının karmaşık görevlerde zorlandığı ve ürün olarak henüz vaat edilen düzeye ulaşamadığı görülüyor.
Buna karşın OpenAI, ChatGPT Ajanı’nın önceki araçlarına kıyasla çok daha yetenekli olduğunu vurguluyor.
Yeni ajan, ChatGPT bağlayıcılarına (connectors) erişebiliyor ve bu sayede kullanıcılar Gmail veya GitHub gibi uygulamaları bağlayarak ajanın istemlere uygun bilgiye ulaşmasını sağlayabiliyor. ChatGPT Ajanı ayrıca bir terminale erişebiliyor ve bazı uygulamalara erişmek için API’leri kullanabiliyor.
OpenAI, kullanıcıların bu ajanı kullanarak “dört kişilik Japon kahvaltısı planlayıp gerekli malzemeleri satın alabileceklerini” veya “üç rakip analiz edilerek bir sunum hazırlanabileceğini” belirtiyor. Bu tür görevler, ajanın web sitelerini analiz etmesini, bir eylem planı oluşturmasını ve çeşitli araçları kullanmasını gerektiriyor – bu da OpenAI’nin daha önceki ajanlarında denediğinden çok daha karmaşık bir süreç.
OpenAI’ye göre, ChatGPT Ajanı’nın altında yatan model birçok değerlendirme testinde son teknoloji performans sergiliyor. Şirket, modelin “Humanity’s Last Exam” adlı zorlu testte (tek denemede başarı oranı – pass@1) %41,6 puan aldığını söylüyor. Bu, OpenAI’nin önceki o3 ve o4-mini modellerinin aldığı puanların yaklaşık iki katı.
Zorlu matematik benchmark’larından biri olan FrontierMath testinde ise, araçlara (örneğin kod çalıştırma terminali) erişim sağlandığında ChatGPT Ajanı yüzde 27,4 başarı elde ediyor. Bu alandaki önceki en iyi sonuç, yalnızca yüzde 6,3 ile o4-mini modeline aitti.
Güvenlik önlemleri ve riskler
OpenAI, ChatGPT Ajanı’nın bazı yeni yetenekler barındırması nedeniyle kötüye kullanım riskini artırabileceğini ve bu nedenle güvenlik önlemleriyle geliştirildiğini ifade ediyor. Şirket daha önce, ajan tabanlı modellerin daha tehlikeli kabiliyetler geliştirebileceği konusunda uyarılarda bulunmuştu.
Yayınlanan güvenlik raporunda, ChatGPT Ajanı biyolojik ve kimyasal silahlar alanında “yüksek kapasiteli” model olarak sınıflandırılıyor. OpenAI’nin Hazırlık Çerçevesi’nde bu sınıflandırma, modelin “şiddetli zarara yol açabilecek mevcut yolları güçlendirme yetisine” sahip olduğu anlamına geliyor. Her ne kadar bu yeteneklerin doğrudan kanıtı bulunmasa da, OpenAI temkinli bir yaklaşım benimseyerek yeni güvenlik önlemleri devreye aldığını bildiriyor.
Bu önlemler arasında, kullanıcı etkileşimleri sırasında gerçek zamanlı çalışan bir izleyici sistem bulunuyor. Her kullanıcı girdisi, biyoloji ile ilgili olup olmadığını tespit eden bir sınıflandırıcıdan geçiriliyor. Eğer içerik biyolojiyle ilgiliyse, yanıt ikinci bir güvenlik filtresine tabi tutularak biyolojik tehdit potansiyeli değerlendiriliyor.
Ayrıca, kötüye kullanım riskini azaltmak amacıyla ChatGPT Ajanı’nda hafıza özelliği devre dışı bırakıldı. ChatGPT’nin diğer bölümlerinde bu özellik, önceki sohbetlerden bilgi hatırlayarak deneyimi kişiselleştirebiliyor. Ancak OpenAI, bu özellik ajan modunda hassas verilerin dışarı sızdırılmasına yol açabilecek prompt enjeksiyon saldırılarıyla suistimal edilebileceği gerekçesiyle devre dışı bırakıldığını belirtiyor. Şirket, bu özelliğin ileride tekrar etkinleştirilebileceğini de ekliyor.
Son olarak her ne kadar ChatGPT Ajanı etkileyici özellikler sunsa da, gerçek dünyadaki performansı henüz net değil. Bugüne dek ajan teknolojileri, gerçek dünya ile etkileşimlerde tutarsız ve kırılgan bir yapıya sahipti. Buna rağmen OpenAI, daha yetenekli bir model geliştirdiğini ve bu modelin AI ajanları hakkındaki vaatleri gerçekleştirebileceğini öne sürüyor.