Çağla ÜREN / Euronews
Yapay zeka yarışında 'etken' veya 'ajan yapay zeka' diye nitelenen yeni bir eşiğe ulaştık. Peki bu yeni yarış, teknolojiyi nereye götürecek?
2022'de OpenAI'ın ChatGPT üçüncü nesil dil modelini piyasaya sürmesiyle başlayan yapay zeka yarışında üç yılın sonunda yeni bir eşiğe ulaştık.
Kullanıcıyla sohbet etme, istenen metinleri üretme, yazılı komutları anlayarak görsel ve video üretme yeteneğiyle yaygınlaşan üretken yapay zeka, kısa süre içinde internette arama yapma özelliğine de kavuşarak yeni nesil arama motorları olarak kullanılabileceğini de kanıtladı.
Şimdi ise bu araçlar, gerçek birer asistan gibi davranarak görevleri kendi kendilerine yerine getirebileceklerini kanıtlamak üzere. Bu yeni eşiğe "otonom yapay zeka", "ajan" veya "etken yapay zeka" deniyor.
Neden "ajan" deniyor?
İngilizcede "agentic AI" diye kullanılan bu terim, "etken" anlamına gelen "agentic" nitelemesini psikoloji teorilerinden, özellikle de etkenlerin çevrelerini nasıl şekillendirdiğini irdeleyen Albert Bandura'nın sosyal bilişsel teori üzerine çalışmalarından alıyor.amı
Otonom karar alma sistemlerinin temelleri, ünlü bilgisayar bilimci Alan Turing'in makine zekası ve Norbert Wiener'in sibernetik geri bildirim sistemleri gibi temel kavramlarla 20. yüzyılın ortalarında atıldı. 1990'larda yapılan çalışmalar terimi resmileştirdi. Artık "akıllı bir etken", çevresini algılayan ve hedeflere ulaşmada başarıyı en üst düzeye çıkarmak için harekete geçen sistemler olarak tanımlanıyordu.
Üretken yapay zekadan, etken yapay zekaya
ChatGPT ile birlikte komutlara yanıt veren üretken yapay zeka sistemleri internet deneyiminin merkezine yerleşmeye başladı. Ancak yalnızca komutlara yanıt veren sistemlerden, çok adımlı hedefleri kendisi planlayıp harekete geçen sistemlere geçme hedefi devam etti.
Bu yolda ilk olarak muhakeme (reasoning) modelleri geldi. 2022'de ChatGPT 3'ün çok adımlı akıl yürütme yeteneği yoktu. Ancak Google Brain araştırmacıları, dil modellerinin daha iyi akıl yürütmesi için adım adım açıklamalı komutlar kullanmayı önerdi ki bu, yapay zeka araçlarına muhakeme yeteneği kazandırmada bir dönüm noktasıydı.
Bunun ardından ReAct (Reasoning + Acting) adı verilen yeni modeller geldi. Bunlar yapay zeka araçlarının hem düşünmesini hem de aksiyon almasını sağlarken, "ajan yapay zekaya" geçişin de temelini attı.
Kullanıcılar ise bunu büyük ölçüde 2023'te GPT-4'ün piyasaya sürülmesiyle duydu. Artık yapay zekanın çok daha gelişmiş muhakeme yetenekleri vardı. Örneğin matematiksel problemleri, mantık soruları, programlama gibi alanlarda daha güçlü çıktılar veriyordu.
Ve sonunda 2025 yazında "ajan yapay zeka" modellerinin piyasaya sürüldüğüne ve ChatGPT ile Google'ın Gemini modelinin matematik olimpiyatlarında şampiyonluklar elde ettiği bir döneme tanık olmaya başladık.
Ajan yapay zekalar neler yapabilir?
Sadece üç yıl içinde "geleneksel" tanımını kullanmaya başladığımız eski üretken yapay zekalar, içerik oluşturma, büyük miktarda veriyi analiz etme, çıktıları kullanıcının aradığı tarza uygun olacak şekilde uyarlayabilme ve müşterilere kişiselleştirilmiş öneriler sunma gibi yeteneklere sahipti.
Ajan yapay zekalar ise bu yetenekleri bir adım ileri taşıyor. Ünlü teknoloji firması IBM, bu özellikleri şöyle sıralıyor:
Karar verme: Önceden tanımlanmış planlar ve hedefler sayesinde bu yapay zeka sistemleri, insan müdahalesi olmadan veya minimum insan müdahalesiyle durumları değerlendirebilir ve ileriye giden yolu belirleyebilir.
Problem çözme: Sorunları çözmek için dört adımlı bir yaklaşım kullanır; algılama, akıl yürütme, harekete geçme ve öğrenme. Bu dört adım, yapay zeka aracılarının veri toplayıp işlemesiyle başlar. Dil modeli, daha sonra algılanan verileri analiz ederek durumu anlayan bir düzenleyici görevi görür. Ardından, sürekli olarak gelişen ve geri bildirim yoluyla öğrenen harici araçlarla entegre olur.
Özerklik: Kendi kendine öğrenme ve çalışma konusundaki benzersiz yeteneği, iş akışlarını düzene sokmak ve makinelerin minimum insan müdahalesiyle karmaşık görevleri yerine getirmesini sağlamak isteyen kuruluşlar için onu umut verici bir teknoloji haline getirir.
Etkileşim: Proaktif yapısı sayesinde, dış ortamla etkileşime girebilir ve gerçek zamanlı verileri toplayabilir. Buna bir örnek, çevresini sürekli analiz edip güvenli ve doğru sürüş kararları alması gereken otonom araçlar.
Planlama: Aracı yapay zeka modelleri, karmaşık senaryoları yönetebilir ve belirli hedeflere ulaşmak için çok adımlı stratejileri uygulayabilir.
Tüm bu özellikler sayesinde ajan yapay zekaların gerçek anlamda birer asistan gibi davranması hedefleniyor. Örneğin, takvimleri tarayıp, uygun zamanları tespit ederek haftalık ekip toplantısı organize edebilir, toplantı davetlerini gönderip sonrasında notlar da alabilirler. Ve tüm bu adımlarda insanların müdahalesine ihtiyaç duyulmayabilir.
Benzer şekilde satış verilerini analiz ederek haftalık raporlar hazırlayabilirler. Bu süreçte Excel ya da veri tabanından verileri çekerek örüntüleri bulup (en çok satan ürünler, düşen bölgeler vs.) PowerPoint veya PDF raporu oluşturarak Slack üzerinden ekiple paylaşabilirler. Her hafta yapılması gereken tekrarlayan işler bu sayede tamamen otomatikleşebilir.
Ajan yapay zekaların bireylerin gündelik hayatlarındaki kullanım alanlarının da epey çeşitli olması bekleniyor. Mesela haftalık yemek planı yapıp, eksikleri sipariş edebilir veya gösterimdeki popüler filmleri kişisel tercihlere göre analiz edip sinema biletleri alabilirler. Şimdilik bu araçlar satın alım yapmak gibi geri dönüşü olmayan kritik eylemler için son uğrakta insan onayı bekliyor.
Google, OpenAI ve diğerleri: Hangi araç nasıl kullanılır?
Sektörün kıyasıya rekabet halindeki büyük oyuncuları Google, Microsoft, OpenAI, Anthropic ve Perplexity, 2023-2025 arasında ajan yapay zeka araçları konusunda ciddi adımlar attı. Ancak her birinin yaklaşımı farklı hedeflere ve teknik stratejilere dayanıyor.
Örneğin Google'ın 2024'te piyasaya sürdüğü Gemini 1.5 dil modeli, çok adımlı muhakeme yapabilen sistemken, Gmail, Takvim, Drive gibi Google hizmetlerine entegre edilerek asistan hizmeti sunuyor.
Microsoft'un ürünleri ise kurumsal iş akışlarını otomatikleştirme odaklı. Örneğin, Microsoft Copilot (M365 Copilot); şirketin Outlook, Excel, Teams ve Word gibi uygulamaları üzerinde görev yapan bir ajan. GitHub Copilot özelliği ise bir kodlama ajanı. Teknoloji devi ayrıca "Autonomous Agents on Azure AI Studio" adlı hizmetiyle kullanıcıların kendi ajanlarını oluşturmasına olanak tanıyor.
Öte yandan OpenAI, daha esnek, yaratıcı ve araştırma odaklı ajanlar üretme hedefinde. Geçen hafta piyasaya sürülen ve bu hafta Türkiye'ye gelen GPT-4 Agent modeli, kod yazma, dosya okuma, rapor hazırlama, araç çağırma, sipariş verme ve toplantı planlama gibi bir dizi farklı göreve odaklanıyor.
OpenAI'ın yayınladığı tanıtım videosunda ChatGPT Agent, kendi başına sunum hazırlarken görülüyor.
MCP devrimi: 'Yapay zeka araçlarını istediğiniz her şeye bağlayın'
Bahsi geçen araçlar farklı odak noktalarına sahip olsa da özellikle Google ve Microsoft gibi ofis ve bulut bilişim hizmetleri veren büyük markalar için en büyük avantaj, bireylerin kendi hesaplarında depoladıkları verilere bu yapay zeka araçlarını entegre etme olanağı. Örneğin Google hizmetlerini daha çok kullananlar için Gemini, Microsoft hizmetlerini kullananlar içinse Copilot daha avantajlı olabiliyor.
Ancak hem ajan yapay zeka hem de diğer modellerinde etik çalışmalara odaklanmasıyla öne çıkan Anthropic firması bu ikiliği ortadan kaldırabilecek ve yapay zeka araçlarını tüm veri sistemlerine bağlamaya olanak tanıyabilecek bir sistem geliştirdi.
Model Bağlam Protokolü (Model Context Protocol / MCP) adı verilen bu sistem, yapay zeka uygulamaları için bir çeşit USB-C portu görevi görüyor.
Tıpkı USB-C'nin cihazları çeşitli aksesuarlara ve güç kaynaklarına bağlamak için standart bir yol sağlaması gibi, MCP de yapay zeka modellerini farklı veri kaynaklarına ve araçlara bağlamak için standart bir yöntem sağlıyor.
Her bir yapay zeka için özel eğitim verileri oluşturmaya veya yazılımcıların manuel olarak kullanabildiği API'lere güvenmek yerine, tercih ettiğiniz bir yapay zeka aracı, MCP aracılığıyla istediğiniz herhangi bir hizmetini kullanabilir ya da herhangi bir yerde depoladığınız verilerinize erişebilir. Bu sayede eğitilmesine gerek kalmadan gerçek zamanlı verileri de alabilir.
Bu teknoloji, ajan yapay zekaların kullanım şekliyle de yakından ilgili. Çünkü ajan yapay zekaların tıpkı asistanlar gibi ihtiyaç duyulan araçları seçip otomatik olarak kullanması amaçlanıyor. Örneğin, bir yönetici, sanal asistanına "Bu hafta ekipte kimler yıllık izinde? Ayrıca son satış raporunu bana özetle" görevi verdiğinde MCP devreye girerek şu adımları izleyebilir:
- HR sisteminden izinli çalışanların verisini doğrudan çeker.
- Satış veritabanından son dosyayı alır, özet çıkartır.
- Yöneticinin takvimine uyarılar ekler.
Bunların hepsi arka planda, araç çağırma (tool use) yoluyla yapılır. MCP sayesinde kod ve entegrasyon zahmetine girmeye gerek kalmaz.
OpenAI, Google, Microsoft ve diğer tedarikçiler son günlerce MCP'yi destekleyerek araçlar ve modeller arasında paylaşılan entegrasyon ekosistemini güçlendiriyor.
Arama motorlarının geleceği: Google'ı yerinden edecek mi?
Ajan yapay zeka söz konusu olduğunda diğerlerinden farklı bir yol izleyerek sadece araştırma ve arama motoru işlevine odaklanan bir firma da var: Perplexity AI.
Akademisyenler, analistler ve gazetecilere yönelik başlayarak araştırma konusunda en çok tercih edilen araçlardan biri haline gelen Perplexity, 2024'te muhakeme yeteneğine kavuşmuştu. Önceki haftalarda araç, "ajan sohbet modu" özelliği de kazandı. Bu sayede Perplexity artık soruları anlamlandırıp araştırma planı çıkarıyor ve çoklu adımlar izleyerek araştırma yapıyor.
“Tarayıcı gibi düşün, araştırmacı gibi yaz” felsefesini benimseyen şirket, yakın zamanda yapay zeka tabanlı masaüstü tarayıcısı Comet'i duyurdu ve böylece tarayıcı konusunda Chrome'a açıkça rakip oldu. Kullanıcılar, tüm içerik ve tarayıcı uzantılarını Chrome'dan Comet'e aktarmak için Google hesaplarını tarayıcıya bağlama seçeneğine de sahip.
Comet, makalelerin ve YouTube videolarının özetlerini oluşturmak için kullanılabiliyor. Kullanıcılar ayrıca, ekranlarındaki bir resmi tanımlamasını veya belirli bir konu hakkında daha derinlemesine araştırma yapmasını isteyebiliyor. Ayrıca, tarayıcıda gösterilen tüm web sayfalarının yapay zeka tarafından oluşturulmuş özetlerini de sağlıyor ki bu Google'ın da uzun süredir üzerinde çalıştığı bir özellik.
Ancak Comet'i Chrome ve piyasadaki diğer yapay zeka tabanlı web tarayıcılarından ayıran asıl şey, "ajanlık" yeteneği. Comet'in sağ üst köşesinde, sohbet arayüzü içeren bir kenar çubuğu açan bir Asistan butonu mevcut. Arama sorgularının yanı sıra, kullanıcılar asistandan kendileri adına belirli görevleri gerçekleştirmesini isteyebilir.
Bu görevlere e-posta yazıp göndermek, reklam e-postalarının aboneliklerini iptal etmek, sosyal medya platformlarında gönderiler yazıp paylaşmak, sekme açıp kapatmak da dahil. The Verge'ün haberine göre, Comet'teki asistan, kullanıcılar komutlarına "tarayıcımın kontrolünü ele geçir ve..." ile başladıklarında görevleri kendi başına tamamlamada daha iyi performans gösteriyor.
Öte yandan Comet şimdilik yalnızca sınırlı erişime sahip.
'6 ay içinde başlayabilir': Ajan yapay zekalar kimleri işinden edecek?
'Ajan yapay zekaların' yükselişiyle otomasyon kaynaklı iş kaybı endişesi de yeniden alevlendi. Sektörün ileri gelen isimleri ise her zamanki gibi çok iddialı konuşuyor.
Perplexity CEO’su Aravind Srinivas, yakın zamanda The Verge’ün Decoder adlı podcast’ine verdiği röportajda, şirketin yeni nesil yapay zeka destekli tarayıcısı Comet’in, bilgi alanında çalışanlarının işlerini tamamen devralabilecek düzeyde olduğunu savundu.
“Bir insan kaynakları uzmanının bir hafta süren aday bulma ve iletişime geçme işi artık sadece bir komut” diyen Srinivas, otomasyonun 6 ay gibi kısa bir süre içinde başlayacağını öne sürdü.
"Bu noktaya ulaşmak için akıl yürütme gücü gelişmiş modellerin çıkmasını bekliyoruz. Altı ay ya da bir yıl içinde bu işin tamamını yapabilecek duruma geleceğine eminim."
Bu hafta düzenlenen Fortune Brainstorm AI Singapore konferansında konuşan Google'ın Güney Asya sorumlularından Sapna Chadha da 2028'e kadar tüm kurumsal yazılımların yaklaşık yüzde 33'ünün ajan yapay zekaya sahip olmasının beklendiğini ve bunun günlük işlerin ve iş akışlarının yaklaşık yüzde 15'ini otomatikleştireceğini dile getirdi.
Öte yandan iş dünyası henüz bu yeni yapay zeka nesline yabancı. Outcomes Rocket'in 1299 pazarlamacıyla gerçekleştirdiği bir ankete göre, katılımcıların yüzde 89,5'i işlerinde yapay zeka kullanıyor. Ancak yalnızca yüzde 33,3'ü ajan yapay zekayı denemiş durumda.
Veriler muazzam bir tehlike altında olabilir
Bu yeni yapay zeka büyük potansiyel taşısa da beraberinde ciddi etik, güvenlik ve gizlilik riskleri getiriyor.
İlk endişe, bir aracın kendi kararlarını verirken yanlış, zararlı veya beklenmeyen sonuçlar doğurması. Örneğin bir otonom müşteri temsilcisi yanlışlıkla bir hesabı iptal edebilir ya da müşteriyi tehdit edici bir dilde yanıtlayabilir. Aynı zamanda halüsinasyon sorunu nedeniyle gerçek olamayacak vaatlerde bulunup yanlış bilgiler de verebilir. Bu durumda kimin sorumlu tutulacağı bile tartışmalı.
Ayrıca ajan yapay zekalar veri tabanları ve ödeme sistemleri de dahil olmak üzere geniş sistemlere entegre edilebileceği için hassas bilgilerin sızdırılması endişesi söz konusu. "Prompt injection" gibi siber saldırılarla kullanıcı istemeden özel verileri açığa çıkabilir. Yine siber saldırılar aracılığıyla yapay zekaya veri sildirmek gibi istenmeyen eylemlerde bulunması için komut da verilebilir.
Bunun yanı sıra ajan yapay zekalar aynı zamanda kullanıcı davranışlarını gözlemleyip analiz etme yeteneğine sahip. Bu da aslında gizlice veri toplama anlamına geliyor. Örneğin bir yazılım asistanı, yazım alışkanlıklarını analiz ederken, aslında kullanıcıların sağlık durumu, duygusal hâli, iş arkadaşlarıyla ilişkisi gibi çıkarımlar da yapabilir. Yapay zeka şirketlerinin bu verilere erişiminin önüne geçilmesi önemli bir talep olarak masada duruyor.