Sponsorlu Alan / Reklam
Siyasetin Yeni Taklit Yeteneği
Yapay zeka modellerinin insan iletişimini taklit etme becerisi, dijital bilgi ekosisteminde yeni bir dönemin kapısını aralıyor. PLOS One dergisinde yayımlanan yeni bir araştırma, seçmenlerin yapay zeka tarafından üretilen siyasi yanıtları, siyasetçilerin kendi gerçek ifadelerinden daha samimi, tutarlı ve konuya uygun bulduğunu ortaya koydu. Steffen Herbold, Alexander Trautsch, Zlata Kikteva ve Annette Hautli-Janisz tarafından yürütülen çalışma, üretken yapay zekanın kamuoyunu yönlendirme ve dezenformasyon yayma potansiyeline dair önemli veriler sunuyor.
BBC "Question Time" Üzerinden Kurulan Deney Tasarımı
Araştırmacılar, yapay zekanın inandırıcılığını test etmek için Birleşik Krallık'ın köklü siyasi tartışma programı BBC "Question Time"ı temel aldı. Programda siyasetçiler, iş insanları ve gazeteciler, canlı izleyicilerden gelen güncel soruları yanıtlıyor. Çalışma kapsamında, Haziran 2020 ile Kasım 2021 arasında yayınlanan bölümlerden 112 farklı kamu figürüne ait 520 gerçek soru ve cevap derlendi.
Ardından, GPT-4 Turbo adlı yapay zeka modeline aynı sorular yöneltildi. Yapay zekaya, soruyu yanıtlayan gerçek kişinin rolüne bürünmesi talimatı verildi. Modelin bu kişileri taklit edebilmesi için ilgili siyasetçinin Wikipedia sayfasındaki ilk paragraftan alınan kısa bir biyografi sisteme yüklendi. Yapay zekadan soruyu doğrudan yanıtlaması, sohbet tonu kullanması ve yanıtı yaklaşık 200 kelimeyle sınırlandırması istendi.
Hazırlanan metinler, Birleşik Krallık'ta yaşayan ve ülkeyi temsil eden 948 yetişkinden oluşan bir katılımcı grubuna değerlendirildi. Katılımcılara başlangıçta okudukları metinlerin yarısının yapay zeka tarafından yazıldığı söylenmedi; sadece televizyon programının deşifre metinlerini okudukları belirtildi.
Üç Farklı Değerlendirme Grubu ve Sonuçlar
Araştırmacılar katılımcıları üç farklı test grubuna ayırdı:
- Birinci Grup: Katılımcılar bir izleyici sorusunu, konuşmacının adını ve tek bir yanıtı (gerçek veya yapay zeka üretimi) okudu. Metni samimiyet (konuşmacının bunu gerçekten söyleyip söylemediği), tutarlılık (argümanın mantıksal akışı) ve uygunluk (soruya verilen yanıtın kalitesi) açısından puanladı.
- İkinci Grup: Katılımcılara gerçek ve yapay zeka yanıtları yan yana gösterildi. Aynı kriterlere göre karşılaştırma yapmaları ve iki metnin aynı temel mesajı taşıyıp taşımadığını belirlemeleri istendi.
- Üçüncü Grup: Katılımcılara soru, konuşmacının adı, kısa biyografisi ve gerçek ya da sahte bir yanıt sunuldu. Bu grupta, konuşmacının geçmiş bilgisinin değerlendirmeyi nasıl etkilediği ölçüldü. Kontrol testi olarak bazı katılımcılara gerçek bir yanıt, tamamen ilgisiz başka bir konuşmacının adıyla eşleştirilerek gösterildi.
Her üç gruptan elde edilen bulgular tutarlı bir şekilde yapay zeka metinlerinin lehine oldu. Katılımcılar, yapay zeka tarafından üretilen sahte yanıtları, gerçek siyasetçilerin canlı yayında verdikleri yanıtlardan daha samimi, daha tutarlı ve konuya daha uygun olarak değerlendirdi. İki metin yan yana sunulduğunda bile yapay zeka yanıtı daha inandırıcı bulundu.
Yapay Zeka Neden Daha "Samimi" Algılanıyor?
Araştırmacılar, yapay zekanın bu başarısının arkasında yatan bazı dilsel ve yapısal nedenleri belirledi. Canlı tartışmalarda siyasetçiler zor sorulardan kaçınma, konuyu saptırma veya doğrudan yanıt vermeme eğilimi gösterirler. Bu durum, izleyicide yanıtın ilgisiz olduğu algısını yaratır. Buna karşılık, doğrudan soruyu yanıtlama talimatı alan yapay zeka, konuya sadık kaldı ve soruyla daha fazla ortak kelime kullandı.
Dil tarzı analiz edildiğinde, insanların canlı konuşmalarda "bence" veya "bana göre" gibi öznel duruş belirten ifadeleri (epistemik belirteçler) ve fikirleri bağlamak için "çünkü" veya "ilk olarak" gibi bağlaçları daha sık kullandığı görüldü. Yapay zeka ise daha geniş bir kelime dağarcığı tercih etti ve eylemleri isimleştirerek daha soyut ve resmi bir dil kurdu. İlginç bir şekilde, okuyucular bu dilsel farkları fark etmedi ve bu durum yapay zekanın samimiyet puanını düşürmedi.
Siyasi Temsiliyet Riski ve Yanıltıcı Duruşlar
Katılımcılar, gerçek ve sahte metinlerin yaklaşık yarı yarıya farklı mesajlar ilettiğini hissetti. Bu uyumsuz metinler incelendiğinde, yapay zekanın vakaların yüzde 26'sında gerçek siyasetçinin görüşlerinden tamamen farklı, hatta taban tabana zıt bir siyasi duruş ürettiği görüldü. Bu durum, teknolojinin bir kamu figürünün siyasi programını tamamen yanlış yansıtacak inandırıcı sahte beyanlar üretmek için kolayca kullanılabileceğini gösteriyor.
Deney sonunda katılımcılara yapay zekanın kullanıldığı açıklandığında, yüzde 90'ından fazlası teknolojiye yönelik görüşlerini değiştirmedi. Ancak fikir değiştiren azınlık, yapay zeka hakkında aslında sandıklarından daha az bilgi sahibi olduklarını fark etti. Birçok katılımcı, sahte yanıtların kalitesi karşısında şaşkınlığını dile getirdi.
Araştırmanın Sınırları ve Gelecek Çalışmalar
Çalışmanın yöntemsel olarak bazı sınırlılıkları bulunmaktadır. Araştırma yalnızca Birleşik Krallık'taki tek bir televizyon programına (BBC Question Time) ve tek bir yapay zeka modeline (GPT-4 Turbo) odaklanmıştır. İngiliz izleyicilerin tepkileri, diğer ülkelerdeki seçmenlerin farklı siyasi medya türleriyle etkileşimini tam olarak yansıtmayabilir.
Bir diğer önemli sınır ise canlı tartışma ortamının doğasıdır. Siyasetçiler baskı altında, anlık ve bazen düşmanca bir ortamda hazırlıksız konuşurken, yapay zeka yazılı ve düzenlenmiş bir basın bülteni pürüzsüzlüğünde metinler üretmiştir. Katılımcıların yapay zekayı daha samimi bulmasının nedeni, bu metinlerin canlı konuşmadan ziyade iyi düzenlenmiş bir yazılı açıklama gibi okunması olabilir. Gelecekteki çalışmaların, yapay zekanın sosyal medya paylaşımları veya önceden hazırlanmış konuşmalar gibi farklı bağlamlardaki etkisini incelemesi gerekmektedir.