ChatGPT “çilek” sınavında sınıfta kaldı: Harfleri neden doğru sayamıyor?

Dünyanın en gelişmiş yapay zeka modelleri karmaşık kodlar yazıp şarkı bestelerken, konu bir kelimedeki harfleri saymaya gelince neden çuvallıyor? GPT-5.2’nin "strawberry" kelimesiyle imtihanı, dijital zekanın metinleri algılama biçimindeki ilginç hatayı gündeme getirdi.

Yapay zeka sistemleri artık grafik tasarlıyor, profesyonel raporlar hazırlıyor ve müzik listelerinde zirveye oynayacak şarkılar bile besteliyor.

Dev veri yığınlarıyla eğitilen bu sistemlerin karmaşık paternleri çözme yeteneği hayranlık uyandırıcı.

Ancak iş, yedi yaşındaki bir çocuğun saniyeler içinde yapabileceği kadar basit bir göreve, yani bir kelimedeki harfleri saymaya gelince işler garipleşiyor.

Aralık 2025’te yayınlanan en güncel model GPT-5.2, şaşırtıcı bir şekilde "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğu sorusuna halen yanlış cevap veriyor.

Kelimeye baktığımızda bir "r" harfinin başta, iki tanesinin ise sonda olduğunu, yani toplamda üç adet "r" bulunduğunu net bir şekilde görüyoruz.

Fakat milyarlarca dolarlık yatırımın ürünü olan bu devasa zeka, ısrarla "iki" cevabını vermeye devam ediyor.Peki, gelişmiş matematik problemlerini çözen bir sistem neden bu kadar basit bir noktada takılıyor?

Sorunun kökeni, yapay zekanın metinleri okuma biçiminde yatıyor.

ChatGPT ve benzeri modeller, kelimeleri harf harf değil, "token" adı verilen parça bloklar halinde algılıyor.

OpenAI’ın kendi araçlarıyla incelediğimizde "strawberry" kelimesi üç farklı bloğa bölünüyor: st, raw ve berry.

İlk parça olan "st" içinde hiç "r" yok.

İkinci parça "raw" bir tane "r" içeriyor.

Üçüncü parça olan "berry" ise iki tane "r" barındırmasına rağmen sistem tarafından tek bir birim olarak kodlanıyor.

Yapay zeka, harfleri tek tek saymak yerine bu blokların içeriğine dair bir tahmin yürütüyor.

Sonuç olarak "r" harfini sadece iki blokla eşleştirdiği için toplam sayıyı yanlış hesaplıyor.

Benzer bir durum "raspberry" (ahududu) kelimesinde de yaşanıyor; sistem orada da aynı mantık hatasına düşerek harf sayısını eksik veriyor.Yine de yiğidi öldürüp hakkını yememek lazım; yapay zeka bazı klasik sınavlarını başarıyla geçti.

Örneğin, geçmişte zorlandığı "Mississippi" kelimesini artık hatasız heceliyor ve "lollipop" kelimesini doğru bir şekilde tersten yazabiliyor.

Ancak hassas sayım işlemleri halen bu modellerin yumuşak karnı olmaya devam ediyor.

Daha da ilginci, yapay zekanın eski "travmalarıyla" baş etme yöntemi.

Geçmiş modellerde sistem hatasına yol açan "solidgoldmagikarp" ifadesi GPT-5.2’ye sorulduğunda, model artık çökmüyor ama bu sefer de hayal kurmaya başlıyor.

Bu ifadenin GitHub geliştiricileri tarafından saklanmış gizli bir Pokémon şakası olduğunu iddia eden yapay zeka, tamamen gerçek dışı bir hikaye uydurarak durumu geçiştirmeyi tercih ediyor.İlginç olan nokta ise OpenAI dışındaki devlerin bu sorunu büyük oranda aşmış olması.

Yapılan testlerde Claude, Gemini, Grok, Qwen ve hatta Microsoft'un Copilot'u "strawberry" kelimesindeki üç "r" harfini doğru şekilde tespit etti.

Bu durum, her modelin metni parçalama ve işleme mimarisinin farklı sonuçlar doğurduğunu açıkça ortaya koyuyor.

Yapay zeka dünyası su tüketiminden donanım maliyetlerine kadar devasa kaynaklar harcayarak gelişmeye devam etse de, bir kelime içindeki harfleri saymak gibi en temel insani beceriler, dijital zekanın önündeki en ilginç engellerden biri olmayı sürdürüyor.

#yapay-zeka #yazilim

Orijinal habere git