Yazılar

DeepMind, yeni AI kodlama motorunun ortalama bir insan programcı kadar iyi olduğunu söylüyor

DeepMind, AlphaCode adında “bilgisayar programlarını rekabetçi bir düzeyde yazar” dediği bir yapay zeka sistemi yarattı. Alphabet yan kuruluşu, sistemini insan yarışmalarında kullanılan kodlama zorluklarına karşı test etti ve programının, insan kodlayıcıların ilk yüzde 54’üne yerleştirerek “tahmini bir sıralamaya” ulaştığını buldu. DeepMind, AlphaCode’un becerilerinin ortalama bir kodlayıcının karşılaştığı programlama görevlerini mutlaka temsil etmemesine rağmen, sonucun otonom kodlama için önemli bir adım olduğunu söylüyor.

DeepMind’in baş araştırma bilimcisi Oriol Vinyals, The Verge’e e-posta yoluyla araştırmanın hala erken aşamada olduğunu, ancak sonuçların şirketi esnek bir problem çözme yapay zekası yaratmaya yaklaştırdığını söyledi. şu anda sadece insanların etki alanı. Vinyals, “Uzun vadede, [AlphaCode’un] programcılara ve programcı olmayanlara kod yazma, üretkenliği artırma veya yazılım yapmanın yeni yollarını yaratma konusunda yardımcı olma potansiyelinden heyecan duyuyoruz” dedi.

AlphaCode, satrançta kullanılan Elo derecelendirme sistemine benzer kodlayıcılar için haftalık sorunları paylaşan ve sıralamalar çıkaran rekabetçi bir kodlama platformu olan Codeforces’un küratörlüğünü yaptığı zorluklara karşı test edildi. Bu zorluklar, bir kodlayıcının ticari bir uygulama yaparken karşılaşabileceği türden görevlerden farklıdır. Daha bağımsızdırlar ve bilgisayar bilimindeki hem algoritmalar hem de teorik kavramlar hakkında daha geniş bilgi gerektirirler. Bunları mantık, matematik ve kodlama uzmanlığını birleştiren çok özel bulmacalar olarak düşünün.

AlphaCode’un test edildiği bir örnek meydan okumada, rakiplerden rastgele, tekrarlanan bir dizi s ve t harfini sınırlı bir girdi seti kullanarak aynı harflerden oluşan başka bir diziye dönüştürmenin bir yolunu bulmaları istenir. Örneğin, yarışmacılar sadece yeni harfler yazamazlar, bunun yerine orijinal dizideki birkaç harfi silen bir “geri al” komutu kullanmak zorunda kalırlar. Aşağıdaki meydan okumanın tam açıklamasını okuyabilirsiniz:

DeepMind’ın programını değerlendirmek için kullanılan “Geri Al” başlıklı örnek bir meydan okuma. Problem orta zorlukta, sol taraf problem tanımını ve sağ taraf örnek test senaryolarını gösteriyor.

Bu zorluklardan on tanesi, insanlara verildikleri formatta AlphaCode’a aktarıldı. AlphaCode daha sonra daha fazla sayıda olası yanıt üretti ve kodu çalıştırarak ve tıpkı bir insan rakibin yapabileceği gibi çıktıyı kontrol ederek bunları alt etti. AlphaCode gazetesinin ortak başkanları Yujia Li ve David Choi, The Verge’e e-posta yoluyla “Bütün süreç, en iyi örneklerin insan tarafından seçilmesi olmadan otomatiktir” dedi.

AlphaCode, Codeforces sitesinde 5.000 kullanıcı tarafından ele alınan 10 zorluk üzerinde test edildi. Ortalama olarak, yanıtların ilk yüzde 54,3’ü içinde yer aldı ve DeepMind, bunun sisteme 1238’lik bir Codeforces Elo verdiğini tahmin ediyor, bu da onu son altı ayda sitede yarışan kullanıcıların ilk yüzde 28’ine yerleştiriyor.

Codeforces kurucusu Mike Mirzayanov, DeepMind tarafından paylaşılan bir açıklamada, “AlphaCode’un sonuçlarının beklentilerimi aştığını güvenle söyleyebilirim” dedi. “Şüpheliydim [sic] çünkü basit rekabet problemlerinde bile genellikle sadece algoritmayı uygulamak değil, aynı zamanda (ve bu en zor kısım) onu icat etmek gerekir. AlphaCode, gelecek vaat eden yeni bir rakip düzeyinde performans göstermeyi başardı.”

Bir kodlama zorluğuyla mücadele eden örnek bir AlphaCode arayüzü. Girdi, solda insanlara olduğu gibi verilir ve çıktı sağda üretilir.

DeepMind, AlphaCode’un mevcut beceri setinin şu anda yalnızca rekabetçi programlama alanında geçerli olduğunu, ancak yeteneklerinin, programlamayı daha erişilebilir ve bir gün tamamen otomatik hale getiren geleceğin araçlarının yaratılmasına kapı açtığını belirtiyor.

Diğer birçok şirket benzer uygulamalar üzerinde çalışıyor. Örneğin, Microsoft ve AI laboratuvarı OpenAI, ikincisinin dil üreten programı GPT-3’ü kod dizilerini tamamlayan bir otomatik tamamlama programı olarak işlev görecek şekilde uyarladı. (GPT-3 gibi, AlphaCode da dönüştürücü olarak bilinen ve hem doğal dil hem de kod olarak sıralı metni ayrıştırmada özellikle usta olan bir AI mimarisine dayanır). Son kullanıcı için bu sistemler tıpkı Gmail’in Akıllı Yazma özelliği gibi çalışır ve yazdıklarınızı bitirmenin yollarını önerir.

Son yıllarda AI kodlama sistemleri geliştirmede çok ilerleme kaydedildi, ancak bu sistemler sadece insan programcıların işini devralmaya hazır olmaktan çok uzak. Ürettikleri kod genellikle hatalıdır ve sistemler genellikle genel kod kitaplıklarında eğitildiğinden, bazen telif hakkıyla korunan materyalleri yeniden üretirler.

Kod deposu GitHub tarafından geliştirilen Copilot adlı bir AI programlama aracı üzerinde yapılan bir çalışmada, araştırmacılar, çıktısının yaklaşık yüzde 40’ının güvenlik açıkları içerdiğini buldu. Güvenlik analistleri, kötü aktörlerin kasıtlı olarak çevrimiçi olarak gizli arka kapılarla kod yazıp paylaşabileceğini ve daha sonra bu hataları gelecekteki programlara ekleyecek AI programlarını eğitmek için kullanılabileceklerini öne sürdüler.

Bunun gibi zorluklar, yapay zeka kodlama sistemlerinin programcıların çalışmalarına büyük olasılıkla yavaş yavaş entegre edileceği anlamına geliyor – bu, kendi başlarına iş yapmaları için kendilerine güvenilmeden önce önerileri şüpheyle karşılanan asistanlar olarak başlıyor. Başka bir deyişle, yürütmeleri gereken bir çıraklık eğitimi var. Ancak şimdiye kadar, bu programlar hızlı öğreniyor.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu