Yapay zeka, dil konusunda artık insanlardan daha iyi!

Google News | Abone Ol Bizi Bundle'dan da takip edebilirsiniz!

Yapay Zeka (AI) ilk defa, günlük konuşmaları tanımada insanlardan daha yüksek bir doğruluk seviyesine ulaşmayı başardı. Bu gelişme gelecekte teknoloji, örneğin otomatik çeviriler için temel oluşturabilir.

Alexa, Cortana veya Siri gibi sesli asistanlar, sözlü metinleri otomatik olarak yazıya dökmeyi ve çeviriler oluşturmayı mümkün kılıyor. Konuşma tanıma sistemleri, kütüphaneleri kullanarak tek tek hecelere ve kelimelere akustik sinyaller atayan yapay sinir ağlarını kullanır. Asistanlara doğrudan hitap edildiğinde veya bir metin yüksek sesle okunduğunda sonuçlar artık çok iyi, ancak Ruhr-Universität-Bochum’un (RUB) yakın zamanda gösterdiği gibi, dil asistanlarına da yol açabilecek problemler genellikle günlük hayatta ortaya çıkıyor. Yanlış anlaşılan sinyaller bazen önemli hatalara sebebiyet verebiliyor.

Birkaç kişi arasındaki konuşmalar hala sık sık sorunlara neden oluyor. Karlsruhe Teknoloji Enstitüsü’nden (KIT) Alex Waibel’e göre “Aralar, kekemelikler, ‘uh’ veya ‘hm’ gibi doldurma sesleri mevcut ve ayrıca insanlar birbirleriyle konuşurken gülüyor veya öksürüyor.” Ayrıca, Waibel’in açıkladığı gibi, “Bazı kelimeler belirsiz bir şekilde telaffuz ediliyor. Sonuç olarak, insanlar bile böyle gayri resmi bir diyaloğun tam bir kopyasını oluşturmada sorun yaşıyor. Ancak yapay zeka (AI) bu konuda daha da büyük zorluklar yaşıyor.

Yapay zeka için günlük konuşmalar hala sorunlu

ArXiv tarafından yayınlanan bir ön baskıya göre, Waibel ile çalışan bilim adamları artık günlük konuşmaları insanlardan daha hızlı ve daha iyi aktaran bir yapay zeka geliştirmeyi başardılar. Yeni sistemin temeli, üniversite derslerini Almanca ve İngilizce’den gerçek zamanlı olarak çeviren bir teknolojidir. Yapay zeka bunun için akustik sinyalleri analiz eden ve bunlara sözcükler atayan kodlayıcı-kod çözücü ağları kullanır. Waibel’e göre, “spontane dilin tanınması bu sistemdeki en önemli bileşendir, çünkü hatalar ve gecikmeler hızlı bir şekilde çeviriyi anlaşılmaz hale getirir.”

Doğruluk arttı ve gecikme azaldı

Şimdi KIT bilim insanları sistemi önemli ölçüde daha da geliştirdiler ve hepsinden önemlisi gecikmeyi önemli ölçüde azalttılar. Waibel ve ekibi, belirli kelime kombinasyonlarının olasılığına dayalı bir yaklaşım kullandı ve bunu diğer iki tanıma modülüyle ilişkilendirdi.

Standartlaştırılmış bir testte, yeni konuşma tanıma sistemi, sistemin otomatik olarak yazıya dökmesi gereken yaklaşık 2.000 saatlik telefon görüşmelerinden oluşan bir koleksiyondan alıntılar duydu ve başarılı oldu.