Konuş Bilgisayarım: Ses Kontrolü Kalkıyor

Beklenmeyen paketler kapınızda görünmeye başlarsa, akıllı cihazlarınızdan biriyle bir şeyler bilmek isteyebilirsiniz.

Bu ayın başlarında, Dallas'ta altı yaşında bir çocuk ailesine sordu. Amazon Echo Bir dollhouse için akıllı hoparlör. Ve derhal Amazon'un Siri benzeri yapay asistanı Alexa. birini evlerine sipariş ettim.

Bir San Diego TV haber şovu hikayeyi yakaladı ve haber spikerlerinden biri şöyle yorum yaptığında yanlışlıkla tekrarladı: “Alexa bana bir bebek evi sipariş et” diyerek küçük kızı seviyorum. San Diego daha fazla bebek evi satın almaya çalıştı.

CW6 San Diego’nun Alexa’da tesadüfi bebek evi satın almasıyla ilgili haberi.

{youtube}oI2KLIULjXc{/youtube}

Hikaye, Apple'ın Siri'si veya Microsoft'un Cortana'sı ile konuşmaya çalışan herkese kaba bir şekilde tanıdık gelebilir. Cihazlarımız bizi dinlemekte oldukça başarılı oldu, ancak bu her zaman anladıkları anlamına gelmiyor.

Microsoft araştırmacıları son zamanlarda bunu günümüzün konuşma arayüzleriyle ilgili potansiyel bir sorun olarak belirlediler: zekice şakalar ve dünyaya ait bilgilerle “akıllı” asistanlar olarak pazarlanıyorlar, ancak çoğu zaman sağduyu eksikliği yüzünden bizi sinirlendiriyorlar.


kendi kendine abone olma grafiği


İçinde küçük çalışmaAraştırmacılar, zaman içinde dijital asistanlarıyla konuşmaya devam edenlerin, en düşük beklentileri ile başlayanlar olduğunu buldular.

Bir ses arayüzü aslında ne yapar?

Bir ses arayüzü ile konuşurken, şunları yapması gerekir:

  • Sesinizin sesini “duyun” ve arka plandaki seslerden ayırt edin
  • Her kelimenin nerede başladığını ve bittiğini anlayın, “umm” ve “ahh” larını yok sayarak
  • Her kelimenin sesini sözlükteki bir kelimeyle eşleştirin, varsa doğru olanı bağlamdan seçin. eşsesli sözcükler
  • cümlenin anlamını doğru yorumlayabilecektir
  • isteğinizle eşleşen anlamlı ve kullanışlı bir yanıt oluşturun.

Bunların her biri karmaşık bir teknik zorluktur ve farklı teknoloji şirketleri farklı alanlarda ilerleme kaydetmiştir.

Google Asistan, Google hizmetlerini kullanıyorsanız, Google’ın web hakkındaki verilerden ve kişisel etkinliklerinizden yararlandığından, çok çeşitli isteklere alakalı yanıtlar vermede iyidir.

Amazon Echo, gürültü azaltıcı uzak alan mikrofon dizisi sayesinde isteklerinizi gürültülü bir odadan duymada özellikle iyidir. Tabii ki, Amazon'dan alışveriş yapmakta da iyi olur.

Geçtiğimiz birkaç yıl boyunca, ses arayüzleri sadece stilize edilmiş ve dikkatlice yazılmış komutlardan ziyade günlük veya “doğal” konuşmaları anlamakta çok daha iyi hale geldi. “Avustralya Açık'ta kim oynuyor?” Gibi basit sorgularla başa çıkmada hala daha iyidirler ve “bu yıl ilk kez Avustralya Açıklarında kim oynuyor?” Gibi daha karmaşık taleplerle mücadele etme eğilimindedirler ve takip “finalde yağmur yağacak mı?” gibi sorular.

Bu durum İngilizce dışındaki diller için daha da karışık: Siri, 40'ten daha fazla dil ve lehçeyi desteklerken, şimdiye kadar Alexa sadece İngilizce ve Almanca olarak mevcut. Ancak bu özelliklerin tümü istikrarlı bir şekilde gelişmektedir.

Ses arayüzlerinin kekeme yaptığı yerler

Öyleyse, sesli arayüzler filmde tahmin edildiği gibi yakında tüm teknolojimizi devralacak Onu? Gartner, teknoloji araştırma şirketi, tahmini var gelecek yıl itibariyle, teknoloji ile olan etkileşimlerimizin% 30'inin ses özellikli ara yüzlerle konuşmaları olacağını söyledi.

Ancak ses arayüzleri sınırlıdır ve hepsi daha iyi teknoloji ile çözülemez.

Ses, Spike Jonze'nin filmi Her filminde teknolojiyle etkileşime geçmenin merkezi bir yoludur.

{youtube}ne6p6MfLBxc{/youtube}

Gürültü kirliliği en büyük engellerden biridir. Cihazınız söylediklerinizi etrafınızdaki arka plan gürültüsünden ayırt edebilir mi? Teknoloji, gürültü azaltma, kişiselleştirilmiş ses tanıma ve dudak okuma dahil, bu konuda yardımcı olabilir.

Ama başkaları için yarattığınız arka plan gürültüsünü akıllı cihazınızla konuşarak ne yapacaksınız? Okurken yanınızda ofiste veya bir uçakta oturup, Siri ile sohbet eden bir insan hayal edin ve sesli arayüzlerin neden her zaman sosyal olarak kabul edilebilir olmadığını görebilirsiniz.

Başka bir dizi konu da ses arayüzlerinin zihinsel taleplerinden kaynaklanmaktadır. Ses tabanlı bir sistemi kullanmayı öğrenmek, özellikle de Amazon Echo'da olduğu gibi ekran yoksa bile zor olabilir.

Bir bankayı veya telefon şirketini daha önce aradıysanız, ihtiyacınız olanı beklerken ve karıştırmamaya çalıştığınızda, sentezlenmiş bir sesin dinlenmesinden gelen tüm seçeneklerinizi ortaya çıkaran sefil konsantrasyon ve sıkıntı kombinasyonunu bilirsiniz. yukarı. Geleneksel grafik arayüzler size mevcut seçenekleri göstererek ve seçiminize hızla dokunmanıza izin vererek bu sorunu önler.

Ses komutlarını öğrendikten sonra, bunları kullanmak rahatsız edici olabilir. Araştırmacılar bu ses komutları bulduk Düşünce trenini raydan çıkar bir fare ve klavyeden daha fazlası.

Bu, araç içi ses arabirimleri için özellikle tehlikelidir: Utah Üniversitesi'nden yapılan bir çift çalışma, sürücülerin 27 saniyeye kadar dikkati dağılmış Ses komutlarını kullandıktan sonra.

Sürücü dikkatini dağıtma konusunda Trafik Güvenliği araştırması için Utah / AAA Vakfı.

{vimeo}108281698{/vimeo}

Sesini bulmak?

Bu nedenle, ses arayüzlerinin tamamen devralma olasılığı yoktur, ancak yaşamlarımızda yararlı nişler bulacaklardır. Zaten teknolojide geliştiklerinde daha az rahatsız edici olacakları arabalarda çok yaygınlar.

Mutfakta, Alexa'dan bir tarif aracılığıyla seninle konuşmasını ya da ellerin meşguldürken alışveriş listenizi güncellemesini isteyebilirsin. Sanal ve artırılmış gerçeklikte, ses arayüzleri, ellerinizi hiç göremediğinizde sistemi kontrol etmenize izin verebilir.

Dil öğreniminde, telaffuz pratiği için kullanılabilirler. En önemlisi, ses arayüzleri, engelli durumlarının üstesinden gelmek için motor bozuklukları, RSI veya disleksi olan kullanıcılara yardımcı olmaktadır.

Ses arayüzleri uzun zamandır beklenen bir teknolojidir ve zamanlarının sonunda geldiğini düşünmek için iyi sebepler var. Sadece hatırladıkları kadar zeki olamayabileceklerini unutmayın. Ayrıca çocuklarınız varsa ses alımlarına bir PIN kodu koymak isteyebilirsiniz.

Konuşma

Yazar hakkında

Fraser Allison, İnsan-Bilgisayar Etkileşimi Doktora Adayı, Melbourne Üniversitesi

Bu yazı orijinalinde Konuşma. Okumak Orijinal makale.

İlgili Öğeler

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market ve Amazon