Makine dili: nasıl Siri sesinizi?
Makradar Teknolojinin / / December 19, 2019
Google, Apple, Microsoft ve hatta Amazon aktif olarak ses hizmetlerini geliştiriyorlar. Taze aynı Siri, yalnızca yeni işlevler ve... sesli iOS 7'de olduğu pişmiş. Bu süreç ne kadar merak ediyor musun? Bilgisayarlar konuşma öğretilir gibi? bu gerçek sanat.
senin aktör - her biri için Siri dile getiriyor. o eklemlenme rolünü tamamladığında, iş sadece erkek sesi yolculuğuna devam ediyor... başlamıştır. Bu yolculuğun hikayesi, insan ve robot her iki - on yıl önce gerçekleştirilen edilemedi en karmaşık teknolojik işlemlerden biri.
Let sesi Nüans tasarım ve geliştirme müdürü hakkında bilgi almak, bu konuşma konuşma tanıma ve metin ile ilgili dünyanın en büyük bağımsız şirketlerinden biridir. Brant Ward (J. Bir besteci olarak kullanılan Brant Ward), synthesizer için dize kuartet, partiyi oluşturmak ve şimdi sentetik sesler kullanarak oluştururken onun. O on yıldan fazladır Silikon Vadisi'nde konuşma sentezi sanayide çalışıyor.
- metin okuma çok rekabetçi bir sanayi ve çalışanlarının çok gizli olduğunu. Dünyada olsa ve Nuance için Siri sesini yaratır inanmaktadır Ward ve çalışma arkadaşı David Vasquez (David Vazquez) doğrudan cevap kaçının. Yine de, en azından genel ifadelerle açıklamak için kabul nasıl inanılmaz bir makinedir oy oluşturma işlemi.
Tabii, demek articulate gerek ve sözlükten her kelimeyi yazmak için. sizin bülteni herhangi haberleri okumak veya internette senin için birşey edilmelidir uygulaması gelince, sadece sözlükte her kelimenin konuşmak zorundadır.
Bunlar sesbirimlerinin birçok farklı kombinasyonları içerirler edilir - önerilerin çoğu "zenginlik fonetik" konulu seçilir. "Biz ne kadar çok veri, daha gerçekçi sonuç gerçektir olacaktır" - Ward diyor.
Metin canlı ses aktör (birkaç ay sürebilir zahmetli bir işlem) kaydedildikten sonra çok sert çalışma başlayacak. Kelimeler ve cümleler büyük veritabanında kategorilere bölünerek ve kaydedilir, analiz edilir. Gerek kendi dilsel yazılımı kullanmak olarak bu karmaşık çalışmada, adanmış dilbilimciler bir ekip içeriyordu.
Bütün bu yapıldığında, Nüans birim konuşma metni bit kelime ve ifadeler aktör olabilir o oluşturur çevirmek için Teknik olarak sesidir çünkü ben aslında bile cikmaz ama aktörün konuşma çok benzer sesler aktör.
Süreç konuşan baygın. Bu sürecin nasıl oluştuğu düşünmeden bunu: durum hangi dil, hangi ilişkiler sesbirimler arasında inşa ve benzeri edilir - kolayca ve etkili bir şekilde karmaşık fikirlerini ifade etme ve duygular. Ancak bilgisayar insan seslerini aldı bu sırayla, bütün bu faktörler dikkate alınmalıdır. dilbilim biri profesörü olarak görevidir "Titanik".
Sen düşünmemeli: "Ben bir bilgisayara konuşuyorum." Genellikle bunu düşünmek gerekmez.
"Bir canlı yaratık sanki Çocuklarım Siri ile etkileşim,... Onlar fark hissetmiyorum," - Ward söylüyor.
İnsanlar gibi - Şu ana kadar ve insanlar ve robotlar arasındaki dostluğa. Birçok kişi Siri konuşmacının duygusal durumunu tanıyabilir eğer hoşuna ve bir şekilde (bir yatıştırıcı ses modu, örneğin) buna tepki olacaktır. Imagine - ahlaken kafana pat olan robot, konuşmak için. Belki, Nuance zaten düşünüyor ...