加入「WaveNet」技術,Google Assistant的聲音聽起會變得更自然,「WaveNet」是Google分公司DeepMind技術,致力於一種新的文字轉語音(或是語音合成技術)。
跟傳統Concatenative TTS使用單聲道腳本進行龐大的、預先錄好的語音資料庫,或是Parametric TTS使用電腦模擬聲音的做法不同,WaveNet乃藉由使用每秒16000個樣本來建立一個個波形。
WaveNet運用大量語言樣本的數據集,並經過超過12個月的訓練來識別哪一種聲調之後要接著用哪一種聲調,以及判斷哪一種聲波形最自然,大家可以從以下的wav檔範例試聽使用這項技術的差點。
未使用WaveNet前,Google Assistant聽起來比較像機器人:
使用WaveNet後,Google Assistant聽起來比較真人,語調變得自然:
WaveNet會先在美式英語與日本語系上線,其它語系接著會陸續支援。