В среду Apple опубликовала три статьи о создании новых искусственных голосов для Siri. В них также затронуты другие темы, о которых будет сказано на конференции Interspeech 2017 в Стокгольме на этой неделе.
Вы можете изучить следующие статьи сами:
- Deep Learning for Siri’s Voice — рассказывает о том, как сети глубокой плотности используются для синтеза гибридных единиц
- Inverse Text Normalization — с точки зрения маркировки
- Improving Neural Network Acoustic Models — с использованием пропускной способности и языков.
Если вам трудно разобраться в технических данных или вообще понять язык, которым написаны эти статьи, вы не один такой.
Обычно документы Apple для разработчиков вполне понятные, но читая эти три чувствуешь себя глупым.
Среди других улучшений iOS 11 будет и более умный помощник Siri с новым голосом.
Теперь персональный помощник Apple будет разговаривать не фразами и словами, записанными актёрами, а искусственным женским и мужским голосом, которые были созданы путём программирования. Такая технология намного сложнее, но она предоставляет много новых возможностей.
Например, новые голоса Siri смогут учиться как искусственный интеллект и менять интонацию, тональность, ударения и скорость речи в реальном времени, основываясь на контекст разговора. Статья под названием «Deep Learning for Siri’s Voice» рассказывает о разных техниках обучения Siri на iOS 11.
Согласно вступлению:
Siri – персональный помощник, который разговаривает с помощью синтеза речи. На iOS 10 и iOS 11 Siri может обучаться. Голоса станут более естественными, приятными и смогут передавать характер Siri.
Новые статьи были опубликованы на блоге Apple Machine Learning Journal с целью рассказать о работе компании в области машинного обучения, искусственного интеллекта и т.п. Это был некий ответ на критику о том, что компания не могла нанимать специалистов в этих областях, т.к. всё равно не разрешила бы им публиковать свои работы.
В июле была опубликована статья об улучшении реализма искусственных изображений, и в ней также говорилось о новом методе преобразования реальных данных.
Комментарии