Logo Spiria

Alexa et le progrès des technologies de conversation automatisée

3 mai 2017.
Voici une autre tendance lourde qu’on avait prédit pour 2017 et qui semble bien s’avérer : celle des assistants personnels. Loin des débuts de Siri d’Apple en 2011, la technologie derrière ce type de produit/service a en effet énormément progressé et le marché s’est grandement diversifié.

Voici Alexa…

Alexa, le service vocal de l’assistant personnel Echo d’Amazon, a pris beaucoup de galon dans les dernières années ; Amazon a en effet vendu environ 10 millions de systèmes Echo-Alexa. De prime abord, ce chiffre peut paraître modeste lorsque comparé à ceux de Siri ou de l’assistant Google, étant donné que ces derniers sont livrés par défaut avec des centaines de milliers de téléphones intelligents… Mais Amazon a de grandes ambitions pour Alexa : le géant affirme clairement souhaiter que le service devienne LE plus utilisé parmi les assistants vocaux. Et disons que l’entreprise a également les moyens et les ressources pour le réaliser. Comment ? Entre autres, à travers la plateforme de développement d’Alexa, Amazon Lex.

… et son frère Lex

En mode « aperçu » depuis la fin de 2016, Lex vient d’être rendu disponible à tous les développeurs qui voudraient intégrer la technologie de conversation automatisée (pour faire des « chatbots ») à leurs propres applications.

Le directeur technique (CTO) d’Amazon, Werner Vogels, a expliqué que l'outil Lex connaissait présentement « une accélération massive. Le truc cool d'avoir le service qui tourne sur le cloud, plutôt que dans votre centre de données ou encore sur votre propre ordinateur, c’est la possibilité d’améliorer Lex en continu, au travers l’expérience des millions de personnes qui s’en servent. »

Lex devient même un modèle d’affaires supplémentaire pour Amazon, qui compte facturer aux développeurs en fonction du nombre de messages vocaux ou textuels envoyés à la plateforme par les applications. La plus grande source de revenus pourrait toutefois plutôt provenir d’applications de « chatbots » reliées au commerce électronique, un phénomène relativement nouveau mais en forte croissance.

Un langage de plus en plus « naturel »

Un des autres avantages d’Alexa, c’est sa capacité à s’adapter de plus en plus selon le contexte des « conversations ». Les développeurs d’Amazon mettent en effet à profit les possibilités du langage normalisé SSML, ou Speech Synthesis Markup Language, et incluent de nouvelles possibilités de communication qui dépassent la simple utilisation du langage.

Dans un futur proche, Alexa pourra chuchoter, remplacer un mot faisant partie de son « script » par un autre, dire des gros mots et même « bipper » ceux-ci, modifier la cadence et le volume pendant une conversation afin de mettre l’accent sur une affirmation en particulier, effectuer des pauses et changer son intonation. Les geeks curieux peuvent même tester ces nouvelles fonctions dans un jeu quiz à bâtir.

Une dernière innovation pour donner « encore plus de personnalité » à Alexa, qui fait, semble-t-il, souvent des blagues et se met même à chanter de temps à autre : l’introduction de nouveaux « speechcons » pour des marchés autres que celui des États-Unis.

Les speechcons sont des expressions et des locutions spéciales qu’un assistant vocal sait comment prononcer d’une manière plus expressive, afin de rendre ses interactions avec les humains plus réalistes et surtout plus attachantes. Alexa en « connaît » déjà plusieurs en anglais, par exemple « Yay! », qui doit être prononcé avec un certain enthousiasme ainsi qu’une insistance sur la finale, ou encore « Abracadabra », dont l’accent tonique n’est pas nécessairement intuitif.

Alexa sera donc bientôt en mesure d’ajouter des expressions régionales pour ses utilisateurs britanniques, par exemple l’interjection « Blimey! ».  Certains speechcons ont de plus été ajoutés, pour la première fois, dans une langue étrangère. Et ce n’est pas une langue asiatique qui a été sélectionnée, mais l’allemand, un langage particulièrement truffé d’expressions idiomatiques du genre « Na und? », qu’on pourrait traduire par « Et puis après? » et qu’il est très important de prononcer avec un ton moitié défiant, moitié dépité.

Que ce soit à travers Alexa ou un autre produit, il ne faudrait certainement pas sous-estimer l’importance des technologies vocales dans l’écosystème informatique des années à venir. Selon Gene Munster, analyste en chef chez Loup Ventures, « la voix jouera un rôle majeur dans l’interface des ordinateurs de demain… Et quiconque possèdera la voix sera également maître du commerce. »