Catégories
Astuces et Design

Tests d'utilisabilité pour le contenu vocal – une liste à part

C'est un moment important pour être dans la conception vocale. Beaucoup d'entre nous se tournent vers les assistants vocaux en ces temps, que ce soit pour le confort, les loisirs ou pour rester informés. Alors que l'intérêt pour les interfaces pilotées par la voix continue d'atteindre de nouveaux sommets à travers le monde, il en sera de même des attentes des utilisateurs et des meilleures pratiques qui guident leur conception.

L'article continue ci-dessous

Les interfaces vocales (également appelées interfaces utilisateur vocales ou VUI) réinventent la façon dont nous abordons, évaluons et interagissons avec les interfaces utilisateur. L'impact des efforts conscients pour réduire les contacts étroits entre les personnes continuera d'augmenter les attentes des utilisateurs quant à la disponibilité d'un composant vocal sur tous les appareils, qu'il s'agisse d'une icône de microphone indiquant la recherche vocale ou d'un assistant vocal à part entière attendant patiemment les ailes pour une invocation.

Mais les interfaces vocales présentent des défis et des surprises inhérents. Dans ce domaine relativement nouveau de la conception, les rebondissements intrinsèques du langage parlé peuvent rendre les choses difficiles, même pour les interfaces vocales les plus soigneusement étudiées. Après tout, la langue parlée est jonchée de charges (au sens linguistique d'énoncés comme hmm et euh), les hésitations et les pauses, ainsi que d'autres interruptions et troubles de la parole qui posent des problèmes déroutants aux concepteurs et aux exécutants.

Une fois que vous avez créé une interface vocale qui introduit des informations ou autorise les transactions de manière riche pour les utilisateurs de langue parlée, la partie facile est terminée. Néanmoins, les interfaces vocales font également face à des défis uniques en matière de tests d'utilisabilité et d'évaluation robuste de votre résultat final. Mais il y a aussi des avantages, notamment en matière d'accessibilité et de stratégie de contenu cross-canal. Le fait que le contenu basé sur la voix se trouve à l'extrême opposé du spectre du site Web traditionnel lui confère un avantage supplémentaire: c'est un moyen efficace d'analyser et de tester à quel point le contenu est indépendant du canal.

Le dilemme de l'utilisabilité de la voix # section2

Il y a plusieurs années, j'ai dirigé une équipe talentueuse chez Acquia Labs pour concevoir et construire une interface vocale pour les services numériques en Géorgie appelée Ask GeorgiaGov, qui a permis aux citoyens de l'État de Géorgie d'accéder à du contenu sur des tâches civiques clés, comme s'inscrire pour voter, renouveler un permis de conduire et porter plainte contre les entreprises. Basé sur une copie tirée directement de la section des questions fréquemment posées du site Web Georgia.gov, il s'agissait de la première interface Amazon Alexa intégrée au système de gestion de contenu Drupal jamais conçue pour la consommation publique. Construit par mon ancien collègue Chris Hamper, il offrait également une multitude de fonctionnalités impressionnantes, comme permettre aux utilisateurs de demander le numéro de téléphone d'agences gouvernementales individuelles pour chaque requête sur un sujet.

Concevoir et créer des expériences Web pour le secteur public est une entreprise particulièrement difficile en raison des exigences entourant l'accessibilité et des problèmes budgétaires fréquents. Par nécessité, les gouvernements doivent être exigeants et méthodiques non seulement dans la manière dont ils engagent leurs citoyens et dépensent de l'argent pour des projets, mais aussi dans la façon dont ils incorporent les nouvelles technologies dans le mélange. Pour la plupart des entités gouvernementales, la voix est un monde complètement différent, avec de nombreux pièges potentiels.

Au début du projet, l'équipe de Digital Services Georgia, dirigée par Nikhil Deshpande, ont exprimé leur besoin le plus important: un modèle de contenu unique pour l'ensemble de leur contenu, quel que soit le canal de diffusion, car ils ne disposaient que de ressources pour conserver un rendu unique de chaque élément de contenu. Malgré ce défi éditorial, la Géorgie a vu Alexa comme une opportunité passionnante d'ouvrir de nouvelles portes à des solutions accessibles pour les citoyens handicapés. Et enfin, comme il y avait relativement peu d'exemples de tests d'utilisabilité de la voix à l'époque, nous savions que nous devions apprendre à la volée et expérimenter pour trouver la bonne solution.

Finalement, nous avons découvert que toutes les approches traditionnelles des tests d'utilisabilité que nous avions exécutées pour d'autres projets n'étaient pas adaptées aux problèmes uniques de utilisabilité vocale. Et ce n'était que le début de nos problèmes.

Comment les interfaces vocales améliorent les résultats d'accessibilité # section3

Toute discussion sur l'utilisabilité de la voix doit tenir compte de certains des utilisateurs d'interface vocale les plus expérimentés: les personnes qui utilisent des appareils et accessoires fonctionnels. Après tout, l'accessibilité a longtemps été un bastion d'expériences Web, mais elle n'est devenue récemment que le centre d'intérêt de ceux qui mettent en œuvre des interfaces vocales. Dans un monde où les afficheurs braille et les lecteurs d'écran rafraîchissants valorisent avant tout le rendu de contenu Web en synthèse vocale, l'interface vocale semble être une anomalie. Mais en fait, le potentiel passionnant d'Amazon Alexa pour les citoyens handicapés représentait l'une des principales motivations de l'intérêt de la Géorgie à rendre son contenu disponible via un assistant vocal.

Des questions concernant l'accessibilité avec la voix sont apparues ces dernières années en raison des avantages perçus de l'expérience utilisateur que les interfaces vocales peuvent offrir par rapport aux appareils et accessoires fonctionnels plus établis. Étant donné que les lecteurs d'écran ne font aucune exception lorsqu'ils récitent le contenu d'une page, ils peuvent parfois présenter des informations superflues et forcer l'utilisateur à attendre plus longtemps qu'il ne le souhaite. De plus, avec un schéma de contenu efficace, il peut souvent arriver que les interfaces vocales facilitent les interactions pointues avec le contenu à un niveau plus granulaire que la page elle-même.

Bien qu’il puisse être difficile de convaincre même les clients les plus tournés vers l’avenir de la valeur de l’accessibilité, la Géorgie a été non seulement un précurseur, mais aussi un ardent défenseur de l’accessibilité du contenu au-delà du Web. L'État a été parmi les premières juridictions à offrir une ligne téléphonique directe de synthèse vocale (TTS) qui lit les pages Web à haute voix. Après tout, les gouvernements des États doivent servir tout les citoyens également – pas de si, et de ou. Et bien qu'il ne s'agisse que de balbutiements, je vois des assistants vocaux devenir de nouveaux canaux, et peut-être des canaux plus efficaces, grâce auxquels les utilisateurs handicapés peuvent accéder au contenu dont ils ont besoin.

Gestion du contenu destiné aux canaux discrets # section4

Alors que la voix peut améliorer l'accessibilité du contenu, il est rare que le Web et la voix soient les seuls canaux par lesquels nous devons divulguer des informations. Pour cette raison, un conseil que je donne souvent aux stratèges de contenu et aux architectes des organisations intéressées par la poursuite de contenu axé sur la voix est de ne jamais penser le contenu vocal de manière isolée. Le cloisonnement est la même approche erronée qui a conduit à des applications mobiles et à d'autres expériences discrètes de fourniture de contenu orphelin ou obsolète à un utilisateur s'attendant à ce que tout le contenu du site Web soit à jour et accessible via d'autres canaux également.

Après tout, nous nous sommes formés depuis de nombreuses années pour penser au contenu dans le contexte Web uniquement plutôt que sur tous les canaux. Nos hypothèses étroites sur les liens, les téléchargements de fichiers, les images et les autres marginaux et mélanges sur le Web sont tous des aspects du contenu Web qui se traduisent mal dans le contexte conversationnel – et en particulier le contexte vocal. De plus en plus, nous devons tous nous préoccuper d'un stratégie de contenu omnicanal qui chevauche tous ces canaux qui existent aujourd'hui et d'autres qui apparaîtront sans aucun doute à l'horizon.

Avec les avantages du contenu structuré dans Drupal 7, Georgia.gov avait déjà un modèle de contenu susceptible d'interlocution sous la forme de Questions fréquemment posées (FAQ). Bien que les formats de questions et réponses soient pratiques pour les assistants vocaux, car les requêtes de contenu ont tendance à prendre la forme de questions, les réponses renvoyées doivent également être optimisées pour la voix.

Pour Georgia.gov, la nécessité de conserver un rendu unique de tous les contenus sur tous les canaux nous a conduit à audit de contenu conversationnel, dans lequel nous lisons à haute voix toutes les pages de la FAQ, nous mettant à la place d'un utilisateur vocal, et identifions les principales différences entre la façon dont un utilisateur interpréterait la forme écrite et comment il analyserait la forme parlée de ce même contenu. Après quelques discussions avec l'équipe éditoriale de Georgia, nous avons choisi de limiter les appels à l'action (par exemple, "En savoir plus"), les liens manquant de contexte clair dans le texte environnant et d'autres situations déroutantes pour les utilisateurs vocaux qui ne peuvent pas visualiser le contenu qu'ils écoutent. .

Voici un tableau contenant des exemples de la façon dont nous avons converti certains textes des pages FAQ en homologues plus appropriés pour la voix. La lecture de chaque phrase à voix haute, une par une, nous a aidés à identifier les cas où les utilisateurs pouvaient se gratter la tête et dire «Hein?» dans un contexte vocal.

Avant Après
Apprendre à changer votre nom sur votre carte de sécurité sociale. La Social Security Administration peut vous aider changer votre nom sur votre carte de sécurité sociale.
Vous pouvez recevoir des paiements par carte de débit ou par dépôt direct. En savoir plus sur les paiements. Vous pouvez recevoir des paiements soit par carte de débit, soit par dépôt direct.
En savoir plus à ce sujet. En Géorgie, le Registre de soutien aux familles tire généralement les paiements directement de votre chèque de paie. Cependant, vous pouvez envoyer vos propres paiements en ligne via votre compte bancaire, votre carte de crédit ou Western Union. Vous pouvez également envoyer vos paiements par courrier à l'adresse indiquée dans votre ordonnance du tribunal.

Dans des domaines tels que la stratégie de contenu et la gouvernance du contenu, les audits de contenu ont longtemps été essentiels pour comprendre l'image complète de votre contenu, mais cela ne s'arrête pas là. Des audits de contenu réussis peuvent couvrir toute la gamme, des vérifications automatisées du contenu orphelin ou des articles trop verbeux aux analyses plus qualitatives de la façon dont le contenu adhère à une voix de marque spécifique ou à certaines normes de conception. Pour une stratégie de contenu vraiment préparée pour les chaînes ici et à venir, une compréhension globale de la façon dont les utilisateurs interagiront avec votre contenu dans diverses situations est aujourd'hui une exigence de base.

Les autres interfaces conversationnelles ont plus de facilité # section5

Le langage parlé est intrinsèquement difficile. Même les orateurs les plus doués peuvent avoir des problèmes avec cela. Il est jonché d'erreurs, de démarrages et d'arrêts, d'interruptions, d'hésitations et d'une gamme vertigineuse d'autres transgressions uniquement humaines. Le mot écrit, car il est instantanément engagé dans un enregistrement essentiellement permanent, est apprivoisé, figé et soigneusement examiné en comparaison.

Lorsque nous parlons d'interfaces conversationnelles, nous devons faire une distinction claire entre la gamme d'expériences utilisateur langue écrite plutôt que langue parlée. Comme nous le savons par la solidité relative de la langue et de la littérature écrites par rapport à la fugacité relative de la langue parlée et des traditions orales, à bien des égards, les deux ne pourraient pas être plus différents l'un de l'autre. Les implications pour les concepteurs sont importantes parce que le langage parlé, du point de vue de l'utilisateur, n'a pas d'équivalent graphique auquel ceux qui se grattent la tête peuvent facilement se référer. Nous avons affaire à la parole et auriculaire les opportunités, pas les pixels, le texte d'aide écrit ou les opportunités visuelles.

Pourquoi les interfaces conversationnelles écrites sont plus faciles à évaluer # section6

L'un des privilèges dont bénéficient les chatbots et les textbots sur les interfaces vocales est le fait que de par leur conception, ils ne peuvent pas masquer les étapes précédentes que les utilisateurs ont suivies. Tout utilisateur d'interface conversationnelle travaillant sur le support écrit a accès à son historique précédent d'interactions, qui peut s'étendre sur plusieurs jours, semaines ou mois: ce que l'on appelle faire défiler. Un passager qui communique avec une compagnie aérienne via Facebook Messenger, par exemple, sait qu'il peut simplement faire défiler vers le haut dans l'historique du chat pour confirmer qu'il a déjà fourni à la compagnie son numéro de billet électronique ou les informations de son compte de voyageur fréquent.

Cela a des implications démesurées pour l'architecture de l'information et la conversation Orientation. Étant donné que les utilisateurs de chatbot peuvent consulter leur propre enregistrement écrit, il est beaucoup plus difficile pour les choses de tourner complètement de travers quand ils font un mouvement qu'ils n'avaient pas l'intention. Le souvenir est beaucoup plus difficile lorsque vous devez vous souvenir de ce que vous avez dit il y a quelques minutes du haut de votre tête plutôt que de faire défiler les informations que vous avez fournies il y a quelques heures ou semaines. Une interface de chatbot efficace peut, par exemple, permettre à un utilisateur de revenir à un endroit spécifique beaucoup plus tôt dans l'historique d'une conversation.Une interface de chatbot efficace peut, par exemple, permettre à un utilisateur de revenir à un endroit spécifique beaucoup plus tôt dans l'histoire d'une conversation. Les interfaces vocales qui vivent perpétuellement dans le moment n'ont pas un tel luxe.

L'eye tracking ne fonctionne que pour les composants visuels # section7

Dans de nombreux cas, ceux qui travaillent avec des chatbots et des bots de messagerie (en particulier ceux qui exploitent des messages texte ou d'autres services de messagerie comme Facebook Messenger, Slack ou WhatsApp) ont le privilège unique de bénéficier d'un visuel composant. Certaines interfaces conversationnelles insèrent désormais d'autres éléments dans le flux conversationnel entre une machine et une personne, tels que des formulaires conversationnels intégrés (comme le formulaire conversationnel de SPACE10) qui permettent aux utilisateurs d'entrer des entrées riches ou de sélectionner parmi une gamme de réponses possibles.

Le succès de l'eye tracking dans des scénarios de tests d'utilisabilité plus traditionnels met en évidence sa pertinence pour les interfaces visuelles telles que les sites Web, les applications mobiles et autres. Cependant, du point de vue de l'évaluation d'interfaces vocales entièrement auditives, l'eye tracking ne sert que le but limité (mais toujours intéressant du point de vue de la recherche) d'évaluer où le sujet de test regarde tout en parlant avec un interlocuteur invisible – et non s'il est capable pour utiliser l'interface avec succès. En effet, le suivi des yeux n'est qu'une option viable pour les interfaces vocales qui ont un composant visuel, comme Amazon Echo Show.

Le sondage à haute voix et simultané interrompt le flux conversationnel # section8

Une approche bien usée pour les tests d'utilisabilité est réfléchir à haute voix, qui permet aux utilisateurs travaillant avec des interfaces de présenter verbalement leurs impressions qualitatives fréquentes des interfaces tout en interagissant avec l'expérience utilisateur en question. Associé à l'eye tracking, think-aloud ajoute une dimension considérable à un test de convivialité pour les interfaces visuelles telles que les sites Web et les applications Web, ainsi que d'autres appareils à orientation visuelle ou physique.

Un autre est sondage simultané (CP). Le sondage implique l'utilisation de questions pour recueillir des informations sur l'interface auprès des utilisateurs, et Ergonomie.gov décrit deux types: concurrent, dans lequel le chercheur pose des questions lors des interactions, et rétrospective, dans lequel les questions ne viennent qu'une fois l'interaction terminée.

Les interfaces conversationnelles qui utilisent la langue écrite plutôt que la langue parlée peuvent toujours être bien adaptées aux approches de sondage à haute voix et simultanées, en particulier pour les composants de l'interface qui nécessitent une saisie manuelle, comme les formes conversationnelles et d'autres éléments d'interface utilisateur traditionnels entrecoupés tout au long de la conversation elle-même .

Mais pour les interfaces vocales, la réflexion à haute voix et le sondage simultané sont des approches très discutables et peuvent catalyser une variété de conséquences inattendues, y compris les invocations accidentelles de mots déclencheurs (comme Alexa malentendu «sélectionné» comme «Alexa») et l'introduction de mauvaises données (telles que comme transcription vocale enregistrant à la fois l'interface vocale et le sujet de test). Après tout, dans un hypothétique test de réflexion à voix haute ou CP d'une interface vocale, l'utilisateur serait responsable de la conversation avec le chatbot tout en offrant simultanément ses impressions à l'évaluateur supervisant le test.

Tests d'utilisation de la voix avec sondage rétrospectif # section9

Sondage rétrospectif (RP), une approche moins connue des tests d'utilisabilité, est rarement vue dans les tests d'utilisabilité du Web en raison de sa principale faiblesse: le fait que nous ayons des souvenirs horribles et que nous nous souvenions rarement de ce qui s'est produit quelques instants plus tôt avec tout ce qui se rapproche de la précision totale. (Cela pourrait expliquer pourquoi le backscroll a rejoint le panthéon de la tenue de documents rigide actuellement occupé par le cunéiforme, la presse à imprimer et d'autres moyens de concrétiser l'information.)

Pour les utilisateurs d'assistants vocaux qui n'ont pas d'historique de chat défilant, le sondage rétrospectif permet aux sujets d'inclure de faux souvenirs dans leurs évaluations ou de mal interpréter la conclusion de leurs conversations. Cela dit, le sondage rétrospectif permet au participant de prendre un certain temps pour former ses impressions d'une interface plutôt que de distribuer des informations incrémentielles dans un flux de conscience, comme cela se produirait plus probablement lors d'un sondage simultané.

Ce qui rend les tests d'utilisation de la voix uniques # section10

Les tests d'utilisabilité vocale ont plusieurs caractéristiques uniques qui les distinguent des tests d'utilisabilité Web ou d'autres tests d'utilisabilité conversationnelle, mais certains des mêmes principes unifient les interfaces visuelles et leurs homologues sonores. Comme toujours, «tester tôt, tester souvent» est un mantra qui s'applique ici, car plus tôt vous pourrez commencer à tester, plus vos résultats seront solides. Avoir une personne pour administrer un test et une autre pour transcrire les résultats ou surveiller les signes de problèmes est également une meilleure pratique efficace dans des contextes au-delà de la simple utilisation de la voix.

Les interférences dues à une mauvaise insonorisation ou à des perturbations externes peuvent faire dérailler un test d'utilisation de la voix avant même qu'il ne commence. De nombreuses grandes organisations disposeront de salles insonorisées ou de studios d'enregistrement pour les chercheurs en utilisation vocale. Pour la grande majorité des autres, une pièce essentiellement silencieuse suffira, bien qu'un silence absolu soit optimal. En outre, de nombreux sujets, même ceux qui connaissent bien les tests d'utilisation du Web, peuvent ne pas être habitués aux tests d'utilisation de la voix dans lesquels de longues périodes de silence sont la norme pour établir une base de référence pour les données.

Comment nous avons utilisé le sondage rétrospectif pour tester Ask GeorgiaGov # section11

Pour Ask GeorgiaGov, nous avons utilisé l'approche de sondage rétrospective presque exclusivement pour rassembler un éventail d'idées sur la façon dont nos utilisateurs interagissaient avec le contenu à commande vocale. Nous nous sommes efforcés d'évaluer les interactions avec l'interface de manière précoce et diachronique. Dans le processus, nous avons demandé à chacun de nos sujets d'effectuer deux tâches distinctes qui les obligeraient à parcourir l'intégralité de l'interface en posant des questions (en effectuant une recherche), en explorant d'autres questions et en demandant le numéro de téléphone d'une agence liée . Bien que ce soit une question importante pour tout utilisateur travaillant avec une interface visuelle, la focalisation unidirectionnelle des flux d'interface vocale, en revanche, réduit la probabilité de longs détours accidentels.

Voici quelques exemples de scénarios:

Vous avez une licence commerciale en Géorgie, mais vous ne savez pas si vous devez vous inscrire sur une base annuelle. Parlez avec Alexa pour trouver les informations dont vous avez besoin. À la fin, demandez un numéro de téléphone pour plus d'informations.

Vous venez d’emménager en Géorgie et vous savez que vous devez transférer votre permis de conduire, mais vous ne savez pas quoi faire. Parlez avec Alexa pour trouver les informations dont vous avez besoin. À la fin, demandez un numéro de téléphone pour plus d'informations.

Nous avons également paralysé les utilisateurs avec des questions après la fin du test pour en savoir plus sur leurs impressions grâce à un sondage rétrospectif:

  • «Sur une échelle de 1 à 5, selon le scénario, les informations que vous avez reçues vous ont-elles été utiles? Pourquoi ou pourquoi pas?"
  • «Sur une échelle de 1 à 5, sur la base du scénario, le contenu présenté était-il clair et facile à suivre? Pourquoi ou pourquoi pas?"
  • "Quelle est la réponse à la question que vous étiez chargé de poser?"

Étant donné que les gouvernements des États traitent également régulièrement les questions des citoyens concernant des problèmes potentiellement traumatisants tels que le divorce et le harcèlement sexuel, nous avons également offert aux participants le choix de se retirer de certaines catégories de tâches.

Bien que cette procédure de test ait donné des résultats convaincants qui indiquaient que notre interface vocale fonctionnait au niveau requis malgré sa nature expérimentale, nous avons également rencontré des défis considérables au cours du processus de test d'utilisabilité. La restauration d'Amazon Alexa à son état initial et le dépannage des problèmes à la volée se sont révélés difficiles pendant les étapes initiales de la mise en œuvre, lorsque les bogues étaient encore courants.

En fin de compte, nous avons constaté que bon nombre des mêmes leçons qui s'appliquent à des exemples plus riches de tests d'utilisabilité étaient également pertinentes pour Ask GeorgiaGov: l'importance de tester tôt et de tester souvent, la nécessité d'une transcription fidèle mais efficace et la capacité de rétention surprenante de bugs lors de l'intégration de technologies disparates. Malgré les nombreuses similitudes de Ask GeorgiaGov avec d'autres implémentations d'interface en termes de dette technique et le rôle des tests d'utilisabilité, nous avons été ravis d'entendre de vrais Géorgiens dont l'engagement avec leur gouvernement d'État ne pouvait pas être plus différent qu'auparavant.

Beaucoup d'entre nous peuvent être en train de créer des interfaces pour le contenu vocal afin d'expérimenter de nouveaux canaux ou de créer pour les personnes handicapées et les nouvelles personnes sur le Web. Aujourd'hui, ils sont indispensables pour beaucoup d'autres, d'autant plus que les pratiques de distanciation sociale continuent de s'imposer dans le monde entier. Néanmoins, il est essentiel de garder à l'esprit que la voix ne devrait être qu'un élément d'une stratégie agnostique pour les canaux équipée pour un contenu arraché à ses contextes habituels. Construire des expériences de contenu vocales utilisables peut nous apprendre beaucoup sur la façon dont nous devons envisager notre milieu de contenu et son avenir en premier lieu.

Il est révolu le temps où nous pouvions écrire une page en HTML et l'appeler un jour; le contenu doit maintenant être restitué par le biais de la parole synthétisée, de superpositions de réalité augmentée, de l'affichage numérique et d'autres environnements où les utilisateurs ne toucheront même jamais un ordinateur personnel. En nous concentrant d'abord et avant tout sur le contenu structuré en vue de dépasser nos préjugés sur le Web dans le développement de notre contenu pour la voix et les autres, nous pouvons mieux garantir l'efficacité de notre contenu sur n'importe quel appareil et dans n'importe quel facteur de forme.

Huit mois après avoir terminé la construction d'Ask GeorgiaGov en 2017, nous avons mené une rétrospective pour inspecter les billes amassées au cours de la dernière année. Les résultats ont été frappants. L'immatriculation des véhicules, les permis de conduire et la taxe de vente d'État constituaient les sujets les plus recherchés. 79,2% de toutes les interactions ont réussi, une réalisation pour l'une des premières compétences Alexa axées sur le contenu en production, et 71,2% de toutes les interactions ont conduit à l'émission d'un numéro de téléphone que les utilisateurs pouvaient appeler pour plus d'informations.

Mais au fond des journaux que nous avons mis en place pour la commodité de l'équipe de Géorgie, nous avons trouvé un certain nombre d'erreurs 404 Introuvables perplexes liées à un terme de recherche qui a été enregistré à maintes reprises sous le nom de «Lawson». Après avoir creusé et consulté les Géorgiens indigènes dans la salle, nous avons découvert que l'une de nos chères utilisatrices avec un traîneau particulièrement fort prononçait à plusieurs reprises «licence» dans son dialecte natal en vain.

Comme le souligne cette anecdote, tout comme aucune expérience utilisateur ne peut être vraiment parfaite pour tout le monde, le contenu vocal est un environnement où les imperfections peuvent mettre en évidence des considérations que nous avons manquées dans le développement de contenu cross-canal. Et tout comme nous avons beaucoup à apprendre en ce qui concerne les nouvelles formes que le contenu peut prendre en sautant de l'écran et par la fenêtre, il semble que nos interfaces vocales aient encore du chemin à parcourir avant de conquérir le monde.

Remerciement spécial à Nikhil Deshpande pour ses commentaires pendant le processus d'écriture.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *