Le Interfacce Utente Vocali (Vocal User Interface o VUI) sono le interfacce visive, uditive e tattili che consentono l’interazione vocale tra persone e dispositivi. In parole povere, una VUI può essere qualsiasi cosa, da una luce che lampeggia quando sente la tua voce alla console di intrattenimento di un’automobile che riconosce la tua voce. Una VUI non ha bisogno di avere un’interfaccia visiva, può infatti funzionare soltanto attraverso dei comandi vocali o dei feedback differenti come la vibrazione.
Controllare una macchina semplicemente parlando con essa era fantascienza solo poco tempo fa. Tuttavia, i progressi nelle tecnologie del Text-To-Speech e del Natural Language Processing, hanno contribuito all’adozione di massa di questi tipi di interfacce. Il successo commerciale delle VUI come Siri, Alexa e Google Home ha ampliato il concetto al mainstream. Le VUI sono diventate più comuni e le persone stanno approfittando del valore che queste interfacce possono fornire.

Un po’ di storia

Negli anni ’50, Bell Labs ha costruito un sistema per il riconoscimento di cifre a singolo interlocutore.
Questi primi sistemi avevano vocabolari minuscoli e non erano molto usati al di fuori del laboratorio.
Negli anni ’60 e ’70, la ricerca è continuata, ampliando il numero di parole che possono essere comprese, muovendosi verso il riconoscimento “continuo” del parlato (non dovendo fare una pausa tra ogni parola).
I progressi degli anni ’80 hanno reso pratico e quotidiano il riconoscimento vocale più reale, ed entro gli anni ’90 è nato il primo sistema di diffusori indipendenti dagli interlocutori.

Primo Caso di Voice Recognition
Primo Sviluppo di Voice Recognition

La prima grande era delle VUI fu quella dei sistemi di risposta vocale interattiva (IVR), in grado di comprendere la voce umana al telefono per svolgere i compiti. Nei primi anni 2000, i sistemi IVR sono diventati mainstream. Chiunque avesse un telefono poteva ottenere quotazioni di borsa, prenotare voli aerei, trasferire denaro tra conti, ordinare ricariche di prescrizione, trovare gli orari dei film locali e ascoltare informazioni sul traffico, il tutto utilizzando solo un normale telefono fisso e la voce umana.
I sistemi VR sono migliorati molto nel riconoscimento di stringhe di informazioni molto lunghe come ad esempio i Tracking Number dei corrieri.
Molti sistemi IVR di un tempo erano più “conversazionali” di alcune VUI attuali, in quanto tenevano traccia di ciò che i chiamanti avevano già detto, e usavano queste informazioni per preparare le domande successive.

Modello di funzionamento di IVR
Modello di funzionamento di IVR – Source

Ad oggi, ci troviamo in quella che potrebbe essere definita come la “seconda era” delle VUI. Le applicazioni mobili come Siri, Google Now e Cortana, che combinano informazioni visive e uditive, e i dispositivi che utilizzano solo funzioni vocali come Amazon Echo e Google Home, stanno diventando sempre più popolari. Secondo Google, il 20% delle ricerche vengono effettuate tramite la voce.

Perché progettare le Interfacce Utente Vocali (VUI)?

Gli utenti più giovani che utilizzano lo smartphone sono incredibilmente abili a svolgere azioni in multitasking passando dalle chat con i loro amici su Facebook alle Stories di Instagram fino ad arrivare all’utilizzo di Snapchat o di altre piattaforme. Sorge quindi spontanea una domanda, perché aggiungere un’altra modalità di comunicazione oltre a quelle già esistenti? La risposta la si può trovare in una serie di vantaggi che la VUI può portare allo svolgimento di una serie di azioni. Andiamo a vederne alcuni:

Velocità

Un recente studio di Stanford ha dimostrato che dettare i messaggi di testo è molto più veloce della digitazione a mano, anche per i professionisti. Non è di certo una scoperta clamorosa ma immaginate di dover scrivere lunghi testi per molte ore al giorno, utilizzare la voce diminuirebbe sensibilmente il vostro carico di lavoro portando con sé una serie di ulteriori vantaggi.

Avere le mani libere

In alcuni casi in cui ci si trova impegnati in altre azioni come guidare o cucinare, o quando ad esempio ci troviamo dall’altra parte della stanza e siamo impossibilitati a raggiungere il nostro dispositivo, poter parlare invece di dover raggiungere il dispositivo e utilizzarlo con le mani rende il suo utilizzo più pratico e sicuro.

Intuitività

Tutti sanno come parlare. Provate a dare un nuovo dispositivo a un utente e chiedetegli di farli una domanda, anche gli utenti meno esperti saranno in grado di interagirvi con pochi problemi una volte capire le logiche di base.

Empatia

Quante volte hai ricevuto un’e-mail o un messaggio di testo da qualcuno, chiedendoti se fosse arrabbiato con te o se stesse solo scherzando?
Gli esseri umani hanno un tono di voce difficile da comprendere solo attraverso il testo scritto.
La voce, dalla sua parte, include il tono, il volume, l’intonazione e la velocità del discorso, trasmettendo una grande quantità di informazioni. Inoltre, i dispositivi con schermi piccoli oppure senza schermi come gli orologi o come i dispositivi tipo Amazon Echo e Google Home stanno diventando sempre più popolari, e la voce è spesso il modo migliore, o l’unico modo per interagire con loro.
Il fatto che la voce sia già un modo onnipresente per gli esseri umani di comunicare non può essere sottovalutato. Immaginate di essere in grado di creare servizi o applicazioni e di non dover istruire i vostri clienti su come usarla perché già lo sanno: possono semplicemente chiedere. Gli esseri umani imparano le regole della conversazione fin da piccoli, e i progettisti possono approfittarne, bypassando interfacce difficili da comprendere e menu poco intuitivi.

Svantaggi delle Interfacce Utenti Vocali

La voce non è sempre un mezzo appropriato per i vostri utenti. Ecco alcuni motivi per cui le VUI non sono sempre una buona idea:

Spazi pubblici

Molti di noi lavorano in uffici con spazi aperti, immaginate di chiedere al vostro assistente vocale di scrivere un documento: “Hey Google, inizia a scrivere…” Ora immaginate tutti i dipendenti nel vostro ufficio fare la stessa cosa! Succederebbe un gran casino.

Disagio

Anche se le VUI stanno diventando sempre più comuni, non tutti si sentono a proprio agio a parlare ad alta voce a un computer, anche in privato.

Alcuni utenti preferiscono i messaggi e sono abituati

Molte persone trascorrono ore al giorno sui loro smartphone e molto di questo tempo viene speso per inviare messaggi.  Questo è il loro modo naturale di interagire e di compiere delle azioni e molto spesso far cambiare delle abitudini risulta complesso.

Privacy

Se gli utenti hanno bisogno di discutere di un problema di salute, la maggior parte di loro non vorrà farlo parlando al telefono durante il viaggio in treno per andare al lavoro. Non si tratta soltanto della privacy rispetto a quello che l’utente dice all’assistente, ma anche le potenziali violazioni di questa da parte di una VUI che legge automaticamente i tuoi messaggi di testo ad alta voce o ti ricorda che è il momento di prendere un certo farmaco.

Amazon Alexa

I dati sulla VUI

Abbiamo visto i vari vantaggi e svantaggi di una VUI, ma questo settore è veramente il futuro? Guardiamo un po’ di dati per cercare di capire meglio la situazione.

Secondo le recenti statistiche Amazon ha venduto  31 milioni di Echo, Google ha invece venduto 13 Milioni di unità e i numeri continuano a crescere.

Juniper Research ha rilevato che l’adozione di assistenti vocali come Alexa e Google Assistant sarà un fattore chiave per la crescita della domotica, con 275 milioni di dispositivi di assistenti vocale utilizzati per controllare le case entro il 2023.
Si tratta di un aumento rispetto ai 25 milioni stimati nel 2018, con una crescita del 1000%.
Juniper ha anche rilevato che l’utilizzo abituale sia di Amazon che da Google significa che gli assistenti vocali sono il modo più conveniente per svolgere le azioni desiderate nella nostra casa, creando un’esperienza utente più coesa in tutto l’ecosistema della domotica.

Apple Homepod

I dati di un sondaggio Voicebot condotto tra gli adulti statunitensi hanno mostrato che il 52% dei possessori di smartphone ha dichiarato di utilizzare assistenti vocali sui propri dispositivi mobili. Se si considera la popolazione totale, ciò significa che più del doppio degli adulti statunitensi hanno utilizzato gli assistenti vocali tramite smartphone (41,4%) rispetto agli smart speaker (19,7%). Poiché l’1,3% dei consumatori con accesso a un altoparlante intelligente non possiede uno smartphone, la base totale di utenti di assistenza vocale tra gli adulti statunitensi è del 42,7%.
Questo dato suggerisce che 107 milioni di adulti statunitensi hanno utilizzato un qualche tipo di assistente vocale nel 2017.

Cosa fa un VUI Designer

Cosa fa un VUI Designer? I progettisti della VUI pensano all’intera conversazione, dall’inizio alla fine, tra il sistema e gli utenti finali. Pensano al problema che si sta cercando risolvere e a ciò di cui gli utenti hanno bisogno per raggiungere i loro obiettivi. Fanno ricerche sugli utenti (o si coordinano con il team di ricerca utenti) nel tentativo di capire chi è l’utente. Creano disegni, prototipi e descrizioni dei prodotti. Scrivono descrizioni (a volte con l’aiuto di copywriter) delle interazioni che avranno luogo tra il sistema e l’utente. Hanno una comprensione della tecnologia di base e dei suoi punti di forza e di debolezza.

Voice User Interface Designer

Analizzano i dati (o si consultano con il team di analisi dei dati) per capire dove il sistema ha dei problemi e come può essere migliorato. Se la VUI deve interagire con un sistema di backend, considera i requisiti che devono essere affrontati. Se c’è una componente umana, come il passaggio di consegne ad un agente, i progettisti della VUI pensano a come tale passaggio di consegne dovrebbe funzionare e come gli agenti dovrebbero essere addestrati. I progettisti VUI hanno un ruolo importante dalle fasi concettuali del progetto fino al lancio e dovrebbero essere inclusi a tavola per tutte le varie fasi.

Anche se i designer VUI spesso svolgono tutti questi compiti, possono anche lavorare in ruoli più piccoli, come la progettazione di una singola funzione di Amazon Echo.

Dovremmo quindi implementare una VUI per la nostra prossima applicazione?

Se stiamo progettando un prodotto o un servizio che possa implicare l’utilizzo senza mani come un’applicazione per cucinare o un’applicazione per ascoltare degli audiolibri mentre si guida allora la risposta è assolutamente sì.
Se le persone useranno la nostra applicazione in uno stato contesto vulnerabile o emotivo, come quello per l’assistenza sanitaria o il comfort, la voce potrebbe essere d’aiuto.
Se vogliamo convincere i nostri utenti di qualcosa, o vogliamo assicurarvi che vadano a letto presto, o che mangino meglio, la voce può essere d’aiuto.

Siri

Se il nostro caso d’uso sarà per lo più in luoghi pubblici, come la navigazione in un sistema di trasporto pubblico, una VUI potrebbe non essere appropriata. Se si tratta di un’applicazione che la gente utilizzerà sul posto di lavoro, la modalità di utilizzo senza voce potrebbe essere più indicata.Bisogna pensare attentamente ai nostri utenti e ai loro casi d’uso dell’applicazione. La domanda principale da porsi è se i nostri utenti trarranno beneficio da una VUI oppure no.

Aggiungere una VUI perché è alla moda non è la strada giusta. Se la tua applicazione può trarre un reale vantaggio da una VUI allora sarà necessario progettare con questo obiettivo in mente fin dall’inizio e cercare di creare un’esperienza utente straordinaria.

Comments are closed.