Ora gli assistenti smart home possono dire "stai parlando con me?"
NonSolo Gaming - 9 novembre 2020 18:51
Gli assistenti vocali, che tu li ami o li odi, stanno diventando sempre più diffusi in tutte le case. Basta uno smart speaker ed avrai incluso anche la logica di Google Assistant, Alexa, Apple ecc...
Un problema per gli assistenti vocali è la situazione in cui più dispositivi ascoltano nello stesso momento. Ipotizziamo di avere i dispositivi di Alexa o Google in più stanze e quando parli con lei e impartisci un comando, quale dispositivo deve rispondere dei tanti?
Attualmente, gli assistenti intelligenti nel mercato usano una metodo semplice, il primo dei tanti che percepisce la voce che viaggia nell'etere a velocità di elevati m/s, risponde.
I ricercatori del Future Interfaces Group della CMU [Karan Ahuja], [Andy Kong], [Mayank Goel] e [Chris Harrison] hanno una risposta; gli assistenti intelligenti dovrebbero cercare di dedurre se l'utente si trova di fronte al dispositivo con cui desidera parlare. Lo chiamano direzione della voce o DoV. Il ragionamento è che il dispositivo a cui sei più vicino probabilmente ti ascolterà per primo. Tuttavia, in situazioni con eco o quando sei equidistante da più dispositivi, il risultato può sembrare arbitrario.
L'implementazione di DoV utilizza un classificatore Extra-Trees dal toolkit python sklearn. Sono stati presi in considerazione diversi altri algoritmi di apprendimento automatico, ma alla fine ha vinto l'efficienza ed è stato selezionato Extra-Trees.
Un altro aspetto interessante della ricerca è stato determinare cosa significa veramente affrontare l'enigma. Il team aveva "ascoltatori" umani che sostituivano assistenti intelligenti. Un "oratore" pronunciava la frase chiave mentre l '"ascoltatore" determinava se l'interlocutore era di fronte a loro o meno. In base alla definizione di orientamento, il sistema può determinare se qualcuno sta affrontando il dispositivo con una precisione del 90% che sale al 93% con la calibrazione per stanza.
Il loro algoritmo così come i dati che hanno raccolto sono open source su GitHub. Forse quando creerai il tuo assistente vocale personalizzato, potrai incorporare DoV per migliorare la precisione dell'ascolto e risposta.
Ma i grandi produttori di asisstenti tecnologici attuali, faranno mai uso di un codice open source per migliorare l'esperienza domestica?
Fonte: hackaday