Google utilizza una nuova tecnologia per migliorare l’efficienza e l’affidabilità del suo sistema di riconoscimento vocale “Ok, Google”
Google ha annunciato sul proprio Research Blog un aggiornamento della sua tecnologia di riconoscimento vocale. Nel 2012 Big G aveva sostituito il sistema Gaussian Mixture Model (GMM) con il Deep Neural Networks (DNNs). Oggi l’azienda di Mountain View, che sta per lanciare un nuovo modello di Chromescast, ha optato per la cosiddetta Temporal Classification (CTC). Questo particolare modello acustico suddivide le parole pronunciate in piccole sequenze sonore di appena 10 millisecondi che vengono poi analizzate singolarmente. In questo modo il sistema di riconoscimento richiede meno capacità di elaborazione e risulta più affidabile anche in ambienti rumorosi.
La nuova tecnologia CTC sarà utilizzata per migliorare l’efficienza delle ricerche online sull’app Android e iOS di Google Search e nei sistemi di dettatura vocale utilizzati sui tablet e smartphone che utilizzano il sistema operativo di Big G.