As pesquisas para chegar até este ponto foram extensas e duraram décadas, mas o ritmo de evolução se intensificou nos últimos tempos. No mês passado, o sistema também já havia atingido uma marca importante, com uma pontuação de 6,3 WER, que ficou ainda um pouco atrás das capacidades humanas. Neste mês, a meta foi alcançada.
Este nível de precisão usou redes neurais que armazenam volumes enormes de informações, que são usados para treinar o sistema. Com isso, a inteligência artificial consegue reconhecer padrões de voz para conseguir transcrever a fala para texto.
O próximo passo é melhorar ainda mais o sistema e garantir que ele funcione em situações do mundo real, que vão muito além do que um laboratório pode proporcionar. É importante que o algoritmo seja capaz de reconhecer o que é dito também em restaurantes com barulho de fundo, em ruas movimentadas e em ventos fortes.
A conquista é importantíssima para o futuro da Microsoft, já que a grande aposta do mercado de tecnologia é que a inteligência artificial pode substituir os apps em um futuro não muito distante. Em vez de abrir um aplicativo para realizar uma função, dê um comando de voz para uma assistente virtual (no caso da Microsoft, a Cortana) realizar a ação por você; para este futuro se concretizar, o sistema tem que ficar cada vez melhor em entender comandos de voz. Xbox, Office, Windows também se beneficiam diretamente disso.