Google: o reconhecimento de voz do Gboard também funcionará offline

O famoso teclado do Google Gboard integra um sistema de reconhecimento de voz por meio do qual é possível ditar palavras que a inteligência artificial se transforma em texto escrito. Até agora, essa opção só era utilizável se você tivesse uma conexão com a Internet. Através do seu blog, A equipe gigante de Mountain View anunciou hoje que o recurso também estará disponível offline.

No momento, no entanto, ele só pode ser usado em inglês e apenas em dispositivos Pixel. O processo por trás do reconhecimento de fala é complexo e inclui vários modelos difíceis de armazenar em um smartphone devido à quantidade de memória necessária (cerca de 2 GB). Para isso, atualmente o processo é realizado remotamente nos servidores do Google que analisam e enviam de volta o texto falado.

Crédito: Google

Tudo isso, é claro, ocorre pela Internet e envolve um certo atraso na resposta. O objetivo da equipe de pesquisa, portanto, sempre foi a redução da latência. O Google conseguiu reduzir o modelo em até 80 MB para poder armazená-lo no armazenamento do dispositivo e permitir a operação mesmo offline.

O objetivo foi alcançado graças ao uso de transdutores de rede neural recorrentes (RNN-Ts) que Рdiferentemente dos modelos anteriores em que a saída era a palavra criada através do reconhecimento de fonemas Рanalisar entradas e retornar caracteres imediatamente um por um. Na prática, o novo modelo reconhecerá as letras individuais das palavras faladas reescrevendo-as como se você estivesse digitando em vez de reconhecer os fonemas. Além disso, a taxa de erro foi reduzida para meros 5%.

Uma novidade realmente interessante que expande os limites da intelig√™ncia artificial e melhora a vida dos usu√°rios que usam regularmente o reconhecimento de fala para uma s√©rie de atividades. No momento, a disponibilidade √© limitada, mas o Google espera que “dadas as tend√™ncias do setor, com a converg√™ncia de hardware especializado e melhorias algor√≠tmicas, as t√©cnicas apresentadas poder√£o em breve ser adotadas em v√°rios idiomas e em campos de aplica√ß√£o mais amplos