Redação do Site Inovação Tecnológica - 30/01/2019
Tradução de
pensamento em voz
Neuroengenheiros criaram um
programa de computador que traduz o "pensamento" em fala inteligível.
O "pensamento" na verdade
são sinais neurais lidos por uma interface implantada no cérebro de pacientes
que estão sendo tratados de epilepsia.
Monitorando a atividade cerebral
desses pacientes, o programa conseguiu reconstruir algumas palavras ‒ os nomes
dos números ‒ que uma pessoa ouve com uma clareza notável.
Esse avanço, que aproveita o
poder dos sintetizadores de voz e da inteligência artificial, promete novas
formas de interface com a tecnologia, permitindo que, no futuro, os
computadores se comuniquem diretamente com o cérebro dos usuários, por exemplo.
Há grande esperança também de
ajudar as pessoas que não podem falar ‒ como as que vivem com esclerose lateral
amiotrófica (ELA) ou se recuperando de um derrame ‒ a recuperar sua capacidade
de se comunicar com o mundo exterior.
Vocoder
Várias pesquisas mostram que,
quando falamos ‒ ou mesmo imaginamos falar ‒, emergem em nossos cérebros
padrões de atividade muito característicos. Padrões de sinais diferentes, mas
reconhecíveis, emergem também quando ouvimos alguém falar ‒ ou imaginamos
ouvir.
Mas gravar e decodificar esses
padrões, para efetivamente "ler os pensamentos", tem-se mostrado uma
tarefa mais difícil do que parecia à primeira vista.
Os primeiros esforços para
decodificar os sinais neurais se concentraram em modelos computacionais simples
que analisavam espectrogramas, que são representações visuais de frequências
sonoras. Mas essa abordagem não conseguiu produzir nada que se assemelhe à fala
inteligível.
Hassan Akbari e seus colegas da
Universidade de Colúmbia, nos EUA, voltaram-se então para outra técnica,
conhecida como vocoder, um
codificador de voz, na verdade um algoritmo de computador que pode sintetizar a
fala depois de ser treinado com gravações de pessoas falando ‒ aparelhos como
Amazon Echo e Apple Siri usam vocoders para responder perguntas.
"Nós pedimos a pacientes
com epilepsia, que já estão passando por uma cirurgia no cérebro [para receber
um implante neural] para ouvir sentenças [e números] ditas por pessoas
diferentes, enquanto medíamos os padrões de atividade cerebral. Esses padrões
neurais treinaram o vocoder," explicou o professor Nima Mesgarani,
coordenador da equipe.
Bons resultados com
números
O resultado final foi uma
"voz robótica" recitando palavras e uma sequência de números.
Os pesquisadores decidiram usar
apenas os números para testar a precisão da gravação, devido aos melhores
resultados. As pessoas deviam ouvir a gravação e relatar o que ouviram. Elas
entenderam a tradução dos seus próprios sinais cerebrais em 75% das vezes.
A equipe planeja a seguir
começar a trabalhar com palavras e tentar voltar às sentenças, além de realizar
os mesmos testes em sinais cerebrais emitidos quando uma pessoa fala ou imagina
a fala.
Bibliografia:
Artigo: Towards reconstructing intelligible speech from the human
auditory cortex
Autores: Hassan Akbari, Bahar
Khalighinejad, Jose L. Herrero, Ashesh D. Mehta, Nima Mesgarani
Revista: Nature Scientific Reports
Vol.: 9, Article number: 874
DOI:
10.1038/s41598-018-37359-z
Nenhum comentário:
Postar um comentário