Pesquisadores da Universidade de Washington deram um passo importante para resolver um problema clássico de quem tenta conversar em ambientes barulhentos. Com o uso de inteligência artificial, eles desenvolveram um par de fones de ouvido capazes de destacar automaticamente a voz da pessoa com quem você está falando, enquanto reduzem todo o ruído ao redor, sem que seja preciso dizer nada ou apertar qualquer botão.
A tecnologia ataca de frente o famoso “problema da festa”, que afeta especialmente pessoas com algum grau de perda auditiva.
Os fones tradicionais com cancelamento de ruído raramente ajudam nessas situações. Ou eles abafam tudo de forma indiscriminada ou deixam passar todo o som ambiente no modo transparência, o que acaba não resolvendo o desafio de focar em uma conversa específica.
A solução criada pela equipe da Universidade de Washington vai além disso ao identificar, em tempo real, qual voz o usuário está tentando ouvir. O sistema separa essa fala, melhora sua clareza e reduz as demais vozes ao fundo, tudo processado diretamente nos próprios fones, sem atrasos perceptíveis.
Nos testes realizados com 11 participantes, os resultados chamaram atenção. A clareza da voz principal e a redução de ruído foram avaliadas como mais que o dobro do som original sem processamento.
Mesmo em situações caóticas, com pessoas falando ao mesmo tempo ou entrando na conversa de repente, o sistema conseguiu se adaptar rapidamente e manter o foco correto.
Essa abordagem representa uma evolução em relação a tentativas anteriores feitas no mesmo laboratório.
Antes, era necessário olhar diretamente para quem se queria ouvir ou travar manualmente o sistema em uma voz específica, às vezes definindo até uma distância fixa. Agora, a IA consegue identificar o interlocutor apenas pelo padrão da voz, sem depender de gestos, comandos ou qualquer tipo de implante.
Os protótipos atuais utilizam fones com cancelamento de ruído já existentes no mercado, combinados com microfones binaurais e componentes eletrônicos adicionais para o processamento do áudio.
Os pesquisadores também mostraram que essa tecnologia pode ser reduzida a um chip pequeno o suficiente para caber em aparelhos auditivos, o que abre possibilidades bem interessantes para o futuro.
Outro ponto importante é que todo o código do sistema é open source, permitindo que outros desenvolvedores contribuam, adaptem e expandam a tecnologia. Até agora, os testes envolveram conversas em inglês, mandarim e japonês, mas tudo indica que o método pode funcionar com outros idiomas sem grandes dificuldades.
Segundo Shyam Gollakota, um dos líderes do projeto, a equipe ficou surpresa com o quão bem o sistema se saiu até mesmo em conversas reais extremamente confusas.
O próximo passo é integrar essa inteligência em dispositivos do dia a dia, como fones de ouvido comuns, óculos inteligentes ou aparelhos auditivos. Se isso se concretizar, ambientes barulhentos podem deixar de ser um obstáculo, transformando reuniões lotadas, festas e restaurantes movimentados em experiências muito mais fáceis de acompanhar.
Veja mais sobre tecnologia!