SignGemma: novo modelo da Google para tradução de linguagem de sinais

A Google, por meio de sua divisão DeepMind, anunciou recentemente o desenvolvimento do SignGemma, um modelo de inteligência artificial (IA) projetado para traduzir linguagem de sinais em texto falado. Apresentado durante o Google I/O 2025, o SignGemma representa um avanço significativo na promoção da acessibilidade e inclusão digital para pessoas surdas e com deficiência auditiva.

O SignGemma é um modelo de IA que utiliza tecnologias avançadas de visão computacional para interpretar movimentos das mãos, formas e expressões faciais, convertendo-os em texto falado em tempo real. Construído sobre a estrutura Gemini Nano, o modelo emprega transformadores de visão para analisar e compreender gestos da linguagem de sinais, com ênfase inicial na Língua de Sinais Americana (ASL) e tradução para o inglês.

Como os usuários poderão utilizá-lo?

O SignGemma foi projetado para operar diretamente em dispositivos como smartphones, tablets e laptops, sem a necessidade de conexão com a internet. Essa funcionalidade offline é particularmente benéfica para usuários em áreas com conectividade limitada. Além disso, por ser um modelo de código aberto, desenvolvedores e empresas poderão integrá-lo em aplicativos e serviços personalizados, ampliando seu alcance e utilidade.

Atualmente em fase de testes, o SignGemma está previsto para ser lançado ao público até o final de 2025. A Google está convidando desenvolvedores e membros das comunidades surdas e com deficiência auditiva para participarem do programa de testes e fornecerem feedback, visando aprimorar ainda mais o modelo antes de seu lançamento oficial.

O SignGemma representa um passo significativo na promoção da inclusão digital, permitindo que pessoas surdas e com deficiência auditiva comuniquem-se de forma mais eficaz com aqueles que não compreendem a linguagem de sinais. Ao facilitar a comunicação em tempo real, o modelo tem o potencial de transformar interações em diversos contextos, como educação, atendimento ao cliente e serviços de emergência.

Além disso, ao disponibilizar o SignGemma como um modelo de código aberto, a Google incentiva a inovação e a colaboração, permitindo que desenvolvedores adaptem e expandam suas funcionalidades para atender às necessidades específicas de diferentes comunidades ao redor do mundo.

O SignGemma destaca-se como uma iniciativa pioneira na aplicação da inteligência artificial para promover a acessibilidade e a inclusão. Com seu lançamento previsto para o final de 2025, espera-se que o modelo desempenhe um papel crucial na redução das barreiras de comunicação enfrentadas por milhões de pessoas surdas e com deficiência auditiva globalmente.

Veja também nossa matéria sobre o AssistAll, um app desenvolvido no Quênia, que transforma a fala para a língua de sinais: CLIQUE AQUI!