AI-Mimi: Legendas Inclusivas com Azure e Input Humano
Revolucionando a Acessibilidade em Transmissões ao Vivo com Tecnologia Híbrida
A demanda por legendas em conteúdo de vídeo tem crescido exponencialmente em todo o mundo. O que antes era primariamente um recurso para pessoas com perda auditiva, hoje é utilizado por um público muito mais amplo. No Reino Unido, por exemplo, a BBC relata que, embora as legendas sirvam primariamente a espectadores com perda auditiva, cerca de 10% dos telespectadores as usam regularmente, e este número sobe para 35% em alguns conteúdos online. Esta tendência global se reflete em diversas plataformas, desde televisão até mídias sociais.
No Japão, a necessidade é particularmente premente. Estima-se que mais de 360.000 pessoas são Surdas ou com Deficiência Auditiva, com 70.000 utilizando a linguagem de sinais como forma primária de comunicação e o restante preferindo o japonês escrito. Adicionalmente, com quase 30% da população japonesa acima de 65 anos, a Associação da Indústria de Aparelhos Auditivos do Japão estima que 14,2 milhões de pessoas possuem alguma deficiência auditiva. Embora grandes emissoras japonesas já ofereçam legendas para a maioria de seus programas, isso exige uma infraestrutura dispendiosa e equipes dedicadas.
O Desafio da Acessibilidade em Transmissões ao Vivo
Canais de TV locais no Japão enfrentam obstáculos significativos para fornecer legendas em programas ao vivo. Muneya Ichise, da SI-com, destaca que “Mais de 100 canais de TV locais no Japão enfrentam barreiras na oferta de legendas para programas ao vivo devido ao alto custo de equipamentos e limitações de pessoal”. Estes canais são vitais para as comunidades que servem, fornecendo notícias e atualizações importantes. A barreira financeira e de recursos humanos impede que a maioria destes canais ofereça uma experiência inclusiva.
AI-Mimi: Uma Abordagem Híbrida para Inclusão
Para superar essas barreiras e atender à necessidade de acessibilidade, a SI-com e sua controladora, ISCEC Japan, iniciaram em 2018 um projeto piloto com estações de TV locais. O objetivo era desenvolver métodos inovadores e econômicos para introduzir legendas em transmissões ao vivo. A solução técnica resultante, denominada AI-Mimi, representa um avanço significativo:
- Poder do Híbrido: AI-Mimi é um emparelhamento inovador entre a entrada humana e o poder do Microsoft Azure Cognitive Services. Esta combinação cria uma solução mais precisa e rápida para legendagem ao vivo.
- Compensação de Pessoal: A ISCEC é capaz de compensar a escassez de pessoal local para inserção de legendas, alavancando sua própria equipe especializada.
- Reconhecimento: A inovação da AI-Mimi foi reconhecida e recebeu um subsídio Microsoft AI for Accessibility, além de ter sido introduzida na Okinawa University.
Inovação Centrada no Usuário e Impacto Técnico
A equipe por trás da AI-Mimi não apenas focou na tecnologia, mas também na experiência do usuário. Baseado em extensos testes e feedback de usuários, principalmente sobre a necessidade de fontes maiores e melhor exibição das legendas, a SI-com desenvolveu um modelo de exibição aprimorado:
- Formato Otimizado: O novo modelo apresenta mais de 10 linhas de legendas no lado direito da tela da TV, uma mudança significativa em relação à versão mais comum, que exibe apenas duas linhas na parte inferior.
- Demonstração e Validação: Em dezembro de 2021, a tecnologia foi demonstrada pela primeira vez em uma transmissão ao vivo, em parceria com um canal de TV local em Nagasaki. A demonstração foi avaliada pela comunidade Surda e com Deficiência Auditiva, que classificou a experiência como altamente positiva, confirmando que suas necessidades e desejos de acessibilidade foram atendidos.
- Benefícios para Emissoras: A estação de TV local enfatizou os benefícios do modelo da ISCEC, que elimina a necessidade e o custo de equipamentos especializados, proporcionando maior flexibilidade operacional.
O impacto prático do AI-Mimi é claro: ele democratiza o acesso à informação e ao entretenimento para milhões de pessoas no Japão, superando barreiras financeiras e técnicas que antes impediam emissoras locais de oferecer conteúdo acessível. Esta solução híbrida não só eleva o padrão de acessibilidade, mas também oferece um modelo replicável para outras regiões, demonstrando o poder da tecnologia aliada à sensibilidade humana para criar experiências verdadeiramente inclusivas.
Aguardando Login...