Com a globalização, o intercâmbio de produtos e culturas se intensificou mundialmente. Em meio a esse fenômeno, é fácil se deparar com algum manual de instruções ou um site em outra língua, por exemplo, e recorrer rapidamente ao Google Tradutor; ou, ao acompanhar uma celebridade estrangeira pelo Instagram, usar a ferramenta de tradução automática de textos dos stories. Por outro lado, também é comum esperar meses pela publicação da versão brasileira de livros estrangeiros.
Essa variação no tempo em que a tradução de diferentes conteúdos é feita ocorre porque nos primeiros casos citados acima é usada uma Inteligência Artificial (IA), que traduz o texto automaticamente. Já no segundo exemplo, o processo é feito por um profissional de carne e osso. Mas o que impede que a tradução automática seja usada em todos esses casos?
A evolução da tradução automática
“As tentativas de solução para a tarefa de tradução foram uma das primeiras almejadas com os computadores durante a Guerra Fria”, afirma Maria das Graças Volpe Nunes, professora do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP).
Em 1949, ainda no início do conflito entre Estados Unidos e União Soviética, o matemático Warren Weaver foi o primeiro a propor o uso de um computador para a tradução entre línguas. Ele escreveu um documento que trazia sugestões para o desenvolvimento dessa tecnologia, como o uso de criptografia.
Em 1954, a primeira demonstração é feita, com traduções do russo para o inglês, por cientistas da International Business Machines Corporation (IBM) e da Universidade de Georgetown, nos Estados Unidos. Depois desse passo inicial, outros pesquisadores encontraram dados pouco promissores: a tecnologia era muito cara, e a capacidade de tradução não chegava perto da habilidade do ser humano.
Apenas com o barateamento dos computadores, no início da década de 1990, a área volta a atrair interesse. É nesse momento que a tradução automática estatística é desenvolvida. Já em 2016, é lançado um modelo neural para a tecnologia, que buscou reproduzir, por meio de redes artificiais, a estrutura do cérebro humano.
Maria das Graças explica que ambos os modelos aprendem a traduzir por meio de um conjunto de exemplos de tradução entre duas línguas (chamado corpus) e, quanto maior esse conjunto, mais efetivo é o aprendizado da inteligência artificial. Ela acrescenta que é importante que esses exemplos sejam representativos — ou seja, ocorram em diferentes contextos e em uma frequência parecida.
Segundo a professora, a principal diferença entre as duas abordagens é que o aprendizado da tradução automática estatística é baseado em probabilidades associadas aos trechos a serem traduzidos. “Para a sentença em inglês ‘see you tomorrow’ (‘vejo você amanhã’), a probabilidade da tradução de ‘see’ em ‘vejo’, no português, deve ser maior do que a probabilidade da sua tradução em ‘veja’, que também é uma tradução possível”, exemplifica. Já no modelo neural, valores numéricos menos intuitivos definem a melhor tradução: “São inúmeros parâmetros, muitas vezes determinados automaticamente, que vão ajustando os algoritmos”.
Maria das Graças comenta que, devido à falta de clareza quanto a esses parâmetros, a tradução automática neural é conhecida como uma “verdadeira caixa-preta”: possui um ótimo desempenho, mas não se sabe ao certo o porquê.
Mas a máquina entende o que traduz?
A área de estudo chamada processamento de linguagem natural (PLN) é responsável por fazer uma ponte entre a linguagem matemática das máquinas e as nossas línguas.
No passado, os profissionais dessa área tentavam assemelhar o trabalho da máquina ao do tradutor humano: “A ideia era mapear o significado da sentença original e criar uma sentença na outra língua que preservasse o significado, em uma forma sintática que fosse natural na língua destino”, conta Maria das Graças. Isso era tão complexo que não surtiu resultados práticos.
Agora as máquinas aprendem com os exemplos, sem ter um conhecimento sobre a gramática e os significados da língua. Segundo a professora, hoje os profissionais de PLN atuam para a criação de modelos de línguas, que permitem uma expressão correta na língua destino; na seleção dos corpus de treinamento; na avaliação dos resultados e na possível anotação de atributos linguísticos no conjunto de exemplos.
As limitações da tradução automática
Lenita Rimoli Pisetta, professora do Departamento de Letras Modernas da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo (FFLCH-USP), explica que a tradução é uma atividade paradoxal. As diferenças sintáticas e culturais existentes entre as línguas tornam a tradução necessária, mas também a transformam em algo impossível, porque sempre há alteração do texto.
Para ela, essas diferenças são os principais desafios de um tradutor, os quais são transferidos para a IA : “Se não fosse isso, qualquer máquina poderia fazer esse serviço”.
Lenita ainda ressalta que essa tecnologia pode ajudar na tradução de textos mais padronizados, como os de divulgação científica, mas não é muito útil na literatura. Nessas obras, o autor busca se diferenciar pela sua escrita, o que gera singularidades e sutilezas que dificilmente são captadas na tradução automática: “Uma máquina passaria um trator por cima de Machado de Assis”, brinca Lenita.
Ela também ressalta que, em línguas minoritárias, a tradução automática é pior, pois a máquina tem menos exemplos armazenados para se basear. Mas Maria das Graças lembra que há a possibilidade de fazer um processo indireto. É possível utilizar o inglês, por exemplo, como uma “ponte” na tradução do coreano para o português, o que é feito automaticamente por um outro algoritmo e alcança resultados razoáveis.
Apesar dessas limitações, a professora da FFLCH admite que a tradução automática evoluiu muito e que é impossível ignorá-la. Como efeito disso, a discussão sobre o uso dessa tecnologia é levada para a sala de aula e um dos pontos destacados é o perigo de se deixar levar por uma tradução errada.
Para Maria das Graças, há duas principais limitações. Uma delas é a dependência ao conjunto de exemplos: se o corpus é insuficiente, a tarefa será prejudicada e isso só será percebido quando a máquina se deparar com um contexto que ainda não foi previsto. A outra limitação é a falta de conhecimento sobre a boa desenvoltura do sistema neural, o que causa inseguranças quanto ao uso autônomo da IA.
Ferramentas de apoio à tradução x Tradução automática
Lenita conta que um dos livros mais trabalhosos traduzidos por ela foi O Senhor dos Anéis, de J. R. R. Tolkien, tanto devido às línguas élficas, criadas pelo autor, quanto devido à necessidade da tradução dos nomes dos personagens. A cada capítulo traduzido, ela precisava conferir a lista de nomes, o que teria sido facilitado por um programa de memória de tradução, que identificaria o que já tivesse sido traduzido.
Esse programa é conhecido como uma ferramenta de apoio à tradução. A partir dele, os profissionais fazem as traduções manualmente e, com base no que já foi traduzido, a ferramenta faz sugestões ao longo do processo, o que ajuda a padronizar nomes ou conceitos que se repetem ao longo de um texto.
Maria das Graças explica que essa ferramenta, assim como a tradução automática por IA, baseia-se em exemplos previamente traduzidos por humanos. No entanto, na ferramenta de apoio, esses exemplos são acessados por um profissional. Enquanto isso, na tradução automática são os algoritmos que os acessam.
Como essa tecnologia nos afeta?
Ambas as professoras acreditam que a automatização da tarefa de tradução possibilita que mais pessoas tenham acesso a conteúdos, antes restritos por uma barreira linguística. Lenita comenta que mesmo que nessas traduções possa haver erros, em muitos casos é melhor do que nada.
Já levando em conta a carreira do tradutor profissional, a professora da FFLCH diz que não se sabe se um dia a tecnologia os substituirá. Mas acredita que, no caso das produções literárias, isso ainda está distante. Para as outras produções, ela acredita que dependerá do nível de exigência do leitor.
Maria das Graças reconhece que essa tecnologia apresenta desafios para a profissão; apesar disso, ela enxerga dois cenários positivos. Um em que essa inteligência pode servir como apoio aos tradutores, e outro em que esses profissionais poderão participar do desenvolvimento da tradução automática. “Esses especialistas são importantes para a detecção de problemas e para o design de soluções da inteligência artificial”, explica.