Tradutores automáticos - I - (anotações de pesquisa)

Tradutores automáticos em rede é o tema de estudiosos a exemplo de María Amparo Alcina Caudet (2013) que se propôs a considerar aspectos da tradução automática hoje e de como a Internet vem revolucionando e ampliando este setor. Para a estudiosa mencionada esse tipo de tradução começou antes mesmo que se construísse o primeiro computador. A autora se refere à contribuição de Descartes e de Leibniz que já haviam formulado teorias sobre a representação numérica das palavras. Além desses, outros filósofos já haviam pensado sobre a codificação da linguagem e isto seria uma maneira com a qual pretendiam representar a linguagem evitando a ambiguidade de sentidos, de tal sorte que toda a humanidade pudesse compreender o significado de frases ou textos.

Segundo Caudet, a partir da criação do modelo ENIAC (Electronic Numerical Integrator and Computer), o primeiro computador digital eletrônico, é que os sonhos dos filósofos começaram a se tornar realidade. Assim, as primeiras pesquisas sobre tradução automática e computadores eram muito otimistas, mas, diante do momento atual, aquelas pareceriam ingênuas. Foi dessa oportunidade em diante que se começou a pensar que seria possível obter sistemas capazes de traduzir textos de maneira rápida e eficaz. Entretanto, esse olhar de esperanças tornou-se pessimista ao se atentar para o fato de que as pesquisas padeciam a falta de uma reflexão subjetiva mais profunda sobre o complexo sistema da linguagem humana, especialmente tendo em vista o que consta do informe ALPAC (Automatic Language Processing Advisory Committee).

São tantos os sentidos das palavras de cada língua, são também tantas as dificuldades em estabelecer uma relação entre uma e outra língua, mais ainda as dificuldades de interpretação, os duplos sentidos, as frases feitas que se mostram de impossível tradução literal; as metáforas que são interpretadas de acordo com nossa vivência cultural, nosso contexto, situações de comunicação muito específicas e que têm teor humorístico, isto sem contar com os possíveis mal entendidos. Reforcem-se aí as atividades de tradução, o ensino de uma língua estrangeira, as particularidades da análise sintática, semântica ou pragmática de uma frase ou de um texto; inclusive a análise do léxico de uma língua. Esses e outros pormenores demonstram a impossibilidade da realização do sonho de se alcançar uma tradução automática de qualidade. Frise-se ainda que mesmo feita por humanos experts em tradução de textos escritos, essa qualidade elevada ao máximo da perfeição não existe, mas apenas uma aproximação ou mesmo uma adaptação ou releitura. Este tipo de serviço como a adaptação e a releitura de um texto o tradutor mecânico não realiza absolutamente.

Caudet ressalta a questão da globalização dos mercados, o crescimento das relações internacionais e a aparição da Internet como motivos exponenciais que justificam o aumento das necessidades de comunicação entre os governos, empresas e o público em geral. A sociedade tem acesso a muita informação e esta precisa ser traduzida e de maneira rápida e eficaz. Além disto, a realidade do mundo moderno inclui um quadro novo em que o tradutor que oferece seus serviços profissionais através da Internet também utiliza parte do seu trabalho mecanicamente.

Este tipo de auxílio ao tradutor tem muita valia diante da velocidade com que se movimentam todas as coisas na sociedade moderna. Então, um tradutor não precisa obrigatoriamente sentar-se à mesa com um compêndio de cerca de duas mil páginas para traduzi-las palavra por palavra, frase por frase e página por página. Ele poderá realizar a tradução mecanicamente, providenciando-a por partes ou capítulos, e, em seguida, fazer uma espécie de releitura com ajustes e revisões que vão dar mais qualidade e sentido ao texto traduzido.

Ainda segundo Caudet, o ano que representa o início da tradução automática é o de 1954, quando foram feitas as primeiras experiências com um protótipo que traduzia um punhado de frases entre o russo e o inglês. O sucesso da empreitada criou esperanças e, nos anos seguintes, foram desenvolvidos novos projetos de investigação com o objetivo de conseguir a desejada tradução de qualidade. No ano de 1966 o informe ALPAC demonstrava que a partir dos resultados obtidos até aquele momento, ainda faltava fazer muito para se conseguir sistemas de tradução automáticas verdadeiramente úteis. Depois de alguns altos e baixos, veio a vez do Canadá se colocar no cenário com o sistema Meteo, na Universidade de Montreal, com o objetivo de atender à tradução de boletins meteorológicos em francês e inglês. Na Europa, a Comissão Europeia adotou o sistema SYSTRAN para realizar as traduções de documentos em seu setor destinado a tal atividade. Ao mesmo tempo se iniciou o projeto europeu de investigação denominado EUROTRA. “Eurotra had two aims: (1) to develop a prototype for machine translation between the languages of the European Community (Danish, Dutch, English, French, German, Greek, Italian, Portuguese and Spanish); (2) to stimulate research in computational linguistics in the EC Member States”.

Ao longo do período que se inicia em 1954 até a atualidade, a investigação em tradução automática e ferramentas linguísticas têm gerado distintos tipos de sistemas e metodologias, alguns muito simples, mas por causa deles os estudos foram se desenvolvendo e se tornando mais complexos, podendo oferecer cada vez mais qualidade ao texto traduzido, quer através de estratégias diretas quanto indiretas, pois todas elas têm por base as regras linguísticas. Na década de 1980 os sistemas baseados em interlíngua não haviam perdido suas características de protótipos, enquanto que os sistemas baseados em transferência de um idioma para outro são os que, por disporem de um enfoque mais simples, puderam converter-se em sistemas comerciais.

No ínicio da década de noventa começaram a se desenvolver estratégias baseadas em corpus. Esses sistemas baseados em corpus utilizam a informação que encontram em traduções que tenham sido utilizadas anteriormente. As frases dos textos na lígua de origem são mescladas às frases traduzidas. São, portanto, traduções realizadas a partir de estratégia estatística representativa de exemplos de traduções já existentes ou então pela estratégia de exemplos, ambas evitando a complexidade dos métodos baseados em regras linguísticas.

REFERÊNCIAS

Centre for Computational Linguistics/Faculty of Arts/Katholieke Universitiet Leuven

Disponível em <http://www.ccl.kuleuven.ac.be/about/EUROTRA.html> Acesso em fevereiro de 2013

CAUDET, María Amparo Alcina. Los traductores automáticos en la red

Disponível em <http://cvc.cervantes.es/lengua/anuario/anuario_10-11/alcina/p01.htm> Acesso em janeiro de 2013