Aportes para la enseñanza en el Nivel Medio - Lengua
Lengua Lengua educ.ar Alianza por la educación

Traductores y correctores automáticos

Los correctores y traductores automáticos son programas complejos, que tienen incorporadas las herramientas básicas de análisis gramatical (ver analizadores básicos) y que son utilizados por usuarios de diferentes tipos. Los correctores automáticos suelen estar incorporados a los procesadores de textos, aunque los más poderosos constituyen herramientas independientes. Además de resolver dudas normativas y de estilo, los correctores suelen detectar problemas en las construcciones sintácticas e incompatibilidades entre la información morfológica y la sintáctica. Esas funciones requieren el trabajo conjunto de analizadores morfológicos y sintácticos, lematizadores, conjugadores, etc. Para una descripción del funcionamiento del corrector automático desarrollado por la Editorial Planeta puede consultarse la dirección  http://www.sepln.org/revistaSEPLN/revista/26/castellon.pdf.

Más complejo es el funcionamiento de los traductores automáticos, que trabajan con textos informatizados. La traducción automáticase divide en tres fases bien diferenciadas:

  1. Análisis: en esta fase, el texto original se analiza de manera que se genera a partir de él una representación abstracta (RATO) adecuada para su traducción a alguna lengua meta. En la fase de análisis sólo se precisa información sobre la lengua de origen.
  2. Transferencia: esta es la fase verdaderamente bilingüe del sistema; en ella, la RATO se transforma en una representación abstracta del texto meta (RATM) mediante el uso de reglas y de un diccionario bilingüe.
  3. Generación: esta tercera fase es básicamente la inversa del análisis pero para la lengua meta; en ella, la RATM se transforma en texto meta. La fase está diseñada de manera que sólo precisa de información sobre la lengua meta.

Los sistemas de traducción automática por transferencia se clasifican de acuerdo con la profundidad del análisis: así, se habla de sistemas de transferencia morfológica, sintáctica y semántica. Cuando el análisis es tan profundo que la RATO y la RATM son idénticas e independientes de la lengua y por tanto no se precisa de fase de transferencia, se habla de sistemas de interlingua.

La mayor parte de los sistemas de traducción automática comerciales se pueden clasificar como sistemas de transferencia morfológica avanzada; es decir, realizan un análisis morfológico y algunas operaciones que podríamos considerar como un análisis sintáctico parcial para resolver algunos problemas de la transferencia morfológica pura entre los que destacan la ambigüedad léxica categorial (que presentan palabras como vino que pueden pertenecer a más de una categoría morfológica), la concordancia de género y número (cuando estos no existen en la lengua de origen o son diferentes en la lengua meta y en la lengua de origen para algunas palabras) y el orden de las palabras, cuando varía de una lengua a otra.

De esta forma, los programas constan de tres subprogramas que actúan en cada una de las fases descriptas anteriormente:

  • el subprograma de análisis realiza un análisis morfológico de todas las palabras (formas superficiales) del texto original (es decir, las convierte en formas léxicas que contienen un lema o forma canónica, información sobre la categoría léxica e información sobre la flexión) y elige, en el caso de los homógrafos, una de las formas léxicas usando un modelo estadístico sencillo que considera las probabilidades de aparición de secuencias de dos o tres categorías morfológicas en corpus representativos de la lengua de origen (elección que se puede considerar que se basa en un análisis sintáctico parcial);
  • el subprograma de transferencia sustituye el lema de la lengua de origen por el lema en la lengua meta consultando un diccionario bilingüe, y, en general, construye una forma léxica añadiendo a este lema la información sobre la flexión proporcionada por el subprograma de análisis y envía esta forma léxica al subprograma de generación, excepto cuando detecta una secuencia de palabras que, por las categorías morfológicas que la componen, necesita de un tratamiento especial (flexión diferente de la original por concordancia, cambio del orden de palabras) antes de ser enviadas al subprograma de generación;
  • el subprograma de generación genera la forma superficial correspondiente a partir de las formas léxicas que envía el subprograma de transferencia.