Hoy en día, con la renovación constante de la tecnología, surgen aplicaciones para traducir idiomas o lenguas, algunas con un gran potencial como es el caso de Axolotl.
Con el fin de relacionar el lenguaje natural y la computación para que se desarrollen y apliquen sistemas informáticos que lo procesen y sinteticen, ingenieras de la UNAM crearon Axolotl.
Ximena Gutiérrez, Elena Vilchis y Rocío Cerbón son los nombres de las ingenieras detrás de este proyecto lingüístico, recogiendo amplios aspectos de la realidad para formar un modelo al cual se pueda recurrir para realizar una traducción.
Axolotl es un corpus, que se traduce a una gran colección de documentos que alimentan a una base de datos en la búsqueda de patrones del lenguaje humano, permitiendo conocer el lenguaje y desarrollar la tecnología necesaria para realizar una mejor interacción entre humano y máquina.
Dentro de los corpus destacan los corpus paralelos, en tecnologías digitales; es un recurso lingüístico que consistente en textos de dos lenguas (en algún formato electrónico adecuado) que están alineados a cierto nivel de granularidad; generalmente a nivel de párrafo, aunque también a nivel de sección, página o incluso de palabras, estos se utilizan principalmente para hacer traducciones.
Para crear Axolotl se usaron diversas fuentes entre textos históricos; didácticos, cuentos, recetarios, musicales suman un total de 38 libros, que presentan una variación dialectal y diacrónica, agregando un mayor valor, ya que los textos pertenecen a diferentes variantes y épocas.
Algunos de los documentos se tuvieron que digitalizar y corregir manualmente ya que la tecnología scanner OCR (Reconocimiento Óptico de Caracteres) no sabía interpretar el náhuatl.
Actualmente, Axolotl contiene cerca de un millón de palabras y su principal tarea es convertirse en un traductor automático español-náhuatl.
Para más información sobre este proyecto consulta aquí.