interNOSTRUM
Domingo , 12 de Octubre de 2003. Enrique Barbeito García
Vía Dinamic Style me entero de la existencia de interNOSTRUM, un producto llevado a cabo por el DLSI de la UA por encargo de la CAM -quien propuso la iniciativa- y financiado por ésta última y el Vicerrectorado de Nuevas Tecnologías de la UA. Es un eficaz sistema de traducción automática castellano-catalán y viceversa –aunque el funcionamiento catalán-castellano advierten que es todavía experimental–
Este sistema traduce del castellano al catalán (y viceversa) documentos de texto ANSI, RTF y/o HTML a velocidades superiores a las 1000 palabras por segundo, lo que permite ofrecer un servicio de “navegación traducida” por Internet. Esta aplicación web no es el único traductor castellano-catalán que en la actualidad existe, aunque sí que es el que más abierto/libre podemos encontrar los usuarios de Internet. Es también el más rápido y el único creado enteramente en un entorno académico.
Las características técnicas de interNOSTRUM son:
- Variedad del catalán: central (Cataluña); variantes valenciana y balear en desarrollo.
- Tipos de documentos tratados: ANSI, RTF, HTML.
- Navegación con traducción de páginas HTML con y sin “frames”.
- Más de 1000 palabras por segundo en un ordenador personal de 400 MHz con 128 MB de memoria.
- Servidor completo en 25 MB de disco.
- Versiones del servidor: Linux/Apache/PHP y Windows 2000/IIS/ASP.
La interfaz web que dispone la aplicación permite un servicio de traducción separado, dependiendo de diferentes formas de utilizarlo:
- Text , permite la traducción de un texto con un máximo de 16384 caracteres, con la posibilidad de elegir el tipo de salida: HTML o texto
- Correu , te permite el envío de correo electrónico traducido de modo automático. Tan solo se deben rellenar los distintos campos (remitente, destinatario, motivo) y seguidamente el texto de castellano o catalán. El sistema entonces envía el correo y en el cuerpo incluye el mensaje original (lo que escribiste) y la traducción pertinente.
- Documents i websites , esta opción te permite agregar un fichero externo al sistema de traducción en diferentes formatos (texto plano, HTML y RTF). Seleccionando el sentido adecuado de la traducción, leerá el archivo indicado dando como resultado su traducción. Muy útil ;)
- Traduir i navegar , Personalmente, la funcionalidad más útil de todas. Especificando la URL para la página que queramos ver traducida, y el sentido de traducción, en muy poco tiempo obtendremos el sitio especificado completamente traducido, manteniendo intacto el diseño del mismo. Un ejemplo de traducción lo tenéis [ aquí ]
- XAT! , Este es un curioso servicio de chat con traducción automática en tiempo real. Eligiendo el sentido de la traducción, a la hora de enviar o recibir texto en el canal de chat, éste aparecerá traducido en uno u otro idioma (dependiendo de cuál se escogió)
En cuanto a la calidad de la traducción, no puedo decir más de lo que personalmente he visto. Y lo he visto muy muy bien ;) No solo se limita a la traducción de las distintas palabras sino que también respeta y mantiene la gramática, capaz de traducir incluso expresiones o frases hechas. Me ha parecido genial mientras lo probaba con esta misma página. La traducción era tan limpia que en ocasiones se me olvidaba que estaba leyendo una página en castellano pasada por un filtro que la saca en catalán ;)
Y la traducción es tan transparente que, unido a la eficacia en cuanto a velocidad/calidad de la traducción, he creído oportuno el incluir un enlace directo en mi columna izquierda de secciones para quienes deseen leer este sitio en catalán. Sin duda una muy buena opción: todo el contenido (texto) lo encontrarán perfectamente traducido: anotaciones individuales, por mes, por categoría, comentarios, secciones estáticas –about, docs, config, code, contact, …–, todo :)
Enlaces:
Im-presionante!
Sólo una par de cosas:
¿Se han planteado en un futuro incluir otras lenguas del territorio Español (Euskara, Galego…)?
¿Una licencia tipo GPL, BSD…?
Hola Fernando, he estado ojeando el menu principal de la aplicación (en la propia www.internostrum.com) y desgraciadamente no he encontrado nada al respecto. Lo cierto que en mi anotación se me olvidó comentar este menú, donde hay multitud de información y documentación ;)
Yo le echaría un buen vistazo a ver qué se puede encontrar. Y, también, siempre tienes disponible el correo electrónico de Mikel L. Forcada, director e investigador principal del proyecto. (su e-mail es: mlf[at]dlsi.ua.es)
Un saludo
Es una pasada!!
He provat traduir la web y es perfecte, em sembla increíble.
Pregunté mis dudas y hoy he recibido la respuesta, Cut&Paste:
- ¿Se han planteado en un futuro incluir otras lenguas del territorio Español (Euskara, Galego…)?
La empresa Portal Universia, S.A., del grupo BSCH, nos ha encargado un
traductor de portugués que puedes probar en http://copacabana.dlsi.ua.es
. Estamos en contactos para aprovechar esta tecnología y hacer uno de
gallego. Lo del euskara, ay, es algo más complicado. Nuestra tecnología
de traducción automática asume una similitud sintáctica entre las
lenguas que no tiene los pares español-euskara, etc. Lo veo muy lejos…
- ¿Una licencia tipo GPL, BSD…?
Estamos pensando en poner el motor de traducción y las herramientas de
gestión de datos lingüísticos en GPL, con tiempo. Lo que no podremos
poner (las empresas financiadoras son propietarias) serán los datos
lingüísticos…
¡Genial! Fernando :) Muchísimas gracias por compartir estas respuestas.
hora gracias a ti, esta página disponible en portugués jeje :) Aunque en este caso no puedo hacer una valoración de la traducción ya que no sé portugués :(
De todos modos me fío no sé por qué ;) Lo del Euskera es una pena. Tampoco conozco este lenguaje y no sabía que su sintaxis era tan distinta a la castellana –¿quizás debido a los distintos origenes para ambos lenguajes?–
Por el contrario, el uso de la licencia GPL, hasta cierto punto, es una gran noticia :) Ya me habían comentado varios en la universidad que el DLSI tenía fama de ser muy pro-software libre jeje :D
Por tradiccion culinaria uno acabaria creyendo que los alemanes crían cerdos.Es de dominio publico que estos honrados anumales, ofrecen todas las partes de su anatomia a los carnivoros q los crían. Por eso, siempre se prestan con mucho gusto a figurar en los platos de todas las regiones y de las formas mas variadas, porque la imaginación de los charcuteros alemanes es desbordante: salchichas, salchichón, lonjas, jamón, jarrete, despojos o costillas….
Salchichas a gogó
La Weisswurst que es como embutido blanco. La Bockwurst tiene la piel muy dura.La Plockwurst, de color rosado, también contiene carne de buey .La Bierwurst, especie de salami, acompaña la cerveza. La bratwursy , ahumada pero con granos espesos, no tiene un aspecto demasiado apetecible. La Leberwurst, de higado se puede servir en tarrina… ¡ y la Knackwurst es la menos atractiva! Y algunas mas raras.
El hombre con cabeza de col
Para acompañar las salchichas y la carne de cerdo ( menos frecuentemente gallina, caza o pescado), dos verduras omnipresentes: La patata y la col. Las patatas se comen en todas las variedades : ensalada, puré, patatas fritas,etc. La col, roja y agria de entrada , también protagoniza la celebre chucrut, acompaña principalmente al Eisbein, jarrete de cerdo ahumado y una buena expecialidad berlinesa.
Los Knödel también abundan por todo el país. Estas bolas de pasta para fideos (a menudo hechas con migas de pan ) .
Un buen plato húngaro q abunda en todo el este de Alemania: el goulasch, una sopa de buey con cebollas y pimentón rojo.
Tinta xinesa
Estoy incorporando traducciones automáticas de tintachina a otros idiomas. Las localizaréis en el menú lateral. Para el catalán uso Internostrum, de la Universidad de Alicante. Abundante información sobre el mismo en el blog de Enrique Barbeito. Para e…
cuando vais a sacar para el euskara?