Visto y Leído

[Sobre Biblioteconomía y Documentación, Recuperación de Información, Lógica, Inteligencia Artificial]

¡Importante! esta página hace uso de estilos recogidos en la especificación CSS2, no soportados por el navegador que está utilizando. Por favor, lea esta recomendación al respecto.

Sobre este sitio

Selección de artículos, ensayos, noticias, entrevistas, reseñas, y otro tipo de textos, publicados en medios impresos y digitales, sobre Biblioteconomía y Documentación, Recuperación de Información, Lógica, Inteligencia Artificial, y áreas afines del conocimiento, sin descartar la inclusión ocasional de textos relativos a la actualidad política y social.

Archivo de anotaciones

Guardado por meses.

Enlaces a otros sitios

Temáticas afines

Política, sociedad

Fuera de contexto

Lecturas recomendadas

De Jacques Derrida, en Derrida en castellano:

Varios

Esta página traducida:

Traducción al catalán, internostrum; traducción al portugués, universia.

Búsqueda con Google
 

Búsqueda con Yahoo!
 

Búsqueda con AlltheWeb

Agregue este sitio a su lector de "feeds" (sindicación mediante el sistema Atom).

En esta página:

  • 23.10.04 | La Universidad española, vivero de empresas de las tecnologías de la lengua
    · [leer]
    · [0 comentarios]

La Universidad española, vivero de empresas de las tecnologías de la lengua

Autora: Laia Reventós
Fuente: Ciberp@ís, 02/09/2004
Url documento: http://www.eleka.net/... (en PDF)

Thera, Eleka y E-genio comercializan aplicaciones desde 2003. Más de 30 grupos universitarios investigan cómo mejorar los sistemas de búsqueda de información en documentos digitales

España cuenta con una "próspera y amplia comunidad científica de las tecnologías de la lengua", aquellas que mediante voz o texto permiten programar ordenadores de manera que se comporten como si entendiesen la lengua humana. Las palabras de Donia Scott, presidenta del Congreso de la Asociación Internacional de Lingüística Computacional (ACL), que celebró el pasado julio su 42º reunión anual en el recinto del Fórum, reflejan el estado de la cuestión en nuestro país de una disciplina científica muy ligada a la inteligencia artificial y que reúne las inquietudes de las humanidades con las de la ciencia y la tecnología.

En España hay más de 30 grupos de investigación, repartidos por las universidades, que trabajan en reconocimiento de voz, procesamiento del lenguaje natural, traducción de texto a texto y síntesis de voz, los cuatro procesos básicos de estas tecnologías. La Sociedad Española para el Procesamiento del Lenguaje Natural, fundada en 1984, agrupa a más de 300, entre socios y empresas. Manuel Palomar, su presidente y catedrático de Lenguajes y Sistemas Informáticos de la Universidad de Alicante, asegura: "Ahora podemos transferir aplicaciones que beneficien a la sociedad. Las de texto son las más avanzadas. Las de voz son más complejas porque es difícil detectar los distintos tonos".

El grupo de Palomar, en colaboración con las universidades de Jaén, la Politécnica de Valencia y la UNED, trabaja para mejorar los actuales sistemas de búsqueda de información, uno de los retos de las tecnologías de la lengua. "Se trata de hacer búsquedas concretas en documentos digitalizados. Es decir que si queremos saber qué mide la torre Eiffel, obtengamos una respuesta concreta ya que la máquina se encarga de la criba de datos". El buscador Tabarca, funciona desde julio con esta tecnología.

'Desambiguación'

El problema de estos sistemas "es el tiempo de respuesta. Una de sus soluciones pasa por la desambiguación del significado, una técnica que pone cada palabra en su contexto pero que todavía no está resuelta", dice Alfonso Ureña, de la Universidad de Jaén. Su grupo (entre otros) trabaja en sistemas de recuperación de información multilingüe que incorporen técnicas del procesamiento del lenguaje natural; "es decir que incorporan sinónimos, tiempos verbales y realizan análisis sintáctico y semántico tanto en el idioma de la consulta como en otras lenguas".

Otro campo son los sistemas de extracción de información en documentos digitales. "XNotarial es una aplicación que extrae de las escrituras de compraventa los nombres del vendedor, comprador y la finca automáticamente", explica Palomar.

El Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP), de la UPC, está especializado en el del tratamiento automático del lenguaje natural oral y escrito. "TALP participa con varios grupos europeos en el desarrollo de una agenda electrónica capaz de traducir conversaciones completas del inglés al castellano o catalán", explica Horacio Rodríguez.

Otra consecuencia de la explosión investigadora son las empresas salidas de las universidades. Todas, en 2003. Como Thera, del grupo Clic de la Universidad de Barcelona, que comercializa Ontology, un programa para clasificar documentos de cualquier fuente electrónica a gran velocidad (65.000 palabras por segundo). Además, tiene analizadores morfológicos y sintácticos del catalán, castellano e inglés.

Otro ejemplo es Eleka, surgida del Grupo IXA de la Universidad del País Vasco, que vende un software que reconoce textos en euskera mientras están siendo escaneados de un libro. "Eleka utiliza lematizadores (programas que detectan la raíz de una palabra); WordNet, diccionario multilingüe donde las palabras están organizadas por campos semánticos o un corrector ortográfico que se adapta a los procesadores de texto", dice Arantxa Díaz de Ilarraza, de IXA.

E-genio, salida del laboratorio de bases de datos de la Universidad de A Coruña, ha incorporado a la Biblioteca Virtual Galega un sistema que permite buscar cualquier palabra, frase o conjunto de caracteres en cualquiera de las obras almacenadas allí. Nieves R. Brisaboa, directora del laboratorio coruñés, explica que "E-genio también ha digitalizado todos los fondos documentales de la Real Academia Gallega. En breve, su página incorporará la hemeroteca virtual resultante".

El concurso CLEF

En España, la investigación en tecnologías de la lengua (o lingüística computacional) no sería lo que es sin la labor de Felisa Verdejo, catedrática de Lenguajes y Sistemas Informáticos en la Universidad Nacional de Educación a Distancia (UNED) desde 1991. Una opinión compartida unánimemente por la mayoría de investigadores que asistían al Congreso Internacional de Lingüística Computacional en Barcelona, a muchos de los cuales les ha dirigido la tesis doctoral.

Fundadora y directiva de las asociaciones españolas para la Inteligencia Artificial y el Procesamiento del Lenguaje Natural (SEPLN), autora de más de 150 publicaciones, colaboradora de investigadores de las universidades de Cambridge, Amsterdam, Duisburgo, Berlín, Osaka...

Hoy, además de dirigir el Grupo de Procesamiento del Lenguaje Natural de la UNED que desarrolla sistemas de recuperación de información y consultas multilingües y multimedia, se encarga de evaluar algunas de las tareas del concurso CLEF (Cross Language Evaluation Forum, en inglés). "Se trata de una competición a través de Internet que promueve la investigación de los sistemas de recuperación de información multilingües y multimodal".

[23.10.04] [0 comentarios] [#] [lista]


Visto y Leído,

Publicación: Blogger | Estadísticas: eXTReMe Tracking

Se recomienda ver este sitio con Mozilla 1+, Firefox 0.8+ ó Netscape 7+. Si no queda más remedio, con IE 6+. Si lo desea, comunique cualquier problema al respecto. También será bien recibida cualquier sugerencia sobre el contenido. La fuente de letra preferente es Georgia.