Visto y Leído

[Sobre Biblioteconomía y Documentación, Recuperación de Información, Lógica, Inteligencia Artificial]

¡Importante! esta página hace uso de estilos recogidos en la especificación CSS2, no soportados por el navegador que está utilizando. Por favor, lea esta recomendación al respecto.

Sobre este sitio

Selección de artículos, ensayos, noticias, entrevistas, reseñas, y otro tipo de textos, publicados en medios impresos y digitales, sobre Biblioteconomía y Documentación, Recuperación de Información, Lógica, Inteligencia Artificial, y áreas afines del conocimiento, sin descartar la inclusión ocasional de textos relativos a la actualidad política y social.

Archivo de anotaciones

Guardado por meses.

Enlaces a otros sitios

Temáticas afines

Política, sociedad

Fuera de contexto

Lecturas recomendadas

De Jacques Derrida, en Derrida en castellano:

Varios

Esta página traducida:

Traducción al catalán, internostrum; traducción al portugués, universia.

Búsqueda con Google
 

Búsqueda con Yahoo!
 

Búsqueda con AlltheWeb

Agregue este sitio a su lector de "feeds" (sindicación mediante el sistema Atom).

En esta página:

  • 29.11.05 | Recuperación de Información, Procesamiento de Lenguaje Natural y Web Semántica
    · [leer]
    · [0 comentarios]

Recuperación de Información, Procesamiento de Lenguaje Natural y Web Semántica

Autor: José Ramón Pérez Agüera (*)
Fuente: IWETEL, 28/11/2005
Url documento: http://multidoc.rediris.es/...

(*) Departamento de Sistemas Informáticos y Programación, Facultad de Informática (Universidad Complutense de Madrid). Miembro del Grupo de Análisis sobre Estrategia y Prospectiva de la Información (Thinkepi).

En los últimos tiempos uno de los términos más utilizados cuando nos referimos a la Web es la Web Semántica. Como si de Harry Potter se tratara, todo experto en Internet que se precie, debe conocer estas dos palabras mágicas símbolo del futuro de una Internet más ordenada, más organizada, más catalogada, en definitiva más bibliotecaria [1].

No es mi objetivo definir ni discutir el significado del término Web Semántica, ya que insignes científicos y pensadores se han encargado de hacerlo con mucha mayor claridad de lo que yo podría hacerlo jamás. Sin embargo, como persona pragmática que soy, si voy a entrar a comentar en esta breve nota thinkepiana cuales son los elementos, herramientas y utilidades que son necesarias para que la Web Semántica deje de ser un concepto y se convierta en una realidad. Por supuesto, toda originalidad en mis planteamientos queda descartada, y no pretendo más que convertirme en un mero compilador de evidencias existentes en el panorama investigador que en la actualidad se encuentra en torno al concepto de Web Semántica.

En el último congreso internacional sobre Web Semántica, celebrado en Osaka, del 18 al 21 del mes pasado, la presencia de aplicaciones centradas en Procesamiento de Lenguaje Natural (PLN) fue más que notable. De hecho, Gate, una conocida aplicación para ingeniería lingüística diseñada en la universidad de Sheffield, fue una de las estrellas invitadas (de forma no oficial) al figurar referenciada en un buen número de los trabajos presentados al congreso.

Ahora bien, la utilidad del PLN para la implementación de una Web más Semántica, no es un descubrimiento de este año. En el pasado 2004, Ricardo Baeza-Yates firmo un interesante trabajo (otro más) sobre la aplicación de técnicas de PLN a la Recuperación de Información (RI) donde proponía a la Web Semántica como una de las principales aplicaciones prácticas de técnicas convidadas de PLN y RI.

Sin duda deben existir bastantes más referencias a la vinculación entre PLN, RI y Web Semántica que ahora mismo se me escapan. Pero mi objetivo aquí no es el de presentar una relación exhaustiva de la vinculación entre estos tres elementos, sino, más bien, y continuando con mi proselitismo tecnológico en el área de ByD [Biblioteconomía y Documentación], animar a todos aquellos atrevidos documentalistas que se introducen en la Web Semántica como área de investigación, a bucear en la literatura de PLN y RI que ya existe y que es fundamental para hacer realidad el sueño de Tim Berners-Lee. Animarles también a manejar las herramientas necesarias para implementar la Web Semántica, tales como Gate, Protege, Lucene, Nutch, o tantas otras, aunque para ello haya que aprender a programar, ya que esta es la única forma de hacer que, realmente, la Web Semántica sea una Web más bibliotecaria, y no solamente más informática.

Muchos pueden argumentar que el propio padre de la idea defiende que la Web Semántica no es una Web basada en técnicas pertenecientes al área de Inteligencia Artificial (IA), pero esto no significa que nos podamos utilizar estas técnicas como base y apoyo para la implementación de su idea, ya que, más allá de rencillas de carácter académico, todo lo que nos ayude a hacer realidad una nueva Web es útil independientemente de conceptualizaciones de carácter teórico.

Hay que tener en cuenta que, hoy por hoy la Web Semántica no existe como tal, más allá de implementaciones puntuales de carácter experimental. El hecho de que exista pasa inexorablemente por la generación de contenidos web semánticos que den cuerpo a la idea de una web más organizada. La generación de contenidos de carácter semántico no es asimilable de forma manual por lo usuarios y autores de la Web, por lo que es necesario la automatización de todas, o por lo menos parte de las tareas de generación de contenidos web semánticos. Es aquí donde el PLN y la RI tienen mucho que aportar, ya que permiten la implementación de aplicaciones capaces de generar información de tipo semántico que dote de cuerpo a la Web Semántica y la conviertan en una realidad.

Analizadores sintácticos, que permitan comprender la estructura de las frases de forma automática, etiquetadores léxicos, reconocedores de entidades como nombres, fechas lugares, todas ellas son herramientas automáticas esenciales para la generación de contenidos web semánticos, es más, me atrevo a decir que sin ellas no es posible una web semántica real, ya que el coste de elaboración manual de contenidos semánticos no es asimilable desde ningún punto de vista.

Una buena forma de ver en práctica las ideas a las que brevemente hago referencia en esta nota es acudir a la jornada organizada por el grupo Normaweb de SEDIC el próximo día 12 de diciembre en Madrid, donde hablarán Asunción Gómez y Richard Bejamins a los cuales merece mucho la pena escuchar cuando hablan de estos temas (también hay otros ponentes cuyo interés es mucho menor, pero claro, no se puede tener todo).

Lo aquí expuesto no invalida ni mucho menos otras ideas sobre la implementación de la Web Semántica, pero si se acerca, o al menos ese es el objetivo, a lo que supone la implementación real de la idea, lo cual es desde mi punto de vista la mejor forma de acallar a aquellos que opinan que la Web Semántica es un concepto vacío, una entelequia sin sentido o una utopía irrealizable.

[1] Esta frase es de la insigne entre las insignes, Eva Méndez

Referencias

[29.11.05] [0 comentarios] [#] [lista]


Visto y Leído,

Publicación: Blogger | Estadísticas: eXTReMe Tracking

Se recomienda ver este sitio con Mozilla 1+, Firefox 0.8+ ó Netscape 7+. Si no queda más remedio, con IE 6+. Si lo desea, comunique cualquier problema al respecto. También será bien recibida cualquier sugerencia sobre el contenido. La fuente de letra preferente es Georgia.