Visto y Leído

[Sobre Biblioteconomía y Documentación, Recuperación de Información, Lógica, Inteligencia Artificial]

¡Importante! esta página hace uso de estilos recogidos en la especificación CSS2, no soportados por el navegador que está utilizando. Por favor, lea esta recomendación al respecto.

Sobre este sitio

Selección de artículos, ensayos, noticias, entrevistas, reseñas, y otro tipo de textos, publicados en medios impresos y digitales, sobre Biblioteconomía y Documentación, Recuperación de Información, Lógica, Inteligencia Artificial, y áreas afines del conocimiento, sin descartar la inclusión ocasional de textos relativos a la actualidad política y social.

Archivo de anotaciones

Guardado por meses.

Enlaces a otros sitios

Temáticas afines

Política, sociedad

Fuera de contexto

Lecturas recomendadas

De Jacques Derrida, en Derrida en castellano:

Varios

Esta página traducida:

Traducción al catalán, internostrum; traducción al portugués, universia.

Búsqueda con Google
 

Búsqueda con Yahoo!
 

Búsqueda con AlltheWeb

Agregue este sitio a su lector de "feeds" (sindicación mediante el sistema Atom).

En esta página:

  • 25.2.05 | Promesas y peligros de Internet
    · [leer]
    · [0 comentarios]
  • 24.2.05 | Análisis de la recuperación de información en archivos
    · [leer]
    · [0 comentarios]
  • 21.2.05 | Autopistas de la información de cartón-piedra
    · [leer]
    · [0 comentarios]
  • 18.2.05 | «Punto de Vista» de Iruñea homenajea a Pío Caro Baroja
    · [leer]
    · [0 comentarios]
  • 15.2.05 | Sistema de control mental a distancia sobre objetos
    · [leer]
    · [0 comentarios]
  • 11.2.05 | Acceso libre en Internet a las publicaciones científicas
    · [leer]
    · [0 comentarios]
  • 8.2.05 | El lenguaje en la comunicación y recuperación de información
    · [leer]
    · [0 comentarios]
  • 1.2.05 | El poder de un folio en blanco
    · [leer]
    · [0 comentarios]

Promesas y peligros de Internet

Autor: Geoffrey Nunberg (*)
Fuente: The New York Times, selección semanal elaborada y traducida por El País (24/02/2005)

(*) Lingüista de la Universidad de Stanford. Este artículo apareció en The New York Times el pasado 13/02/2005 bajo el título Teaching Students to Swim in the Online Sea (texto completo únicamente accesible bajo registro).

La expresión "alfabetización en información" suena a algo propio de nuestra época. El mes pasado, un importante desarrollador de tests de aptitud anunció que había creado uno que calcula la capacidad de los estudiantes para evaluar el material de la Red. Ello indicaba un reconocimiento oficial de que los millones invertidos en dotar a escuelas y universidades con accesos a la Red son de escasa utilidad, a menos que los estudiantes sepan cómo rescatar información útil de los enfangados océanos de Internet.

Aprendiendo a distinguir entre las joyas y la basura que ofrece la Red.

Sin duda, "la pericia informática" no es suficiente. Una profesora de literatura escandinava de la Universidad de California describe cómo utilizaban la Red los estudiantes para preparar un trabajo acerca de los vikingos: "Son estudiantes de Berkeley, de modo que, lógicamente, parten de la idea de restringir sus búsquedas a 'Vikingos NO Minnesota", explica, refiriéndose al equipo de fútbol de los Vikingos de Minnesota. "Pero están perfectamente dispuestos a confiar en una página web que habla de antiguos asentamientos vikingos en Oklahoma". Esta naturaleza confiada es un legado de la era de la imprenta. Si tendemos a creernos lo que leemos en los libros es porque han sido cribados por un editor, que decidió que valía la pena imprimirlos, y posteriormente, por el bibliotecario que los adquirió o el profesor que solicitó su compra. La Red no impone esos filtros, aunque permita a los usuarios investigar asuntos que la gente nunca habría ido a consultar a una biblioteca, como comprar una impresora o un billete de avión. Muchos adolescentes usan Internet para informarse de temas sobre los que son reacios a hablar con padres o profesores, como el sexo, las drogas, la depresión y el suicidio.

Pero se da una paradoja en el modo en que la gente concibe Internet. Todos somos conscientes de que la información basura abunda en la Red, pero la mayoría estamos convencidos de que podemos distinguir la buena de la mala. En un estudio publicado hace un mes por Pew project on the Internet & American life, un 87% de los usuarios de buscadores afirma que encuentran lo que buscan siempre o casi siempre. Puede que el nivel de confianza no esté justificado, sobre todo cuando una búsqueda requiere juzgar la credibilidad de una página web. Según el estudio de Pew, sólo un 38% de los usuarios de buscadores son conscientes de la diferencia entre resultados gratuitos y patrocinados, y sólo un 18% sabe distinguirlos.

Un estudio de 2002 dirigido por BJ Fogg [1] [2], psicólogo de Stanford, descubre que la credibilidad de una página web se juzga por su aspecto, y no comprobando quién la creó y por qué. Pero es mucho más fácil en la era crear una página web con aspecto profesional que un libro que parezca creíble.

La alfabetización en la era de la información

Hasta la fecha, los bibliotecarios han llevado la iniciativa en el desarrollo de estándares de alfabetización. Hay cierta paradoja en ello, ya que mucha gente suponía que la era digital no necesitaría de bibliotecas ni bibliotecarios. Pero los estudiantes sólo tienen un contacto limitado con los bibliotecarios, porque realizan la mayoría de las búsquedas de información en la Red desde casa o en su habitación. Y aún más importante, dejar la alfabetización en información sólo en manos de bibliotecarios evidencia una incapacidad para comprender el alcance del problema.

Parte de él reside en la propia palabra "alfabetización", que cubre un amplio territorio, desde las aptitudes para leer y escribir hasta la familiarización con la cultura, pasando por la competencia en materias como las matemáticas o la geografía. Para muchos, "alfabetización en información" sugiere una serie de abecés que podrían englobarse en una asignatura básica sobre información.

Pueden enumerarse algunos principios elementales de la alfabetización en información, como "Reconocer una necesidad de información", "Evaluar las fuentes de forma crítica" y "Comprobar si el promotor de la página goza de buena reputación". Pero esos preceptos apenas sirven de ayuda para lo que la gente hace ahora por Internet.

El pasado otoño, por ejemplo, fui profesor adjunto de un curso de postgrado sobre Calidad de la información en la Escuela de Gestión y Sistemas de Información de Berkeley. Los estudiantes demostraban una gran sofisticación en lo relativo a buscadores y sabían moverse por la Red. Pero hasta ellos tenían dificultades con ejercicios que implicaban evaluar información en ámbitos desconocidos, como utilizar Internet para decidir qué programa de licenciatura en la Red recomendarían a un amigo. El correo electrónico convierte la Red en un enorme servicio de asistencia; algunos grupos de usuarios se asocian con gente que les explica los puntos oscuros de cualquier tema. Pero apenas nadie recurre a ellos.

Por tanto, el adiestramiento en la alfabetización informativa debería permear todos los niveles y cursos educativos, desde los historiadores que consultan narraciones de esclavos en Internet, a profesores de salud y nutrición que enseñen a sus estudiantes dónde hallar información rigurosa en la Red. Incluso así, la mayoría recurrirá a técnicas someras para encontrar y evaluar la información en Internet. Como dice Fogg, la gente confía en impulsos superficiales siempre que puede. Sólo cuando afrontan una cuestión personal grave -problemas de salud, una compra extraordinaria- profundizan más. Por eso, precisamente, hay que asegurarse de que sepan cómo hacerlo.

[25.2.05] [0 comentarios] [#] [lista]

Análisis de la recuperación de información en archivos

Autor: Ramón Martín Suquía
Fuente: Revista Catalana d'Arxivística, nº 17, 2001 (*)
Url documento: http://www.arxivers.com/... (PDF)

(*) Associació d'Arxivers de Catalunya

Sistemas de recuperación de la información en los archivos: un análisis de situación y perspectivas

De entre las diferentes funciones de trabajo del archivero la de tratamiento de la información tiene una importancia central debido, sobre todo, a que ésta es la función "puente" entre la de conservación y la de difusión, sin la cual no tiene mucho sentido la primera y no puede realizarse la segunda (1). El proceso general de tratamiento de la información se subdivide en los procesos de análisis y de recuperación de la información. Mientras que en el primero de estos se describe el documento, en el segundo se pretende su localización. Ambos procesos están directamente relacionados de manera que el análisis de la recuperación de la información es, en gran medida, el resultado del éxito o el fracaso de las decisiones tomadas en el proceso de descripción.

El análisis de las diferentes formas y medios de recuperación de la información disponible en un servicio de archivo no ha merecido en los manuales "clásicos" de archivística un estudio individualizado. Esta falta de literatura archivística dedicada a la recuperación de la información (2) exige, solo con el ánimo de poder delimitar este artículo, proponer una definición que, como creo que no puede ser de otro modo, tomo de nuestros colegas los documentalistas: "La recuperación de información es el proceso de selección, en un fondo documental, de la información más adecuada a las demandas de los usuarios" (3). Sin embargo no se puede decir que no haya existido una preocupación permanente por este proceso, ha quedado más bien imbuido en dos áreas de análisis mucho más estudiadas, la descripción de los documentos de archivo, y las cuestiones relativas al acceso a la documentación.

Este artículo pretende estudiar el estado de esta cuestión sobre todo en el ámbito de los países latinos, aunque se tendrá en cuenta el ámbito anglosajón como exponente de las diferentes posibilidades que se le presentan al responsable de archivo. [...PDF]

Notas

(1) COUTURE, C.; ROUSSEAU, J. Les Archives au Xxe siècle. Montreal: Universite de Montreal, 1982, pág. 257.

(2) NÚÑEZ FERNÁNDEZ, Eduardo. Organización y gestión de archivos. Gijón: Trea, 1999, pág. 579.

(3) ROVIRA, Cristófol. "Teoria de la recuperación de la información". En: Curso de Documentación Digital. Barcelona: Universidad Pompeu Fabra, 1999. CD.

[24.2.05] [0 comentarios] [#] [lista]

Autopistas de la información de cartón-piedra

Autor: Pablo Garaizar, Ingeniero en Informática
Fuente: Gara, 21/02/2005
Url documento: http://www.gara.net/...

Sorprenden poco a quien lleve un tiempo por las redes los últimos casos de manipulación mediática «amateur». Concretamente el patinazo de hace dos semanas lo protagonizaron varias agencias de noticias distribuyendo una foto en la que podíamos ver a un marine rendido bajo el cañón de un fusil de asalto. Poco después pudo saberse que el marine resultó ser un fornido madelman de 15 cm. de alto, fotografiado con gracia por un internauta aburrido. Nada nuevo bajo el sol. A fin de cuentas, la «Estrella de la Muerte» de la Guerra de las Galaxias no medía más de medio metro de diámetro y todos aplaudimos a George Lucas por ello. Lo que molesta es que Internet permite que mucha más gente pueda mentir de manera convincente. El monopolio de la manipulación se emborrona en la Red. Repartidores de pizzas desde sus bitácoras personales «blogs» pueden convencer más y mejor que todo un portal de contenidos encargado a la más prestigiosa de las consultoras en márketing y comunicación. Y esto, a quien está acostumbrado a cambiar capital por poder mediático -y viceversa-, le inquieta.

La Red es el caldo de cultivo perfecto para la propagación de memes, ideas que se transmiten como los genes, de conciencia en conciencia. De hecho, su fundamento es ese, ser el andamiaje de la red memética de nuestra era. Millones de cabezas, pensantes en su mayoría, intercambiando memes, unas veces para mejor y otras para peor. Para peor como ocurre con los fraudes (en Internet suelen llamarse «hoax», engaños o bulos distribuidos en cadena), que raramente traspasan la barrera de lo digital a lo analógico y causan tanto ruido como la citada foto del marine de plástico. Dada la vasta cantidad de información que genera la Red cada día, resulta extraño que esa barrera no se cruce más a menudo y los bulos invadan nuestras conversaciones. Las razones son principalmente dos. La primera es sabida: los medios de comunicación de masas tradicionales, quizá como mecanismo de defensa, desprestigian constantemente Internet, generando memes que asocian bidireccionalmente Internet con pederastas, Internet con piratería, Internet con virus, etc. Si hacemos una dinámica de asociación libre de ideas, cuando oigamos «porno», diremos «Internet» de manera casi automática. Lo mismo para «piratería». De momento la ingeniería memética de esos grandes medios de comunicación tradicionales gana por goleada. En nuestro imaginario vemos Internet como una jungla de páginas porno, traficantes de música y películas, suicidios colectivos, manipulaciones mediáticas y demás. Por el momento, que algo lo haya dicho Matías Prats tiene mucha más autoridad que si lo puedes leer en la Wikipedia (http://eu.wikipedia.org). Y con esto enlazamos con la segunda razón: la ingeniería memética, al igual que la genética, tienes sus propios mecanismos de defensa contra variaciones anómalas. La Red es capaz de contrarrestar por sí misma las informaciones falsas, incompletas o inexactas. Un ejemplo paradigmático de esto fue lo que sucedió en el «Experimento Isuzu», de Alex Halavais. Los antecedentes del experimento se sitúan en un rifi-rafe mantenido entre Al Fasoldt, columnista de un periódico de Siracusa, y «Mike», de la web techdirt.com. Fasoldt criticaba los contenidos de la Wikipedia, enciclopedia libre de Internet, donde todo el mundo puede editar sus páginas, puesto que la veracidad de una enciclopedia con esta filosofía distaba mucho de lo que una persona de la calle tenía como concepto de enciclopedia. La respuesta desde techdirt.com criticaba la demagogia del periodista y lo retaba a modificar las páginas sobre Siracusa, su ciudad natal, con datos erróneos para comprobar el poder regenerativo de la Wikipedia como ente «vivo». Al Fasoldt no aceptó el envite, alegando que ese experimento no desmentiría «la peligrosidad de la Wikipedia». El saber colectivo irrita tanto a quien trabaja creando corrientes de opinión que se habla de «peligrosidad», o de «daño». Tuvo que ser Alex Halavais quien tomara el guante y modificara la Wikipedia introduciendo 13 errores en 13 páginas aleatorias, formulando como hipótesis que en el periodo de dos semanas, la mayoría de ellos seguirían intactos. La mente colectiva que conforman todos los «wikipedistas» ­como gustan en llamarse­ corrigió los errores en pocas horas, refutando la hipótesis de partida. La Wikepedia había ganado esta vez, aunque sus buenos conocedores admiten que es mucho más fácil corregir errores en páginas con contenido que en páginas que inicialmente parten de información falsa. Es decir, resulta mucho más sencillo detectar y corregir detalles erróneos en la página sobre Napoleón que descartar una página entera plagada de mentiras sobre el equipo de fútbol de Arrigorriaga.

Cuando escuchamos desde los medios de comunicación tradicionales que en Internet se manipula, quizá olvidamos ­como intuyo que pretende quien lo recalca­ que en estos medios se manipula en igual medida y que, de hecho, la manipulación de la información es consustancial al ser humano. Somos máquinas de manipular información, bien para generar información nueva o para completar la información que hemos obtenido de manera incompleta. Cómo comenta Miquel Vidal, manipular no es empobrecer ni engañar: manipular es empaquetar el pensamiento del modo más eficaz a nuestra intención. Lo hacen los poetas, lo hacen los publicistas, lo hacen los que publican «flanpetos» en indymedia, lo hacen los amantes y lo hacen por supuesto periodistas, políticos y oradores desde tiempo inmemorial.

[21.2.05] [0 comentarios] [#] [lista]

«Punto de Vista» de Iruñea homenajea a Pío Caro Baroja

Fuente: Gara, 18/02/2005
Url documento: http://www.gara.net/...

El festival de cine documental «Punto de vista», de Iruñea, homenajeará en su primera edición a Pío Caro Baroja, «por su labor en el campo etnográfico». Los organizadores del evento han programado la proyección de doce de sus trabajos y una mesa redonda para el martes 22. Asimismo, el festival ha editado la tesis doctoral de Santiago Aumesquet sobre el cine de Pío Caro.

Dentro de la primera edición del festival de cine documental "Punto de Vista" de Iruñea será homenajeado Pío Caro Baroja. El homenaje al cineasta, que ha destacado en el campo del documental etnográfico, constará de tres apartados. Por una parte, el festival proyectará doce de sus películas; por otra, el próximo martes 22 tendrá lugar una mesa redonda sobre su obra y, por último, el Gobierno de Nafarroa, organizador del festival, ha editado la tesis doctoral que Santiago Aumesquet realizó sobre el escritor y cineasta, titulada "El documental etnográfico en España: Pío Caro Baroja".

Los trabajos que se van a poder ver «están ligados a esta tierra, como el propio autor», destacó el también cineasta Koldo Lasa. Esta es una ocasión única para poder conocer los trabajos que Pío Caro ha realizado durante 25 años de su vida, ya que, como destacó Lasa, «su obra es muy extensa, pero casi no se ha visto». Las películas que se proyectarán son "Pescadores gallegos", "Las figuras bíblicas de Puente Genil", "La Alberca, vida y muerte", "Gipuzkoa", "Arcos de la Frontera", "El País Vasco", "Las Móndidas", "El País Vasco de Pío Baroja", "La sima", "La última vuelta del camino", "El País Vasco a través de Baroja" y "Navarra, cuatro estaciones".

El propio autor, que ayer compareció en rueda de prensa, afirmó ser consciente de la importancia del testimonio que ha dado a traves de su trabajo. «El hecho de que hayan pasado más de treinta años, ha dado validez a mucho de lo que he rodado. La juventud no ha visto muchas cosas y hay costumbres que yo recogí y hoy se han perdido. Creo que con mis documentales se pueden recuperar muchas».

Pío Caro llevaba muchos años sin haber visto sus trabajos hasta que, gracias al festival, tuvo la oportunidad de hacerlo. «Cuando volví a ver 'Arcos de la Frontera', me quedé impresionado y pensé '¡qué talento tiene el que ha hecho esto!'».

El camino hacia el cine

Según el cineasta, «había muchas películas que veía y que me daban asco, hasta que vi 'El ladrón de bicicletas' de Vittorio de Sica. Con este trabajo se me abrieron las puertas del cine y sentí un estremecimiento. Fue entonces cuando empecé a escribir sobre cine, pero no críticas, sino comentarios. Leía muchísimo sobre cine, veía muchísimas películas y llegué a conocer perfectamente el cine francés, italiano, mexicano o inglés. Viví muchos años la pasión por el cine».

Más información: [1] [2] [3] [4]

[18.2.05] [0 comentarios] [#] [lista]

Sistema de control mental a distancia sobre objetos

Autora: Ángela Boto
Título: Un científico español logra mover objetos a distancia con un sistema de control mental
Fuente: El País, 09/02/2005

"Pienso, luego muevo objetos", es muy probable que Descartes hubiera empleado esta afirmación para describir los trabajos de un investigador español afincado en Suiza, José del R. Millán, especializado en robótica e inteligencia artificial. Millán, que trabaja en el Instituto Dalle Molle de Inteligencia Artificial (IDIAP) ha sido elegido por una conocida revista estadounidense -Scientific American- como uno de los científicos líderes mundiales de 2004 por el proyecto de desarrollo de una silla de ruedas que se desplaza con la sola fuerza del pensamiento. Ya ha conseguido lo que ningún otro grupo había logrado antes: hacer que un pequeño robot se pasee por una maqueta de apartamento con sólo enviarle órdenes mentales.

En definitiva se trata del sorprendente mundo de las comunicaciones e interacciones entre humanos y ordenadores, o si se quiere entre la inteligencia natural y la artificial, cuyas aplicaciones se centran fundamentalmente en proporcionar un cierto grado de independencia a las personas con distintos grados de parálisis. Sin embargo, muchos ven en este campo posibilidades que trascienden ampliamente la medicina para adentrarse en terrenos propios de la ciencia-ficción.

El planteamiento de Millán es teóricamente muy sencillo, aunque la materialización es cuestión aparte. Se puede decir que el cerebro es una gran bola electromagnética. Cada pensamiento o intención de acción genera una corriente eléctrica y ésta se puede captar a través de un método ya clásico como es el electroencefalograma. El sistema ideado por el científico español pasa por el empleo de un gorro de baño con un diseño muy particular: está adornado con una treintena de electrodos y sus respectivos cables. Tal decoración tiene por cometido capturar las señales eléctricas cerebrales y trasladarlas a la máquina que ejecutará las órdenes. Así de simple y así de complejo.

Las dificultades comienzan cuándo el humano y la máquina tienen que encontrar un punto de entendimiento. Por este motivo los sistemas informáticos acaban siendo muy personales, es decir, programados para responder a las órdenes de una cabeza concreta. Cada tarea -ir a la derecha, subir o parar- activa zonas específicas de la corteza cerebral creando un dibujo eléctrico particular para cada acción. Pero "aunque existen mapas genéricos para todo el mundo, la actividad neuronal es fruto de las experiencias de cada individuo", explica Millán desde Suiza. De modo que para que el sistema funcione correctamente "tienen que aprender tanto la máquina como el individuo".

A la especificidad del funcionamiento cerebral se une el hecho de que el cerebro nunca está en reposo, es decir, que está respondiendo simultáneamente a los estímulos internos y externos además de llevar a cabo las actividades cognitivas. "El electroencefalograma te da todo, pero hay una parte que es la intención [de realizar un movimiento o una tarea]" y es esto lo que se captura como orden.

Para lograr alcanzar un lenguaje común es necesario un periodo de aprendizaje, los científicos piden a los futuros amos de la máquina que ejecuten mentalmente ciertas acciones. Así recogen la huella eléctrica de sus cerebros y posteriormente hacen que el ordenador asocie cada una de ellas a un movimiento o tarea precisa. "Los tiempos de aprendizaje que hemos necesitado hasta el momento son cortos. Unos cinco días trabajando sólo una hora y media cada día", explica Millán. Y desde luego cuanto más convivencia entre el humano y la máquina más se van perfeccionando los canales de comunicación en ambos sentidos. "Es como un músculo mental. Cuanto más lo ejercitas, más fuerte se vuelve y más sensible". A esto se añade que "el robot tiene una cierta inteligencia para valorar los obstáculos que se encuentra en el camino sin necesidad de que la persona le esté dando permanentemente indicaciones".

En estos momentos, Millán trabaja dentro del proyecto europeo MAIA cuyo objetivo no sólo es el desarrollo de la silla de ruedas, sino también la creación de un brazo de robot dirigido por el pensamiento que es la base para futuras prótesis. Las posibilidades de estos dispositivos podrían dispararse al introducir una técnica desarrollada por el Hospital Universitario de Ginebra que "permite estimar lo que está pasando en el interior del cerebro", asegura el investigador. El hecho de acceder a esta información "nos permitirá reconocer con mucha mayor precisión los estados mentales así como ampliar el número de ellos que podemos capturar".

En lo que se refiere a los tiempos para que una silla de ruedas dirigida por el pensamiento sea una realidad palpable, Millán opta por la prudencia: "Es un campo extraordinariamente delicado y no queremos generar falsas esperanzas". También por este motivo la mayoría de las pruebas se ha realizado con voluntarios sanos y sólo una se ha hecho con una persona con minusvalía. En cualquier caso, "en 10 años debería estar disponible", dice.

[15.2.05] [0 comentarios] [#] [lista]

Acceso libre en Internet a las publicaciones científicas

Autor: Adolfo Estadella
Título: Los científicos se organizan para lograr en Internet el libre acceso a sus publicaciones
Fuente: CiberP@ís, 10/02/2005

La paradoja es que para conocer los resultados de las investigaciones científicas pagadas con dinero público hay que suscribirse a revistas privadas - Los parlamentos de EE UU y el Reino Unido apoyan el acceso libre en la Red - Algunas iniciativas en Internet de lectura libre cobran la edición del artículo al autor - Más de 1.400 publicaciones especializadas son de acceso abierto - El sitio arXiv almacena más de 260.000 artículos - El material en Red tiene un 336% más de citaciones que el publicado sólo en papel

Publica o muere. La vida de un científico gira en torno a la publicación de sus resultados en revistas especializadas, un modelo de difusión del conocimiento con tres siglos y medio de antigüedad contra el que los científicos se han revelado tras el despliegue de Internet.

La reclamación hecha desde diferentes instituciones públicas, asociaciones o laboratorios es sencilla: que los contenidos de las revistas especializadas sean de acceso gratuito en la Red y que se puedan leer y distribuir libremente. El argumento que esgrimen es también simple: no es aceptable que las mismas instituciones que producen los trabajos científicos deban pagar a editoriales privadas por acceder a ellos, más aún cuando los resultados de las investigaciones se logran (en su gran mayoría) gracias a dinero público.

Suena una vez más el discurso de los contenidos gratis en Internet, pero en el caso de las publicaciones científicas existen notables diferencias con otros ámbitos. El modelo editorial del mundo académico tiene sus particularidades. Las casas editoras han fundamentado su modelo de negocio en el pago por suscripciones. Instituciones, laboratorios y centros de investigación pueden pagar unos 1.500 euros por la suscripción a una revista, aunque en ocasiones llega a 22.000 euros, como sucede con Brain Research.

"Es escandaloso que el conocimiento esté cayendo en manos privadas". Critica la situación actual Antonio Lafuente, científico del CSIC, y apunta a dos grandes problemas: "Uno de tipo económico, derivado de lo caras que resultan las suscripciones", el otro es "una cuestión ética y política, porque no puede ser que los mismos científicos e instituciones que elaboran un trabajo con recursos públicos tengan que pagar por leerlos después".

Los parlamentos de EE UU y el Reino Unido han debatido este tema y han manifestado con más o menos tibieza su apoyo a propuestas que persiguen que los resultados de investigaciones realizadas con dinero público sean abiertos.

Esta polémica por las publicaciones científicas coincide con el Año de la Física, celebración auspiciada por la ONU con ocasión del centenario de la teoría de la relatividad. Aquí sí que Internet lo publica todo, o casi todo. Hasta la investigación (FBI) sobre el investigador (Einstein).

Los precios de las suscripciones a las revistas aumentaron en EE UU un 226% entre 1986 y el año 2000, según datos de la Asociación de Bibliotecas de Investigación, mientras el presupuesto de las instituciones para pagar revistas se estiró un 192% en el mismo periodo.

Instituciones como la Universidad de California gastan unos 30 millones de euros anuales en pagar todas las suscripciones a revistas de sus centros. "El problema principal es que, aunque se gastan entre 5.000 y 10.000 millones al año en comprar suscripciones a publicaciones científicas, muy poca gente puede leerlas, la mayor parte de los profesores, estudiantes, doctores, científicos no tienen acceso a esos contenidos", explica en un correo electrónico Michael B. Eisen, co-fundador de la Public Library of Science e investigador de la Universidad de Berkeley. "Es un escándalo", concluye.

Par subvertir el sistema actual desde sus cimientos ha germinado a lo largo del último lustro un movimiento informal que abandera la idea de lo que llaman acceso abierto a la ciencia (open access): que los materiales que se publican en las revistas especializadas sean de acceso gratuito y que los lectores y usuarios puedan descargar, copiar, distribuir e imprimir libremente esos artículos, según un documento de la Budapest Open Access Initiative (BOAI).

"El acceso abierto está completamente relacionado con Internet. Se trata de aprovechar las posibilidades que ofrece esta tecnología para cambiar completamente la manera como se comunican los científicos", señala Michael B. Eisen.

Bibliotecas Públicas

Ante esta situación los científicos han decidido tomar las riendas de sus publicaciones. La Public Library of Science (PLoS) es el paradigma del nuevo modelo de publicación electrónica que abanderan. El acceso a la publicación es gratuito y son los científicos que publican en la PLoS quienes deben pagar. PLoS mantiene un sistema de arbitraje y análisis de los artículos propuestos, antes de decidir su publicación, similar al de las publicaciones de pago. La PLoS ha conseguido editar cinco títulos hasta ahora, los tres últimos lanzados en enero.

El modelo de BioMed Central es similar aunque más flexible en la aceptación de los contenidos. BioMed Central aglutina 129 revistas y los artículos que publica se descargan 1,3 millones de veces de su sitio en Internet.

Tanto la PLoS como BioMed Central defienden la idea de que sean las instituciones públicas las que paguen porque sus científicos publiquen, y que de esa forma se mantenga el conocimiento en abierto.

Actualmente hay más de 1.426 revistas que publican sus contenidos en abierto, según el Directorio de revistas de acceso abierto (DOAJ).

"La ciencia es para quien la trabaja", dice Alfonso Martínez Arias, biólogo que investiga en Cambridge y forma parte del consejo editorial de PLoS Biology. El mundo editorial de la ciencia "se ha revolucionado y cambiará más todavía; en biología estamos dispuestos a una revolución completa".

Para Martínez la virtud de las nuevas publicaciones como PLoS no es sólo la apertura de sus contenidos, sino que estén administradas por científicos en activo y no por ex científicos, como ocurre con muchas publicaciones comerciales.

Otra de las alternativas en auge es la creación de repositorios institucionales donde los científicos dejan copias de los artículos que han publicado en otras revistas, señala Remedios Merelo, de la Asociación Europea de Editores Científicos y miembro del Consejo Superior de Investigaciones Científicas (CSIC).

Los físicos hacen esto desde principios de los 90 en el sitio arXiv, donde actualmente se almacenan más de 260.000 artículos que han sido enviados o publicados en revistas. Para otras áreas es sin duda un modelo a seguir, señala Alfonso Martínez. Si se usa este tipo de repositorios se acelera la difusión de la información, puesto que en muchas revistas tradicionales puede pasar hasta un año y medio hasta que el artículo aparece publicado.

La idea, en el fondo, es "que haya una mayor flexibilidad para que la información sea más accesible y se aumente su difusión", señala Merelo, y para esto no hay nada como Internet.

Un estudio de 2001 señalaba que los artículos en Red tienen un 336% más de referencias que los artículos publicados sólo en papel.

La rebelión está servida y Michael B. Eisen hace una predicción de lo que ocurrirá: "Primero, los científicos verán que el Open Acess les conviene como autores y lectores; segundo, las instituciones públicas verán que les resulta más barato y efectivo para difundir el conocimiento, y tercero los editores verán que el Open Access es económicamente viable".

Tendencia imparable

La tendencia hacia la publicación electrónica es imparable. Hace unos años las revistas electrónicas puras se miraban con recelo, hoy su número no para de crecer. Los datos del ULRICH'S, un directorio de revistas seriadas, recogen 48.873 revistas científicas en 2003, de las cuales el 20% tenían edición electrónica. Un total de 1.153 revistas, un 2,3%, eran revistas electrónicas puras, sin edición impresa. Prescindir del papel permite ahorrar al menos un 30% en costes de producción según datos publicados en First Monday hace años.

"La gente del siglo pasado, de la era Gutenberg, ponía problemas a las revistas electrónicas", señala Francisco Aliaga, editor de Relieve, una de las primeras revistas electrónicas de España que se publica en abierto, pero "con las revistas electrónicas uno consigue más impacto".

Proyectos abiertos

Al margen de las iniciativas internacionales de suscripción o abono, también existen algunas que pueden consultarse en Internet gratuitamente. Algunas de ellas son:

E-revistas
www.tecnociencia.es/e-revistas
Una iniciativa española, auspiciada por el CSIC, que echó a andar a finales del año pasado. Agrupa actualmente más de 42 títulos de revistas españolas y latinoamericanas que dan acceso abierto a sus contenidos, entre otros Athenea Digital, Ars Pharmaceutica o Archivos de Zootecnia.

PubMed Central
www.pubmedcentral.com
Se trata de un repositorio fundado por los Institutos Nacionales de Salud de EE UU que pretende convertirse en una "biblioteca mundial en la época digital" en el campo de la medicina y biología. Las revistas que se suman a la iniciativa ponen su contenido en el repositorio, accesible a todo el público.

Directory of Open Access Journals (DOAJ)
www.doaj.org
Se trata de un repositorio donde se recogen los títulos de las revistas que publican sus contenidos en abierto, algunas de las cuales publican también en el sitio del DOAJ sus contenidos. Hay actualmente más de 1.400 revistas en abierto catalogadas en el DOAJ.

[11.2.05] [0 comentarios] [#] [lista]

El lenguaje en la comunicación y recuperación de información

Autor: Mario Pérez-Montoro Gutiérrez
Fuente: Revista Tradumàtica, nº 2 - La documentació (noviembre 2003)
Url documento: http://www.fti.uab.es/...

El lenguaje en la comunicación y recuperación de información (1)

1. Introducción

Uno de los rasgos característicos que definen al ser humano, y que lo diferencian de la mayoría del resto de las especies que pueblan el planeta, es su capacidad de conocer y aprovechar ese conocimiento en su propio beneficio.

Sin embargo, el conocimiento obtenido como fruto de esa capacidad no se construye de forma espontánea en el vacío, sino que se fundamenta, en gran medida, sobre la información que llega a nuestro sistema nervioso procedente del entorno que nos rodea. En este sentido podemos decir que la información juega un papel muy importante en la creación del conocimiento.

La información suele verse involucrada de dos maneras distintas en los procesos de gestación de conocimiento: a partir de su transmisión directa y, más recientemente, mediante su recuperación. Los seres humanos solemos construir nuestro background de conocimiento a partir de los intercambios (transmisión) de información que establecemos en la comunicación con otras personas. Pero también, y de una manera más intensiva desde hace unas décadas, aumentamos nuestros conocimientos a partir de la recuperación de información que se encuentra previamente almacenada en repositorios especializados.

Dentro del contexto de la creación del conocimiento, es importante señalar que el lenguaje es una variable fundamental de todo este proceso. El lenguaje juega un papel crítico, pues habilita los contextos comunicacionales en los que se transmite información y estructura (en forma de lenguaje de interrogación) las operaciones de recuperación de información.

En este artículo se intenta describir la doble responsabilidad del lenguaje en el contexto de la construcción del conocimiento. Por un lado, en el apartado número dos, se presentan las propiedades gramaticales que en cierta manera permiten que el lenguaje natural intervenga de un modo decisivo en los contextos de transmisión de información. Y, por otro, en el apartado número tres, se ofrece una descripción paralela del papel y de las propiedades gramaticales que permiten, al menos en parte, que el lenguaje de interrogación intervenga en los contextos de recuperación de información.

2. El lenguaje en la comunicación de información

Dentro de los contextos comunicacionales donde se produce transmisión de información, el lenguaje (natural) debe ser considerado como una de las variables críticas. Si se restringiera el uso del lenguaje, nuestra capacidad comunicativa se vería sensiblemente reducida. Y es que los seres humanos articulamos y vehiculamos la mayoría de los episodios de transmisión de información mediante el uso de una lengua. Cuando nos comunicamos cara a cara con otra persona o cuando lo hacemos mediante el teléfono, el correo electrónico o una simple carta, siempre utilizamos el lenguaje para hacer posible esa comunicación.

Sin embargo, aunque el lenguaje esté presente en los actos comunicativos más cotidianos y cercanos, esto no significa que el papel que juega en este tipo de contextos pueda ser considerado menor. Para entender adecuadamente el peso del lenguaje en los procesos de comunicación, sólo tenemos que revisar los elementos que intervienen en este tipo de procesos. (2)

En términos generales, podemos decir que en todo contexto comunicativo en el que se produce un flujo o una transmisión de información pueden identificarse, por un lado, una serie de elementos (el emisor, el mensaje1, el contenido informativo, el transmisor, la señal emitida, el canal de comunicación, la señal recibida, el transmisor inverso, el mensaje2, el receptor, la situación, el contexto, el código y el feedback) dotados de unas funciones determinadas y, por otro lado, un factor de disfunción (la fuente de ruido).

En concreto, este proceso puede describirse de la siguiente manera. El emisor (la fuente de información, el elemento del que parte el proceso comunicativo, y que se caracteriza por su intención de transmitir cierta información a un receptor), selecciona un mensaje concreto o una cadena de mensajes (una información determinada, en definitiva, a la cual nos referiremos utilizando la expresión "mensaje1") de entre un conjunto de mensajes posibles (o de cadenas de mensajes posibles).

En el caso de la comunicación humana, el emisor actúa a su vez de transmisor encargándose de transformar o traducir, a partir del conocimiento de una lengua, ese mensaje produciendo para ello una palabra o un enunciado (señal emitida) que a la postre es la que será transmitida. Esta señal emitida debe transportar la información que coincide con el mensaje1. Para que esa operación tenga éxito, el producto de la traducción, la señal emitida, debe ofrecerse de acuerdo con un código y en sintonía con cierto contexto.

Un código no es más que un sistema de señales gobernadas por un conjunto de reglas que determinan cómo y en qué contextos las señales pueden ser usadas y combinadas para transmitir información. Cualquiera de las lenguas naturales que hablamos (catalán, castellano, inglés, etc.) con sus reglas sintácticas y semánticas puede ser considerada como ejemplo de código. El contexto, en cambio, debe identificarse como el conjunto de señales que ya han sido trasmitidas anteriormente y que preceden a la señal emitida.

La señal emitida circula por el canal de comunicación, adecuándose al mismo y partiendo desde el transmisor. El canal no es más que el medio material cuya alteración permite esa transmisión de la señal emitida. El aire (cuando hablamos en persona con alguien), el papel (cuando escribimos a alguien) o el cable telefónico (cuando conversamos utilizando un teléfono) son ejemplos de canal de comunicación.

La señal emitida llega a través del canal al transmisor inverso. Cuando alcanza esa posición pasamos a denominarla señal recibida. Esta señal recibida acostumbra a coincidir con la señal emitida. El transmisor inverso (una especie de transmisor con la función comunicativa invertida) se encarga de descodificar, transformar o traducir esa señal recibida y convertirla en el mensaje2. Recordemos que este mensaje2, si no se ha producido nada que altere el proceso, coincide con la información que transporta la señal recibida, con la transportada por la emitida y, por tanto, con el mensaje1. Para que esa operación tenga éxito, el producto de la traducción, la señal emitida, debe ofrecerse de acuerdo al código (la lengua utilizada) y en sintonía con el contexto. El receptor, destinatario último del proceso comunicativo y que en el caso de la comunicación humana coincide con el transmisor inverso, recibe e interpreta esa señal final, experimentando cierto efecto a partir de esa información surgida originalmente del emisor y que se ha mantenido a lo largo de toda la cadena de elementos.

Además, en todo contexto comunicativo es posible identificar también otros elementos: la situación y el feedback. La situación debe entenderse como todo el entorno espacio-temporal en el que se produce la comunicación. El conocimiento de la misma también contribuye a la correcta actuación comunicativa del emisor y a la correcta interpretación por parte del receptor. El feedback o la retroalimentación debe identificarse como la respuesta del receptor, dirigida hacia el emisor, respecto al efecto que le produce la información que recibe.

Por último, hemos de señalar que, desgraciadamente, en muchas ocasiones, el proceso global de la comunicación que acabamos de describir no se produce tal y como esperábamos. En algunas situaciones concretas interviene una fuente de interferencias, distorsión o ruido que produce una diferencia significativa entre la señal original emitida por el transmisor y la que finalmente recibe el receptor. Esta diferencia entre las señales provoca que el contenido informativo que llega al receptor no coincida con el que originariamente fue seleccionado en la fuente de información o emisor, con lo que se frustra el proceso o el intento comunicativo.

Ahora, una vez que hemos introducido los elementos que conforman un contexto comunicativo, el papel crítico del lenguaje en todo el proceso parece claro. Para que se produzca realmente comunicación, el transmisor (o emisor, ya que es éste el que desarrolla esta función) debe representar adecuadamente la información utilizando un código (una lengua), una situación y un contexto (para acabar de dotar de sentido a la representación) que, a su vez, sean compartidos también por el transmisor inverso (o receptor, ya que es éste el que realiza esta tarea). El incumplimiento de este requisito puede provocar que la información original (o mensaje1) no se corresponda con el mensaje2, no alcanzándose de esta manera el objetivo de este tipo especial de comunicación: transmitir cierto contenido informativo desde el emisor al receptor.

Sin embargo, el papel del lenguaje en la comunicación puede explicarse también en términos gramaticales. Y es que, dejando al un lado el tema de la pragmática, podemos afirmar que existen dos tipos de propiedades gramaticales que permiten que el lenguaje pueda utilizarse en contextos comunicacionales donde se produce transmisión de información: alguna de sus propiedades sintácticas (derivadas de las relaciones que se producen entre los signos de ese lenguaje) y ciertas propiedades semánticas (derivadas de las relaciones que mantienen esos signos con los objetos que representan).

Comencemos describiendo esas propiedades sintácticas. Los lenguajes (naturales) se encuentran formados por un conjunto de símbolos que recibe el nombre de "léxico de la lengua". Algunas combinaciones de esos símbolos dan lugar a ciertas unidades sintácticas mínimas (unidades sintácticas significativas del lenguaje) con las que los usuarios de ese lenguaje pueden llevar a cabo una acción lingüística (transmitir información, expresar una opinión, dar una orden, etc.). La principal propiedad sintáctica que poseen estas unidades es la de ser gramatical o estar correctamente formada. Y es que todas las unidades sintácticas significativas del lenguaje son combinaciones de símbolos correctas o gramaticales, pero no todas las combinaciones de símbolos son unidades sintácticas significativas del lenguaje y, por tanto, gramaticales.

Esta propiedad de ser gramatical se caracteriza por ser sistemática y a la vez productiva (García-Carpintero, 1996). Se trata de una propiedad sistemática ya que el conjunto de entidades que poseen la propiedad (el conjunto de combinaciones de elementos del léxico que están bien formadas o son gramaticales, en definitiva) se encuentra determinada por una serie de reglas. La productividad de la propiedad sintáctica consiste, en cambio, en el hecho de que se aplica sobre un conjunto infinito de entidades.

Pasemos ahora al ámbito de la semántica. Para abordar este campo vamos a acotar el territorio de nuestra investigación distinguiendo, de entre todas las unidades sintácticas mínimas (unidades sintácticas significativas del lenguaje) con las que los usuarios pueden llevar a cabo toda clase de acciones lingüísticas (transmitir información, expresar una opinión, dar una orden, etc.), un tipo especial de unidad: los enunciados.

Los enunciados son aquellas combinaciones de símbolos utilizadas por parte de los usuarios exclusivamente para realizar ciertos actos lingüísticos específicos: las aseveraciones. O dicho en otros términos, los enunciados son aquellas unidades sintácticas significativas del lenguaje sobre las cuales cabe preguntarnos la verdad o la falsedad de su contenido. La principal propiedad semántica que poseen los enunciados y que también se intenta recoger a través de una gramática es la de expresar una proposición o poseer un contenido susceptible de ser verdadero o falso.

Como ocurría en el caso de la sintaxis, esta propiedad de expresar una proposición se caracteriza también por ser sistemática y a la vez productiva. Se trata de una propiedad sistemática ya que la proposición que expresa un enunciado se encuentra siempre determinada por el contenido semántico de las unidades significativas menores que lo conforman. En cambio, la productividad de la propiedad semántica consiste en el hecho de que se aplica sobre un conjunto infinito de entidades.

3. El lenguaje de interrogación en la recuperación de información

La evolución cultural y tecnológica que hemos protagonizado en la segunda mitad del siglo pasado, no solo nos ha permitido construir conocimiento a partir de la transmisión de información que se produce como fruto de la comunicación directa entre las personas, sino que también ha habilitado la creación de nuevo conocimiento a partir de otra operación cercana pero no coincidente: la recuperación de información.

Estrictamente hablando, la recuperación de información no puede ser identificada como un tipo especial de contexto comunicativo. Los procesos de recuperación no están protagonizados directamente por personas, sino que se establecen entre una persona y un recurso tecnológico (un sistema de información). Sin embargo, dentro de estos procesos el lenguaje (un lenguaje especial: el lenguaje de interrogación) también continúa teniendo un papel crítico.

Desde hace aproximadamente una década, sobre todo desde la implantación de internet y la popularización de los sistemas de gestión de bases de datos, las operaciones de recuperación de información son cada día más habituales y cotidianas. Los usuarios acostumbramos a recurrir a los sistemas de almacenamiento y recuperación de información (o sistemas de información: "SI", a partir de ahora) con la intención de satisfacer nuestras necesidades informativas. En términos generales, podemos definir este tipo de necesidades como esa clase especial de estados mentales o psicológicos que posee un individuo y cuyo contenido es identificable con un tipo de insatisfacción, curiosidad o disconformidad informativa.

Normalmente, materializamos y representamos estos estados mentales mediante el enunciado de un lenguaje natural (castellano, catalán, inglés, etc.). Desgraciadamente, los SI no acostumbran a entender, por así decirlo, esas peticiones o consultas de información realizadas a partir de los enunciados de un lenguaje natural. Por esta razón, si queremos obtener una respuesta por parte del SI que nos permita satisfacer nuestra necesidad informativa, hemos de transformar esa formulación de manera que el sistema pueda entenderla.

Para cubrir ese objetivo, en una primera fase se realiza un análisis conceptual de la consulta y en la segunda se establece, teniendo en cuenta ese análisis, la traducción de ese enunciado de la lengua natural a un lenguaje determinado accesible para el SI. El lenguaje en cuestión se denomina "lenguaje de interrogación", y el resultado que obtenemos en este lenguaje mediante la traducción recibe el nombre de "ecuación de búsqueda".

Finalmente, tras la traducción, se compara (3) la ecuación de búsqueda con las representaciones de los documentos obtenidas a partir de un proceso de indización (Lancaster, 1992), y se recuperan aquellos documentos cuya representación se ajuste a esa ecuación de búsqueda.

El objetivo principal de todo el proceso es recuperar aquellos documentos que se ajusten de la manera más adecuada a la necesidad de información originaria, es decir, realizar una recuperación de información en la que, en el mejor de los casos, el ruido (conjunto de documentos que son recuperados por el SI a partir de la ecuación de búsqueda pero que no se adecuan a la necesidad de información originaria) y el silencio (conjunto de documentos que no son recuperados por el SI a partir de la ecuación de búsqueda pero que sí se adecuan a la necesidad de información originaria) sean, hablando en términos conjuntistas, igual al conjunto vacío.

Como se desprende de todo esto, el tema del conocimiento y el manejo del lenguaje de interrogación se presenta como una herramienta primordial e imprescindible para toda persona, no sólo profesionales, que quiera beneficiarse, en un sentido amplio, de todo el torrente de flujo informativo que nos ofrecen los SI. Y es que un usuario que se acerque a un SI con la intención de satisfacer una necesidad informativa no podrá extraer todos los beneficios que potencialmente se le brindan a no ser que, entre otras cosas, sepa entenderse adecuadamente con el sistema, que se dirija a éste utilizando la misma lengua, o dicho en otros términos más técnicos, que conozca de manera adecuada el lenguaje de interrogación y las ecuaciones de búsqueda que lo constituyen.

En el apartado anterior pudimos describir los dos tipos de propiedades gramaticales que permiten que el lenguaje natural pueda utilizarse en contextos comunicacionales donde se produce transmisión de información. En la misma línea, pero ahora en el escenario de nuestros intercambios con los SI, cabe preguntarse cuáles son las propiedades gramaticales que permiten (al menos en parte) que un lenguaje de interrogación intervenga adecuadamente en una operación de recuperación de información. El aprovechamiento y la adaptación de las ideas del apartado anterior al contexto del lenguaje de interrogación nos pueden dar la respuesta.

Comencemos primero señalando que, al igual que el resto de los lenguajes, el lenguaje de interrogación (LI, a partir de ahora) que utilizan los SI se encuentra formado por un conjunto de símbolos que podemos identificar como el "léxico del LI". Este conjunto suele estar constituido, a su vez, por un conjunto de términos y por los operadores booleanos [AND], [OR] y [NOT]. (4) Este lenguaje contiene además dos signos de puntuación: ")" y "(".

Al conjunto de símbolos formado por el léxico del LI y los signos de puntuación lo vamos a denominar "alfabeto del LI". Ningún otro símbolo que no se encuentre comprendido entre los que acabamos de señalar puede considerarse como perteneciente al LI.

Teniendo en cuenta todo esto, pasemos ahora a abordar el ámbito de la sintaxis. Como en el resto de los lenguajes, algunas sucesiones de símbolos del alfabeto del LI dan lugar a las unidades sintácticas significativas del LI. La principal propiedad sintáctica que poseen estas sucesiones de símbolos es justamente la de ser una ecuación de búsqueda (sergramaticales, estar correctamente constituidas) y diferenciarse, de esta manera, de aquellas sucesiones que no lo son.

Y es que todas las ecuaciones de búsqueda son sucesiones gramaticales de símbolos del alfabeto del LI, pero no todas las sucesiones de símbolos de ese alfabeto son ecuaciones de búsqueda y, por tanto, gramaticales.

De la misma manera que en el caso de las oraciones de los lenguajes naturales, esta propiedad de ser una ecuación de búsqueda se caracteriza por ser sistemática ya que el conjunto de entidades que poseen la propiedad (el conjunto de sucesiones de símbolos del alfabeto de LI que son ecuaciones de búsqueda o son gramaticales, en definitiva) se encuentra determinado por una serie de reglas.

La misma propiedad sintáctica de la gramaticalidad se caracteriza también por ser productiva, ya que se aplica sobre un conjunto infinito de entidades. O dicho en otros términos, debe considerarse como una propiedad productiva ya que el conjunto de sucesiones de símbolos del alfabeto del LI que son ecuaciones de búsqueda es infinito.

Pasemos ahora al ámbito de la semántica. Para abordar este campo vamos a poner de manifiesto en primer lugar que los usuarios utilizamos las ecuaciones de búsqueda para llevar cabo una única acción lingüística: realizar una aseveración. En concreto, un usuario del LI, al proponerle una ecuación de búsqueda al SI, lo que pretende es expresar o definir por comprensión (5) cierto conjunto de documentos que quiere que el SI recupere y le permita consultar para satisfacer una necesidad de información original. En este sentido, la principal propiedad semántica que poseen las ecuaciones de búsqueda es la de expresar o definir un conjunto de documentos.

Por último, nos queda señalar que, de la misma manera que ocurría en el caso de los enunciados de los lenguajes naturales, esta propiedad de expresar un conjunto de documentos se caracteriza por ser sistemática ya que el conjunto que expresa o define toda ecuación de búsqueda depende sistemáticamente del contenido semántico de las unidades significativas menores que la constituyen. La misma propiedad semántica se caracteriza también por ser productiva ya que se aplica sobre un conjunto infinito de entidades: como existe un conjunto infinito de ecuaciones de búsqueda, el conjunto de entidades que poseen la propiedad semántica, que expresan un conjunto de documentos, es también infinito.

4. Bibliografía

(1) Los resultados que aparecen en este trabajo se integran dentro del proyecto de investigación KAIMI (Knowledge Assets Identification and Methodology of Implementation in Organizational Knowledge Management) que se está desarrollando gracias a la financiación económica del IN3 (Internet Interdisciplinary Institute) de la Universitat Oberta de Catalunya.

(2) Para introducir todos estos elementos vamos a recuperar algunas de las ideas defendidas por Shannon y Weaver en su famosa Teoría Matemática de la Comunicación. Teniendo como objetivo la claridad expositiva, nos hemos tomado la libertad de realizar pequeñas adaptaciones y modificaciones sobre esas ideas y completarlas con una serie de elementos (la situación, el contexto, el código y la noción de feedback) que no son contemplados por estos autores.

(3) Para introducirse en los principales estrategias -la conjuntista y la vectorial- mediante las cuales los SI comparan las ecuaciones de búsqueda con las representaciones de los documentos puede consultarse Codina, 1998. De forma general, para introducirse en los modelos y estrategias basados en la similitud semántica utilizados en la recuperación de información puede consultarse Rodríguez, Díaz y Pardo, 1997.

(4) Es importante señalar que, por un lado, aunque puedan contemplarse otro tipo de operadores, para acotar, en este artículo sólo vamos a tratar los booleanos y, por otro lado, que este trabajo está planteado en términos de metacódigo. Esto último significa que aunque en él se utilicen como forma de los operadores booleanos las expresiones "[AND]", "[OR]" y "[NOT]", es posible sustituir estas por cualquiera de sus formas equivalentes.

(5) Definir por comprensión un conjunto es ofrecer las propiedades necesarias y suficientes que dan cuenta de todos y cada uno de los elementos que lo conforman. En cambio, definir por extensión un conjunto es ofrecer el listado de los elementos que lo constituyen. En este sentido, por ejemplo, puedo definir el conjunto A por extensión diciendo que A = {2, 4, 6, 8} o por comprensión diciendo que A = {x: x es un número par menor que 10}.

[8.2.05] [0 comentarios] [#] [lista]

El poder de un folio en blanco

Fuente: Diario de Rawsock, libreXpresion.org
Url documento: http://www.librexpresion.org/...

El examen de hoy ha sido bastante facilillo: solo 2 horas y media de problemas que jamás me habían mencionado, resueltos con un poco de creatividad y un dado de seis caras.

Después de un cafetillo y varios juramentos contra los difuntos del profesor, me he dado un voltio por la biblioteca. En la que ahora mismo estoy, chupando isos de sarge a velocidades absurdas (gracias Rediris) y tratando de estudiar. Justo antes de entrar, me encuentro con un amigo

-"Uff, no veas como esta la biblioteca ... no he podido encontrar sitio"

Raro, yo siempre encuentro. Mira, nada mas entrar hay un par de sitios libres y bien iluminados. Aparto los dos folios en blanco que "reservaban" las mesas a un lado y le ofrezco el sitio a mi colega. Sin fijarme en las miradas asesinas que me dedica media planta y la asustada faz de mi colega.

-"Tio, esas dos estaban pilladas"

Exacto, estaban, pero yo estoy. Exactamente, estoy hasta los cojones de que para un intervalo de tiempo t, mas del 50% de los sitios de la biblioteca estén ocupados por folios, carpetitas de propaganda y demás prendas mientras sus propietarios gandulean por el campus. Tampoco ando por ahí ocupando sitios de gente que se ha ido a mear o a echar un pito. Se nota cuando en un sitio han estado currando recientemente.

El caso mas común es que alguno de los que ronda la mesa haya dejado las prendas ahí para o bien estar mas solito o simplemente tener a los amiguitos cerca "por si vienen".

Sin contar los guiris hablando a toda garganta con el Skype, los móviles, los portacas sin el mute puesto que para colmo escupen los sonidillos de windows. Ah, templo de sabiduría ... raro es el día que no salgo de mala hostia de aquí.

Evolución: hemos pasado de mear y cagar, de los palmotazos en el pecho y el arrastrar ramujos por el suelo a dejar estúpidos folios en blanco para delimitar nuestro territorio. Al menos en lo que respecta a este miniecosistema de aire enrarecido que algunos llaman Biblioteca.

En fin seguiremos con mis problemillas de poesía: Tres tristes triggers INSERTan o UPDATEan columnas en mi Postgres ... la respuesta es obvia: 42

[1.2.05] [0 comentarios] [#] [lista]


Visto y Leído,

Publicación: Blogger | Estadísticas: eXTReMe Tracking

Se recomienda ver este sitio con Mozilla 1+, Firefox 0.8+ ó Netscape 7+. Si no queda más remedio, con IE 6+. Si lo desea, comunique cualquier problema al respecto. También será bien recibida cualquier sugerencia sobre el contenido. La fuente de letra preferente es Georgia.