Etiquetas > recuperación de la información

web semántica y género: cuando las matemáticas vieron a la mujer

beab » 08 August 2008 » en información y comunicación » Sin comentarios

La reivindicación de la aplicación de perspectivas de género en distintos campos del conocimiento no es nada nuevo, más bien al contrario. Cada día se extiende más y esperemos que llegue un día en el que tengamos que dejar de reclamar obviedades, aunque ese día no parezca estar cerca.

Si hace años los hombres decidían si la mujer tenía o no alma (independientemente del grado de verdad que haya en esa historia, el daño ya está hecho) ahora, hombres y mujeres, comparan las capacidades científicas y técnicas de ambos sexos intentando comprender por qué nosotras nos prodigamos tan poco en las carreras técnicas.

Mientras ciertos estudios concluyen que, sencillamente, no estamos interesadas, otros resaltan el peso de los prejuicios y las connotaciones de género que muchas profesiones aún llevan implícitas. El último caso figuraba en un artículo que recogía, entre otras, las opiniones de la psicóloga Janet Hyde:

“Simplemente, ya no existen diferencias de género en el rendimiento matemático”, dice Hyde. “De modo que los padres y los profesores tienen que revisar sus ideas al respecto”.

“Simplemente, ya no existen”, ah, ¿pero antes sí?, “los profesores tiene que revisar sus ideas al respecto”,carmela garcia - constelaciones - musac08 cómo! ¿aún tienen esas ideas?. Al parecer así es, o al menos este es el significado que yo extraigo de las palabras -traducidas, interpretadas por el autor del artículo- de Hyde.

Precisamente esa parte, la del significado y la interpretación de la información, es la que preocupa a Corinna Bath, investigadora que ha centrado su trabajo en el estudio de género y tecnología en el emergente mundo de la web semántica. Una reseña de ReadWriteWeb nos acerca a las interesantes reflexiones de esta investigadora. Corinna, al contrario que los estudios antes referidos, no intenta entender por qué hay una presencia femenina tan baja en las carreras técnicas sino qué papel juega este hecho en la construcción de la web semántica.

En su opinión, las construcciónes simbólicas relacionadas con el género que existen en nuestras culturas se reflejarán en los desarrollos tecnológicos y en el uso que hagamos de estos. No sólo las de género, también las culturales, las políticas, pudiendo condenar al silencio a ciertas minorías. En el caso de la web semántica, esto significa que la arquitectura que sustente la representación del lenguaje, es decir, su significado, tendrá que tener en cuenta qué perspectivas se aplican en su desarrollo para no dejar de lado la experiencia del mundo de otras personas al imponer visiones homogeneizadoras.

Las distintas disciplinas que confluyen en Corinna y sus actuales investigaciones puedan quizás aportar nuevas perspectivas al desarrollo de las tecnologías de la información y a la forma de representar el conocimiento:

Since I was trained in math and logic I feel a strong fascination by attempts to formalize the world. Particularly I am interested in technologies such as human-like machines, emotional interfaces and semantic technologies that might change how we will think, feel and interact socially. Feminist theory, however, taught me that we are all responsible in creating “liveable worlds” (Donna Haraway). I hope that I can contribute to this aim by exploiting my competences of translating between computer science and the humanities.

Seguir leyendo...

Tags: , , , , , ,

busco una foto que se parezca a esta y en tonos azules

beab » 22 May 2008 » en Uncategorized » Sin comentarios

Eso es lo que me gustaría decirles a los buscadores de los bancos de imágenes cuando estoy buscando una foto recurso para ilustrar un texto. Pero a parte de las excepcionales opciones de búsqueda de Getty Images que me permite buscar ”más como esta”, el resto de servicios me hacen perder bastante el tiempo hasta dar con la imagen que represente el concepto concreto que quiero ilustrar.

Por una parte es normal, es algo que viene de antiguo, la subjetividad que aplicamos a la hora de interpretar las imágenes y, por lo tanto, de describirlas para después recuperarlas, pero no deja de ser frustrante el tiempo que puedes llegar a invertir. Y esto es especialmente sangrante cuando buscas en servicios de web social como Flickr (al que he recurrido a menudo) donde cada uno aplicamos nuestro criterio como nos parece.

Por eso me han gustado tanto las pruebas con Xcavator, un portal mantenido por una compañía de San Francisco (para variar) que ha patentado una tecnología de reconocimiento inteligente de imágenes. El software de Xcavator utiliza los bancos de imágenes de Fotolia, Istokphoto, 123RF y Luckyoliver (sorprendentemente sin servicio en la actualidad…).

Las opciones de búsqueda, además de la tradicional por palabra clave, incluyen la posibilidad “semihumana” de encontrar algo que se parezca (con la opción ”match), especificar un color predominante o añadir algunos de los conceptos sugeridos por el propio buscador. Lo que viene después es bastante similar a otros bancos de imágenes: podemos añadir las imágenes que más nos gusten al lightbox, enviarlas a otra persona para que nos dé su opinión y, si nos convencen, comprarlas en cualquiera de los cuatro servicios proveedores de imágenes (no sé cómo lo hará con luckyoliver…).

Las imáges son el resultado de una búsqueda con el término ”risk”, que he querido restringir a los juegos de azar, con un color verde oscuro, casi negro, predominante y añadiendo por último el término sugerido ”luck”:

imagen-5.png imagen-6.png imagen-dad.png imagendd.png

Seguir leyendo...

Tags: , , ,

el reader más rápido

beab » 06 December 2007 » en Uncategorized » Sin comentarios

Aprovechando el puente he estado haciendo limpieza de suscripciones y poniendo un poco de orden. Como me gustó poder ver el blogroll de artesaniaenred en bloglines, he recuperado mi olvidada cuenta de este lector en línea y he incorporado allí todos los feeds que sigo (y ya de paso he quitado algunos que ya no me aportaban gran cosa…).

El resultado me ha gustado mucho, tanto que he eliminado todas las suscripciones de google reader y exportando las de bloglines lo he vuelto a llenar de contenido (la verdad es que no acabo de decidirme por uno u otro lector así que iré probando con los dos hasta que la costumbre me señale la mejor elección :)

Así que ahora tengo dos listados de suscripciones iguales en google reader y en bloglines pero google ha demostrado ser más rápido que bloglines al recoger las novedadesr: un post enviado a las 4.40 aparecía en google reader a las 4.41 mientras que en bloglines (ahora son las 4.46) todavía no aparece, ni al refrescar el canal…

Como siempre, otros pasaron antes por aquí…

Aunque la aparición de la versión beta puede hacer volver a muchos…o no…

Seguir leyendo...

Tags: , ,

Gestión del conocimiento y Arquitectura de la Información en la e-week

beab » 11 November 2007 » en Uncategorized » 2 comentarios

Esta semana ha tenido lugar la cuarta edición de la e-week de Vic, dedicada a los contenidos digitales, y he podido asistir a distintas presentaciones y mesas redondas, unas dedicadas al mundo de la empresa (comercio electrónico, e-factura, gestión de procesos con bpm, gestión del conocimiento) y otras dirigidas a la recuperación de contenidos digitales (arquitectura de la información).

A pesar de que los tremas tratados han sido muchos y variados, me ha gustado encontrar una serie de puntos en común entre ellos, especialmente entre la gestión del conocimiento y la arquitectura de la información:

  • el punto de inicio es la detección de necesidades (de información y de conocimiento)
  • el usuario es el centro de ambas: la gestión del conocimiento ha de adecuar la información al usuario y la arquitectura de la información ha de plantear una estrategia de acceso y recuperación de estar información también de acuerdo con el tipo de usuario al que se dirija.

Ambas disciplinas tienen como objeto de trabajo la información, aunque con objetivos distintos:

  • Recuperación de la información (en el caso de la Arquitectura de la Información)
  • Desarrollo de la innovación y de las capacidades de los usuarios (en el caso de la gestión del conocimiento)

ARQUITECTURA DE LA INFORMACIÓN (AI)

Según la definición que presentó en la jornada del viernes Yusef Hassan, la AI es una disciplina destinada a personas para que puedan acceder a la información. El proceso que se establece entre la información y las necesidades informativas de las personas es un proceso de equivalencia, aunque no es una equivalencia auténtica (al menos de momento), sino que está mediatizada por la necesidad de representación:

Equivalencia de reperesentaciones

La representación de la información se realiza mediante metadatos, que pueden generarse automáticamente o manualmente, mientras que la representación de las necesidades informativas del usuario se realiza mediante la consulta. Esta consulta puede realizarse mediante búsquedas (querying), cuando se trata de necesidades concretas, o mediante navegación (browsing), cuando se trata de necesidades generales.

la tarea de la recuperación de la información

Es en esta representación de las necesidades informativas en las que el usuario es predecible y la que justifica uno de los requisitos para el arquitecto de la información: conocer la actividad en la que se enmarca la tarea de recuperación de la información del usuario para diseñar adecuadamente los mecanismos que permitirán realizar las operaciones encaminadas a acceder a la información. Este conocimiento debe estar presente en el momento de plantear el diseño web.

Esquema del proceso general de la AI

  • Conocer a la audiencia para determinar los requerimientos y necesidades
  • Estructura del sitio web
  • Esqueleto de la interfaz
  • Aspecto visual e implementación

El primer paso puede realizarse con distintas técnicas de estudio (entrevistas, focus grup, estudio de usuarios, card sorting…), mientras que los otros tres configuran el grupo de ‘’entregables’’ o documentos en los que se plasmará el diseño del sitio web:

  • Árbol de contenidos para representar la estructura del sitio
  • Wireframes para el esqueleto de la interfaz
  • Maquetas para el aspecto visual y la implementación

GESTIÓN DEL CONOCIMIENTO

La gestión del conocimiento podría considerarse un paso posterior, aunque también simultáneo en determinadas etapas, al trabajo de la AI. La gestión del conocimiento se centra en las personas y sus capacidades intelectuales, en sus neuronas, y trata de crear un ecosistema informativo adecuado a los distintos tipos de inteligencias para convertir la información en conocimiento y dar lugar a la innovación y el desarrollo.

Ricard Jiménez, del Centro Tecnológico ASCAMM, es un físico e investigador que se dedica a proyectos de transferencia tecnológica del conocimiento en el sector industrial. La presentación que realizó sobre el conocimiento partía de la premisa de que el conocimiento se encuentra en las personas, no en ninguna herramienta, y que son sus neuronas las que realizan un proceso químico, fisiológico, de transferencia de conocimiento con el entorno. Pero para que esto se produzca se requiere lo mismo que en un laboratorio: los elementos y sustancias adecuados que reaccionen al contacto de unos con otros.

Para poner en marcha este proceso, el ASCAMM, sigue una serie de pasos:

  • Detectar las necesidades
  • Identificar las áreas de conocimiento implicadas
  • Consultar en el entorno académico cuál es la naturaleza y las características de esa disciplina en la que se enmarcan las necesidades de conocimiento
  • Enlazar el mundo académico y el empresarial para implementar las soluciones de I + D.

La información será el combustible de este proceso que ponga en marcha la gestión del conocimiento y que irá unido a otra actividad denominada ingeniería del conocimiento que se ocupa de las herramientas, las redes sociales, los esquemas de sistemas expertos…

La parte de las herramientas y los sistemas expertos fue tratada por Albert Esplugues, representante del Centro de Innovación y Productividad de Microsoft. En su presentación, organizó las herramientas en función de su utilidad:

  • Almacenar
    • Gestor documental
    • ECM
    • Blog
    • Wiki
    • Tinta digital
    • Plantillas
  • Buscar
    • Buscador corporativo
    • Relevancia social (sistemas de puntuación de los usuarios)
    • Redes sociales
    • Lenguaje Natural
    • Robots de mensajería instantánea
    • Inteligencia de negocio
  • Acceder: ubicuidad
    • Mensajería instantánea
    • E-learning
    • Mobile search
  • Facilitar
    • Espacios colaborativos
    • Portal del trabajador
    • Mensajería instantánea
    • Correo electrónico

Y ofreció lo que consideraba las claves para la gestión del conocimiento:

  • Cultura corporativa para compartir información
  • Apoyo estratégico de la dirección
  • Facilidad de uso de las herramientas
  • Formación continua

Herramientas para la gestión del conocimiento

También vimos ejemplos de herramientas prácticas para llevar a cabo la gestión del conocimiento como Knowledge Network solution, un agente inteligente que se instala en el ordenador local y analiza todo el contenido de los emails del usuario. A partir de este análisis, el programa elabora un listado de términos que representan los temas en los que el usuario es experto y las personas que configuran su red de contactos. El usuario puede editarlo para ajustar el análisis a la realidad y después publicarlo en una base de expertos que establecerá las relaciones entre personas e intereses.

Otra manera de crear estas redes de expertos es solicitando a los empleados que indiquen en qué áreas están especializados y después recogiendo toda esa información en un lugar común. Este es el ejemplo que nos mostraron los representantes de BITA, el portal de la innovación y el conocimiento de CETaqua, dependiente del grupo AGBAR. En este portal, además de la expertis de los empleados, se ofrece el acceso a todas las revistas suscritas digitalizadas mediante OCR, a un listado de seminarios y jornadas con la posibilidad de conocer quién ha asistido a estos eventos y poder entrar en contacto con ellos, una banco de imágenes con recursos gráficos relacionados con la empresa y sus actividades, y una sección de novedades en convocatorias y normativa oficial.

Ricard del ASCAMM nos habló también de la implementación de un agente inteligente, un broker del conocimiento, que a medida que el usuario escribía sobre un tema, el robot buscaba en unas bases de datos determinadas y le sugería al usuario una serie de informaciones que podrían interesarle. Algo así como las sugerencias de Amazon pero ‘life’.

Por último, para acabar enlazando con el principio de este post tan concentrado (aunque no lo parezca por su extensión…), nos mencionaron una solución que implementó el ASCAMM hace unos años para facilitar el acceso a la información de los usuarios. En lugar de describir los documentos que iban añadiendo al sistema de gestión documental, crearon un robot semejante a google que recuperaba las informaciones a la vez que iba construyendo la taxonomía de la colección documental a partir de las expresiones de consulta utilizadas por los usuarios.

De esta forma, el acceso a los documentos se realizaba siempre a través de términos que hubieran empleado los usuarios para recuperarlos, aunque me hubiera gustado más poder profundizar en cómo se construía exactamente esta taxonomía, ver una parte del resultado y conocer indicadores sobre su utilidad. Quizás la próxima vez…


Las mismas jornadas desde otros puntos de vista…

Seguir leyendo...

Tags: , , , , , ,

¿qué es la vida? ¿y qué tiene que ver con la teoría de la información?

beab » 11 October 2007 » en tiempo para leer » Sin comentarios

¿qué es la vida? Erwin Schrödinger

Schorödinger, E. (2006). ¿Qué es la vida?. Barcelona: Tusquets.

Podríamos decir que esta pregunta está en la herencia genética de nuestra especie pues ha pasado de generación en generación convirtiéndose en el tema central de disciplinas como la filosofía o pilares existenciales como la religión o la cultura, según el momento que elijamos.

Si elegimos el principio de la década de los ‘40, más exactamente el año 1943, nos encontramos a Erwin Schrödinger, físico austrico ganador del premio nobel en 1933, dictando (como se decía entonces) unas conferencias en el Trinity College de Dublin, haciéndose la misma pregunta, ¿qué es la vida?, e intentando demostrar si la física y sus leyes (principalmente las derivadas de la termodinámica y la mecánica cuántica) podían ofrecer una respuesta.

Aunque son cosas que no deben hacerse, voy a revelar el final del libro sin que eso sirva como excusa para no leerlo (no dura ni una tarde y su lectura resulta apasionante).

Uniendo conceptos de la física y la biología, moléculas y genes, y aplicando el concepto de entropía termodinámica que mide el grado de desorden de las moléculas (genes) que integran un cuerpo, afirma que la vida es un intercambio de entropía entre el cuerpo y el exterior. La tendencia del grado de entropía de la materia es siempre positiva, siempre tiene a un mayor grado de desorden y eso, en el caso de los seres vivos, significaría la muerte, el grado de entropía máxima. Para compensar esta tendencia, los seres vivos, toman entropía negativa del entorno, es decir, toman orden, para mantener un nivel estacionario de entropía, de orden.

¿y qué tiene que ver con la teoría de la información?

Empezaremos por lo evidente. El intercambio de orden y desorden para mantener un sistema es uno de los aspectos evidentes. A mí me recuerda bastante al trabajo de documentalistas, bibliotecarios, gestores de la información en general y más ahora en la realidad tecnológica en la que nos enmarcamos.

Otro aspecto relacionado es el término entropía, que también tiene una acepción propia para el campo de la teoría de la información. También denominada entropía de Shannon en honor a su descubridor, tiene mucho que ver con la tendencia al desorden y la incertidumbre en la recuperación de la información, y las probabilidades de que aparezcan los elementos que se buscan.

Una de las afirmaciones de esta teoría es que “si todos los elementos de la señal son equiprobables a la hora de aparecer, entonces, la entropía será máxima“. Este estado de entropía máxima (equiparable a la muerte en los seres vivos según Schrödinger) de la información es lo que los profesionales de la información intentan mediante sus investigaciones en el campo de la recuperación de la información: si todas los datos o informaciones tuvieran las probabilidades de aparecer no se cumplirían los requisitos de relevancia y exhaustividad que debe cumplir cualquier sistema de RI.

Por último, otra relación entre la vida vista por Schrödinger y la teoría de la información, está en la descripción que hace del ciclo de la mitosis celular. En este proceso, las células se dividen en otras células completamente idénticas duplicando la información, en este caso genética contenida en el ADN, y es así como se lleva a cabo el crecimiento de un organismo. Enunciado a modo de palabras clave: compartir información, organismo, crecimiento…encontramos otra clave de la teoría de la información, especialmente cuando se acerca a la teoría del conocimiento colectivo (internet, redes sociales, folksonomías, wiki…)

En resumen…

Sería gracioso poder afirmar con respaldo científico que los gestores de la información somos la esencia vivificadora de los datos y la información, de los documentos, introduciendo orden para compensar la tendencia hacia la entropía positiva, y asegurándonos de que la información se transmita completa, manteniendo su integridad, para que el organismo (social, se entiende) puede crecer de manera eficaz…

 

Seguir leyendo...

Tags: , , ,

¿para cuándo un Hall o un Icarus que interpreten las funciones inferenciales del lenguaje?

beab » 19 June 2007 » en Uncategorized » Sin comentarios

Uno de los motivos del nombre de este blog es el papel que juega el lenguaje como herramienta en nuestro trabajo; la indización, la clasificación, la recuperación de información, la descripción de documentos y contenidos… todo está dominado por el lenguaje por lo que el acceso a la información y a los documentos pasa necesariamente por la interacción con la lengua, y este es uno de los mayores quebraderos de cabeza de nuestra profesión.

Hace unos días Catuxa publicaba una referencia a la obra de Erica Menchen, ‘’The trouble with folksonomy (the terme)’’, y lanzaba una reflexión entre la diferencia del tagging de autor y el tagging de lector, un dilema al que nos enfrentamos los documentalistas en el momento de definir un sistema de información que quiera recoger el punto de vista del usuario e incorporar su punto de vista al sistema.

Por otro lado, en la cocina de los bits se abría una puerta a otro frente de la documentación y el lenguaje: el procesamiento del lenguaje natural para la recuperación de la información. Este objetivo es compartido por los sistemas de etiquetado social, la creación de puntos de acceso a la información desde distintos puntos de vista. Pero la lectura de ambos post revela otros puntos de encuentro entre el tagging social de autor y lector y el PLN.

La última entrega del ciberchef nos ilustra en el concepto de la pragmática y su doble visión de ‘’referencia e inferencia’’. La primera podría identificarse con el tagging de autor, mejor dicho, el tagging del documentalista que relaciona ‘’el código y el mensaje estrictamente mediante el código lingüístico’’. La segunda, la inferencia, equivaldría al tagging de lector que por su organicidad, por su supuesta falta de sistematización, requeriría una ‘’aclaración por parte del emisor’’.

El problema o, mejor dicho, el reto del ligüísta computacional y el del documentalista que se plantea habilitar la posibilidad de etiquetado para los lectores es el mismo: cómo traducir el lenguaje del usuario a la lógica de la máquina, aunque las aproximaciones de cada uno de ellos sea completamente diferente.

Mi experiencia personal me dice que, desde el puesto de los documentalistas, no acabamos de fiarnos del usuario o, visto de otro modo, de la máquina para entender al usuario, así que preferimos centralizar la creación del lenguaje, ser referencistas e intentar reducir las posibles inferencias de los usuarios.

Este dilema se nos presentó recientemente en el momento de diseñar una intranet coorporativa que incliría un sistema de publicación de noticias a la manera de un blog y, por lo tanto, tendría la posibilidad de asignar etiquetas. Sin embargo, todas las propuestas acababan en un sistema de lenguaje controlado porque no se confiaba en la capacidad de los usuarios para realizar esta tarea.

Buscando referencias sobre el tema encontré un interesante artículo, antiguo ya, de la intranet de IBM. Después de varios años utilizando la intranet coorporativa como medio de comunicación y acceso a la información, con una taxonomía de casi 4000 términos, decidieron habilitar el sistema de etiquetas para los usuarios y crear así una folksonomía de la organización. El sistema resultante se bautizó como Dogear y les permitió localizar clusters de conocimiento dentro de la propia organización. Lo interesante de la experiencia (en la línea de lo apuntado por Catuxa) es , además de hacer emerger focal points de conocimiento tácito, la convivencia de ambos sistemas, el etiquetado social y la taxonomía, la inferencia y la referencia, para enriquecer el sistema.

La incorporación de los usuarios a la creación, desarrollo y evolución de los sistemas de información es ineivtable, imprescindible y, desde mi punto de vista, muy deseable. Y todo ello pasa, en gran parte, por el conocimiento del lenguaje, de los lenguajes y de su comportamiento, ahí es nada!

Más información sobre Dogear y las folksonomías en las intranets:

Seguir leyendo...

Tags: , , , ,