Albergue de Náufragos
Web semántica

Todos sabemos que Internet es como una enorme enciclopedia que crece dia a dia con más información. Esto lo sabemos y disfrutamos todos los que nos conectamos a la Red de Redes.

Ahora... a esta esta enorme enciclopedia ¿se la puede usar como base de datos?

Quiero decir: Esa información en línea ¿está ordenada, estructurada, y es legible automáticamente?

Veamos un ejemplo:

Supongamos que está buscando información en Internet sobre una persona específica, pero que tiene un nombre muy común, por ejemplo Juan Perez o José Rodríguez. Este buen hombre puso su sitio web en Internet para vender algo poco original: casas. No tenemos más información, tenemos poco tiempo (o poca paciencia), una conexión a Internet costosa y lenta y un jefe que nos exige resutados urgentes. ¿Qué hace la mayoría de los usuarios en estos casos? Va al sitio de su buscador favorito (Google, Yahoo, Altavista, etc.), escribe "Juan Perez" y espera los resultados...

Es muy probable que nuestro buscador nos indique que "existen 43.286 sitios con la frase buscada" o algo por el estilo. Similar (o peor) resultado obtendremos si buscamos "casas" o si aprovechamos las distintas opciones de búsqueda avanzada de los buscadores, indicándoles que busquen sólo sitios en español en los que se nombre a "Juan Perez" y la palabra "casas".

Y tampoco es que nuestro inhallable objetivo haya hecho miles de páginas propias, sino que nos aparecerán enlaces a páginas de "el modisto Juan Perez nos muestra su casa", "el dibujo animado 'La casa del herrero' del dibujante Juan Perez", "casas hechas con fósforos" con un comentario en el libro de visitas de Juan Romualdo Perez Rodriguez, "en la localidad de Juan Pablo Perez hay una casa embrujada" y cosas similares. ¡Ah! Me olvidaba: obviamente también aparecerán enlaces a fotos pornográficas de Juan Perez y a casinos en línea (aquí uno no sabe el porqué, pero aparecen).

¿Porqué sucede esto? ¿Los buscadores no funcionan bien? No es eso.

Imaginate que a cada página que diseñes le puedas agregar datos adicionales para que pueda ser diferenciada de otras tantas páginas similares. Indicar, por ejemplo, de qué temas trata, tu nombre, la organización a la que perteneces, tus datos personales (o los que quieras compartir), si tu trabajo tiene vencimiento o una duración determinada, países o regiones involucradas, temas relacionados, etc. O vayamos más alla e imaginemos que podemos poner dats adicionales a todas y cada una de las palabras, frases, párrafos, títulos y subtítulos y tablas de nuestra página. O que podemos no sólo hacer un descripción general de las imágenes (con el atributo de HTML alt) sino descripciones específicas de cada elemento que la componen, o brindar información adicional más completa para casos como los de imágenes de museos, incunables, mapas, diagramas, fotos satelitales, etc.

¿Es un sueño imposible? No sólo no lo es sino que el inicio ya está con nosotros desde 1990.

El propio HTML, principalmente en su última versión, la 4.01, permite introducir parte de la información enumerada usando etiquetas como meta, lang y title, aportándonos la posibilidad de verter información adicional en cada página.

Pero llegaremos a un punto en el que nos daremos cuenta que estas opciones no son suficientes para ciertos casos.

¿Qué pasará si deseamos buscar el vuelo más barato que hay entre dos ciudades, en viaje diurno y que el asiento esté del lado de la ventanilla?

¿Y si deseamos dejar a nuestra computadora "trabajando sola", como cuando compila un programa o renderiza una animación, pero esta vez haciendo una búsqueda específica en Internet y que los resultados que vaya obteniendo los procese en una base de datos o una hoja de cálculo?

"¿Que no es posible? Todo es posible en la... ¡Dimensión Desconocida!".

En nuestro caso, la Dimensión Desconocida es una ámbito de investigación y desarrollo en constante evolución llamado Web Semántica, plagado de siglas del tipo XML, RDF, Dublin core, XSLT, RSS, ontologías, metadatos, FOAF, etc.

Pero vayamos por partes...

El problema, según Tim Berners-Lee, creador del HTML y la Web tal como la conocemos, es que la Red está pensada para ser leída por los humanos y no por las máquinas, que no pueden "entender" la mayoría de la información en línea. Y no hablamos sólo de "cosas complicadas" sino de situaciones como encontrar la palabra banco y no saber distinguir entre un lugar para sentarse y una institución encargada de prestar dinero a quien demuestre no necesitarlo.

Ante esto, en 1998, Berners-Lee junto con otros investigadores, propusieron la Web Semántica: una web donde las computadoras no sólo serán capaces de presentar toda la información contenida en la Red sino que, además, podrán "entenderla" y gestionarla en forma "inteligente" o lógica.

O dicho en otros términos, convertir la Web en un elemento maleable para realizar búsquedas más agudas mediante el diseño de bases de datos que puedan cooperar recíprocamente con motores de búsqueda más inteligentes.

El funcionamiento básico de la Web Semántica se basa en la compatibilidad de todos sus datos. Todas las páginas, artículos y servicios conectados deben usar los mismos formatos estándar que puedan ser analizados y "comprendidos" por las computadoras para relacionarlos y mostrarlos a petición.

Estos formatos (1), con los que crearemos nuestras páginas web, incluirán "ontologías" o colecciones de enunciados que definirán relaciones entre conceptos y especificarán reglas lógicas que harán "razonar" a nuestras computadoras.

Juan Carlos Dürsteler en su artículo "La web semántica, hoy" (2) nos dice que "el punto fundamental de la web semántica es la conversión de la estructura actual de la Web como almacén de datos (sólo interpretable por humanos, que son capaces de poner los datos en contexto) en una estructura de almacenamiento de la información".

Ahora ¿cómo lograrlo? Dürsteler nos explica que se tiene que convertir los datos en información "poniéndolos en contexto", es decir, agregar información adicional que le permita a una computadora reconocer a qué áreas pertenecen esos datos y a cuáles no. Es decir, saber si el "banco" que encuentra es para sentarse o para perder dinero, siguiendo el ejemplo anteriormente citado.

Al conjunto de la información adicional que pueda ser comprendida y procesada por una computadora se la llama "semántica" (¡si, al fin descubrimos dónde encaja esa palabra!) y los datos adicionales (o semánticos) que agregamos a cada dato en la Web (para "poner los datos en contexto") se los llama metadatos (literalmente, "datos sobre datos").

Pero esto no termina acá, sino que hay otra palabra nueva que define al conjunto de términos y relaciones que indican que una información pertenece a un conjunto o ambiente determinado y no a otro: ontología. Es decir que una ontología nos dirá que un "banco para sentarse" pertenece a los conjuntos "descanso", "parques, plazas y paseos públicos", "muebles", "materiales: madera, metal, cemento", "diseño", etc., y está relacionado con el descanso, el esparcimiento y varias ideas más (con el afiche de la película Forrest Gump, por ejemplo) (3).

Así que ahora ya tenemos las tres patas sobre las que se construye la Web Semántica: semántica, metadatos y ontologías. Con estas tres ideas podremos describir a las computadoras los significados de lo que hay en la Web y manipularlos.

Para finalizar, tres frases extraídas del artículo "Empresas españolas ayudan a que Internet hable un lenguaje inteligible por ordenador", de Adolfo Estalella, en el diario español El País, suplemento El País Digital del 6/02/2003:

"La tecnología existe, ahora la cuestión es convencer a la gente para que la use" Carlos Serra del Instituto de Investigación en Inteligencia Artificial (CSIC).

"Mantendremos un ojo abierto y, si la cosa da resultado, nos implicaremos" Jack Breese, director de investigación de Microsoft.

"Lo más excitante de la Web Semántica no es lo que podemos imaginar que haremos con ella, sino lo que ni siquiera somos capaces de imaginar que haremos." Tim Berners-Lee.

Volver a la página principal
Volver arriba

Notas al pie

1: XML, RDF, SVG, SMIL, PICS, URI, DTD, COM, PNG, OWL, SAX y otros por crearse. (Volver al texto principal)
2: En la página de la revista digital de InfoVis.net http://www.infovis.net/Revista/2003/num_131.htm . (Volver al texto principal)
3:Para la palabra "banco" como institución financiera, se me ocurre una ontología (recordemos: conjunto de relaciones), pero está influenciada por mi experiencia personal en la crisis del año 2001 en Argentina, así que ahorraré palabras. Pero esto plantea algo interesante en la contrucción de la Web Semántica: ¿quiénes y cómo se crean las ontologías?. (Volver al texto principal)

Ver también

Volver a la página principal
Volver arriba

Derecho de Autor © 2003 Claudio Segovia
Permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia de Documentación Libre GNU, Versión 1.1 o cualquier otra versión posterior publicada por la Free Software Foundation; sin Secciones Invariantes, sin texto de la Cubierta Frontal, y sin texto de la Cubierta Posterior. Una copia de la licencia es incluida en la sección titulada "Licencia de Documentación Libre GNU".

Esta página adhiere a la campaña "Se ve mejor con cualquier navegador - Campaña para un WWW no específico de un navegador (http://www.anybrowser.org/campaign/anybrowser_es.html)".
Por favor, hágame saber si ha encontrado algo en mi sitio que no funcione con su navegador (especifíqueme qué navegador está usando y qué no funcionó) y trataré de arreglarlo.
Se ve mejor con cualquier navegador - Enlace a página de CampañaD

Todos los nombres propios, distintivos, logos, marcas, sistemas, hardware, equipos, etc. que aparecen en estas páginas web enlazando a sitios, son marcas registradas de sus respectivas compañias, empresas, organizaciones y/o propietarios. El hecho que aparezcan no implica ningún tipo de compromiso monetario o moral de dichas organizaciones con el autor de éstas páginas, ya que fueron colocadas por éste por simple gusto personal, como colaboración desinteresada para promocionar dichos sitios.

Webmaster: Claudio Segovia - Buenos Aires, San Justo y Lago Puelo - Argentina
Nacimiento del Albergue: 7 de enero de 1999
Ultima actualización: Jueves 28 de abril de 2007
Dirección de correo electrónico: claudiosegovia@gmail.com

A Ema, Matilde y Cecilia