miércoles, 11 de noviembre de 2015

Deep Web: ¿Qué es?

Si bien Google permite obtener el 90% de los resultados existentes en la Web, lo cierto es que hay algunos elementos que no están al alcance de su buscador. El módulo 4 del MOOC "Encontrando Tesoros en la Web" nos amplía esta información.

La Depp Web o Web Profunda, hace referencia al conjunto de páginas web que, por una u otra razón no están disponibles para el usuario. Hay una taxonomía concreta:

  • La Web Superficial: es aquella a la que accedemos todos los días, producto de la indexación de los sitios web al buscador que estemos usando. Sus caracterísitcas son,
    • Su información no está en bases de datos.
    • No se requiere de un proceso de registro o autenticación para obtenerla.
    • Usualmente cuenta con URL estáticas, de modo que, una vez indexadas, permanecen ubicables por el buscador.
  • La Web Profunda o Invisible - o Deep Web: es aquella información que no se obtiene vía buscadores convencionales, ya que se encuentra almacenada en bases de datos, o bien, no cuentan con URL fija, de modo que ubicación se da por momento y usuario que la encuentra. Luego de su uso, desaparecen sus links de acceso, generándose unos nuevos al momento de conseguirla nuevamente. A partir de este concepto surgen los siguientes,
    • Web opaca: Aquella información que deliberadamente no está disponible o visible. Obedece a razones de indexación incompleta de sitios extensos, la frecuencia de indexación del motor, el número máximo de resultados visibles por búsqueda o URL desconectadas.
    • Web privada: Son páginas indexadas, pero no disponibles por disposición de su creador. Aplica mediante el uso del archivo robots.txt que evita su indexación (en algunos casos), o la inclusión de un campo "noindex" para prohibir su indexación.
    • Web Propietaria: Aquella disponible luego de un proceso de registro en el site correspondiente y,
    • Web Realmente Invisible o No Indizable: son aquellas en las que la información no está disponible debido a problemas técnicos, páginas generadas dinámicamente (a partir de las acciones del usuario) o información almacenada en bases de datos relacionables.
Son ejemplos de recursos para buscar en la web profunda: The WWW Virtual Library, creada por Tim Berners-Lee, el padre de la Web, Infoplease, DeepTouchWeb y Techxtra. te invito a visitarlas y descubrir sus funcionalidades.

No hay comentarios:

Publicar un comentario