Herramientas para la búsqueda de información: Internet invisible

Por , febrero 3, 2011 10:34 am

La siguiente información pertenece al boletín informativo del INFD http://cedoc.infd.edu.ar/index.cgi?wAccion=news&wid_news=131

Los motores de búsqueda tradicionales de Internet no localizan el contenido de la Web “profunda”; incluso los más potentes como Google, que superan los doscientos cincuenta millones de páginas, no indican más allá del 50% de la Red. En esta oportunidad abordamos la temática de la Internet Invisible.

Los buscadores rastrean la red con un programa denominado “arañas”, indizando el contenido de las páginas y saltando de una a otra siguiendo los enlaces hipertexto que contienen. Sin embargo, cuando un usuario realiza una consulta, estos programas no pueden indizar o extraer el contenido de esas páginas cuando la información se encuentra en bases de datos, cuya información aparece sólo dinámicamente. Para los motores de búsqueda, esta parte de la información contenida en Internet –o esta “Internet profunda”– les resulta completamente invisible.

Por lo tanto, los motores de búsqueda no localizan el contenido de la Web “profunda”; incluso los más potentes como Google, que superan los doscientos cincuenta millones de páginas, no indizan más allá del 50% de la Red, según las estimaciones más optimistas. 

Que información hay en la Internet profunda

Podríamos agrupar dentro de la Internet profunda, los siguientes documentos:

  • Catálogos de bibliotecas y bases de datos bibliográficas;
  • Bases de datos no bibliográficas;
  • Revistas electrónicas, en las que es necesario un registro previo y de las que solo se puede recuperar la información mediante búsquedas en sus bases de datos;
  • Obras de referencia: enciclopedias, diccionarios… en las que es necesario interrogar a la base de datos para acceder al contenido.

¿Cómo localizar la información?

El CEDOC recomienda en esta oportunidad –aunque no se trata del único sitio-, para localizar la información no accesible a los buscadores tradicionales, el sitio Internetinvisible.com http://www.internetinvisible.com, donde se catalogan 1775 bases de datos en español de acceso gratuito.

Recopila, describe y ofrece el enlace a las bases de datos existentes en Internet en un directorio organizado en grupos temáticos, los cuales se subdividen en materias más específicas.

Cuando accedemos a la web mediante alguuno de sus dos modos de acceso –un directorio temático o un formulario de búsqueda (simple o avanzada)- obtenemos una ficha con la descripción del contenido de la base de datos relacionada, el enlace a la pantalla de búsqueda y la entidad o persona responsable de su creación.

Por otra parte, su par anglosajón –The Invisible Web http://www.invisibleweb.com– reúne, analiza y describe más de 10.000 bases de datos organizadas en un índice temático por categorías y subcategorías. Permite realizar búsquedas simples y avanzadas.

En conclusión, a la hora de realizar determinadas búsquedas habrá que recurrir a otro tipo de instrumentos de recuperación de la información como los que hemos visto, si no queremos quedarnos en la superficie. Recordamos que en forma permanente es posible encontrar estos recursos para la localización de información en el CEDOC, en la sección Servicios / Herramientas para docentes, además de un completo listado de buscadores, directorios generales y especializados.

Bibliografía

Aguillo, Isidro F. “Internet invisible o Infrantet: Definición, clasificación y evaluación”. En Jornadas Españolas de Documentación (7º, 2000, Bilbao)

Millán, José Antonio. “El libro del medio billón de páginas: (La ecología lingüística de la red)” http://www.jamillan.com/ecoling.htm

Internet, a través de los motores de búsqueda tradicionales, sólo deja ver una pequeña parte de lo que contiene.

No se permiten comentarios