jueves, 25 de agosto de 2016






Un iceberg llamado Internet




La Web Superficial o también llamada visible está integrada por todos aquellos sitios cuya información puede ser indexada por los buscadores convencionales. Se caracteriza porque su información no stá en base de datos, es de libre acceso, no requiere registrarse para acceder a ella y está en páginas web estáticas, es decir, con una URL fija y accesible desde otro enlace.







Esta Web sólo ofrece acceso a un aparte de lo que existe online, lo que resta, es la llamada web profunda o invisible y que no se recupera preguntando a los buscadores al no ser detectable por sus robots convencionales.  Son páginas con una URL que no es fija y que se construye en el mismo instante de la consulta, desapareciendo cuando finaliza. 



Clasificación de la Web Invisible


Sherman y Price identifican cuatro tipo de webs con contenidos invisible


1.- La Web Opaca: Archivos que no están incluidos en los motores de búsqueda

  • Extensión de la indexación
  • Frecuencia de la indexación
  •  Limitación del Número máximo de resultados visibles
  • URL’s desconectadas








2.-  Web Privada archivos que no están incluidos en los motores de búsqueda por alguna de estas razones:

  • Las páginas están protegidas por contraseñas 
Contienen un archivo “robots.txt” para evitar ser indexadas.
  • Contienen un campo “noindex” para evitar que el buscador indixe la parte correspondiente al cuerpo de la página.


3.- Web Propietaria: páginas en las que es

 necesario registrarse para tener acceso al 

contenido, 

ya sea de forma gratuita o pagando. Un 95% de la

 web es gratuita y de acceso público. Algunos 

medios 

de comunicación han comenzado a impedir el acceso 

a algunas informaciones, que sólo pueden leerse si 

eres subscriptor. 



4.- Web Profunda: Profunda: no pueden ser indexadas por limitaciones técnicas de los buscadores, programas ejecutable, archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.  


Algunos ejemplos de Web Profunda Académica:

http://www.scielo.org/php/index.php librería científica online

http://ciencia.science.gov/ : portal federal de la Ciencia del Gobierno de Estados Unidos en castellano


http://worldwidescience.org/ 
Es un sitio compuesto de bases de datos y portales científicos nacionales e internacionales 



No hay comentarios:

Publicar un comentario