Cuando hablamos de buscar información en Internet sabemos que la clave para localizarla es disponer de herramientas que nos permitan hacer un barrido “completo” de todas las esquinas del mundo virtual. En general, cuando salimos a buscar utilizamos Google, aunque la posibilidad de utilizar otros buscadores que buscan otras cosas “. A pesar de todo, la mayoría de estos buscadores alternativos siguen buscando en la Internet más superficial, aunque sean un complemento magnífico a Google.
Es por ello que mis palabras mágicas para hoy pretenden dar un saltito más en la profundización de los recursos #OSINT listando una serie de buscadores y repositorios generalistas que pueden ayudarte a dar los primeros pasos hacia esa Internet profunda de la que tanto se habla en Inteligencia.
La web profunda no es más que información de difícil acceso porque ningún buscador la ha agregado, porque son repositorios que se han quedado colgados en el aire, porque la temática es tan específica que no sale en buscadores generalistas, porque es un contenido tan anónimo que no se encuentra fácilmente o porque simplemente son una serie de archivos sin texto que se comparten en los espacios ofrecidos para ello.
Generalmente, cuando se habla de “deep web” se suele hacer referencia a Tor o lo que es lo mismo, la red Onion.
A pesar de todo, la “deep web” es mucho más que simplemente el uso de Tor y la red Onion y es importante que lo recordemos si pretendemos entender correctamente lo que significa la Internet Profunda.
A continuación, se proponen una serie recursos generalistas para deep web que pueden ser muy útiles en un momento determinado, aunque también incluyo algo de Tor ;-).
Archivos:
Find that File
Es un buscador muy ágil que te permite bucear en distintas tipologías de formato (torrent, emule, pdf, vídeo, etc) además te da la posibilidad de filtrar por tipo de localización, por si quieres buscar por ejemplo en FTP. Y si quieres buscar en la web profunda de un modo todavía más específico en su sección http://www.findthatfile.com/about.php tienen una lista con todos los buscadores que han desarrollado. ¡Altamente recomendable!
Files tube
http://www.filestube.to/
http://www.filestube.to/
Otro de esos buscadores maravillosos que te ayudan a encontrar cualquier tipo de archivo en la web profunda. En esta ocasión, este buscador rastrea en prácticamente todas las webs que permiten subir archivos para compartir, en total unos 58 puntos de contacto entre ellos el conocido DropBox. También te da la posibilidad de buscar por periodos de tiempos para pulir un poco más tu búsqueda.
FTP Like Nuevo!
Es un buscador de archivos dentro de FTP. Tienen más de 2000 links donde escanear y a veces podemos encontrar algunos archivos interesantes para nuestro trabajo.
Noticias:
Look ahead
http://lookahead.surfwax.com
http://lookahead.surfwax.com
Este buscador bucea entre 140 rss muy populares con la posibilidad de un histórico de 7 días. Es por tanto muy bueno para monitorizar noticias, por ejemplo de un conflicto determinado y construir un análisis de Timeline. Eso sí, hay que buscar en inglés pues son medios anglosajones.
Clusty
http://clusty.com/
http://clusty.com/
Es un buscador que organiza por temáticas. En esta ocasión, este concretamente recupera muy bien noticias de la red. Ideal para análisis de medios de comunicación y saber lo que dicen unos y otros. Por supuesto también para localizar propaganda. Además, te permite hacer búsquedas en distintos formatos (imagenes, blogs, wikis, etc.). Muy bueno.
Newspaper Archive (comercial)
http://newspaperarchive.com/
http://newspaperarchive.com/
Sin lugar a dudas una de las bases de datos de noticias más importantes de Internet. Eso sí, centrada específicamente en USA, aunque con la posibilidad de acceder a otros países como Canadá. Es de pago. Pero conviene saber que existe una hemeroteca virtual de este tipo.
Publicaciones:
Deepdyve
http://www.deepdyve.com/
http://www.deepdyve.com/
Espectacular buscador de ámbito científico que recoge millones de publicaciones. Sin duda uno de los mejores para el ámbito académico y de investigación. Te permite, además crear una alerta sobre un tema concreto para estar al día de todo lo nuevo que van localizando e incorporando.
Highwire Stanfor
http://highwire.stanford.edu
http://highwire.stanford.edu
Este buscador de publicaciones es realmente poderoso, nos busca publicaciones comerciales, pero también otras que están disponibles gratuitamente en pdf. Con él podemos conocer quienes son los investigadores más relevantes de un tema y acertar completamente en nuestras lecturas “para ponernos al día”.
Personas:
Pipl.com
https://pipl.com
https://pipl.com
Curioso buscador de personas. Está configurado para entrar en las principales redes sociales y buscar el nombre que queremos. Puede ser muy útil para buscar aquellas personas que han configurado sus redes de un modo muy personal. Pero evidentemente se le escapan cosas.
Literatura gris:
Docuticker
http://www.docuticker.com/
http://www.docuticker.com/
Más que un buscador como tal es un repositorio donde recopilan información emitida por distintas organizaciones, think tank y gobiernos. Te permite suscribirte al boletín de novedades como si fuera una actualización de feed. Tiene un buscador interno basado en tecnología Google para localizar publicaciones específicas por clave de búsqueda. En el menú de navegación derecho disponen de árboles de búsqueda si lo que te interesa es un tema en concreto.
Buscador de archivos desclasificados de la CIA
http://www.foia.cia.gov/
http://www.foia.cia.gov/
Muy buen buscador para ayudarte en tus búsquedas de los documentos que va desclasificando el gobierno americano. Los documentos están en pdf, aunque no puedes bajártelos todos.
Directorio Internacional de literatura gris
http://www.greynet.org/internationaldirectory.html
http://www.greynet.org/internationaldirectory.html
Esta lista en pdf incluye distintas universidades y organismo públicos que disponen de buscadores a sus propios documentos. Puede ser útil en un momento determinado para encontrar alguna publicación especial.
Históricos
Internet Archive
https://archive.org/
https://archive.org/
Es un repositorio de información muy variada en distintos tipos de formato. Permite filtrar por fecha, número de descargas, etc por lo que podemos encontrar verdaderas joyas “abandonadas” en la Red.
Lo + profundo:
Torch - Onion
https://xmh57jrzrnw6insl.onion.to/
https://xmh57jrzrnw6insl.onion.to/
La versión web de la conocida red Tor por la que se suele mover todo el “underground” que nos podemos imaginar. Este buscador no facilita el anonimato. Para el que todavía no sabe lo que es Tor aquí está la web oficial: https://www.torproject.org/ Y si quieres un pequeño tutorial muy interesante y orientado a la ciberseguridad, te recomiendo que veas el vídeo de las jornadas de ciberdefensa "Deep Web. Redes Tor" te ayudará a comprender de un modo claro y ameno de qué va esta película ;-)
Torsearch - Onion
https://kbhpodhnfxl3clb4.onion.to/
https://kbhpodhnfxl3clb4.onion.to/
Nace el hermano pequeño del buscador Tor. Todavía está muy incipiente y como ellos dicen sólo busca dentro del contenido alojado en la propia Red Tor. Parece que tiene la estructura comercial del Google así que no me extrañaría que pronto la veamos crecer. Aunque es evidente que se perderán numerosas entradas “interesantes”, pues si deja de ser una Red “profunda” muchas personas dejarán de utilizarla para compartir contenido, especialmente de sexo, drogas, armas y piratería que son las temáticas más utilizadas en esta Red. En fin, ya veremos en qué acaba este proyecto que tiene pinta de ser sólo para conseguir dinero.
PasteBin
http://pastebin.com
http://pastebin.com
Ésta es una Red Social muy útil cuando se pretende chatear y acompañar el diálogo con alguna información en concreto, porque permite acompañar el diálogo con la información que “pasteemos”. Evidentemente es muy inestable y volátil, pues los perfiles publican y despublican rápidamente. Pero a veces se encuentran cosas interesantes.