Mostrando entradas con la etiqueta Motor de búsqueda. Mostrar todas las entradas
Mostrando entradas con la etiqueta Motor de búsqueda. Mostrar todas las entradas

Google va reduciendo el sistema de busquedas ¿Control de la información?

>>  miércoles, 23 de diciembre de 2015

Google se carga uno de los archivos más grandes de Internet
https://www.blogger.com/ 23/12/2015


Usenet es la primera comunidad que se creo en Internet allá por 1980. Con el tiempo acumuló mas de 800 millones de mensajes en sus grupos de discusión y, con el tiempo, se ha convertido en una herramienta fundamental para los historiadores. ¿Quieres saber qué pensaba la gente en 1983 sobre el estreno de El Retorno del Jedi? Los archivos de Usenet son el sitio ideal para buscar. O lo eran, porque por culpa de Google ahora es casi imposible de buscar.

En 1995 comenzó a archivarse en una base de datos todos los mensajes que había generado la red de aquella Internet temprana gracias a Deja News, que fue adquirida en 2001 por Google y todos los mensajes de Usenet pasaron a integrarse en Google Groups. Sin embargo, ahora los historiadores han descubierto que la herramienta para buscar por fecha ya no funciona, haciendo que explorar los archivos sea prácticamente imposible.
La búsqueda por fecha en los archivos de Usenet, desaparecida

Concretamente, los comandos “before:YYYY/MM/DD” y “after:YYYY/MM/DD”, además de haberse eliminado la posibilidad de buscar mensajes de una fecha concreta. Según parece es un cambio reciente. “No entiendo la utilidad de tener 30 años de archivo histórico y no poder buscar con precisión”, escribió Neil Cicierega.

Según Daniel Rehn, un artista californiano que de los primeros en denunciar el problema, Google ha ido reduciendo la capacidad de búsqueda gradualmente. “Durante años, Google Groups tuvo un sistema avanzado que facilitaba la búsqueda de información hasta 1981″, explica en un email a Motherboard, “Sin embargo en algún momento de 2013 esta búsqueda avanzada fue eliminada, limitando las posibilidades de búsqueda a operadores basados en texto”.
Una mutilación gradual

A finales del año pasado fue cuando desaparecieron los comandos de antes y después, una herramienta fundamental para quienes buscaban información sobre un tema concreto pero que no sabían bien por donde buscar. Teniendo en cuenta que hace ya tiempo de esto, parece difícil que se trate de un error. En Motherboard han tratado de ponerse en contacto con Mountain View a través de dos emails que no han recibido respuesta.

Esto lleva a la pregunta de si se debería confiar en corporaciones como Google para mantener los archivos históricos. Andy Baio criticó que los cambios en las prioridades en Google a lo largo de los últimos cinco años han “dejado sus proyectos de archivo histórico en el limbo“, y apuntaba hacia la organización sin ánimo de lucro Internet Archive para mantener viva Usenet. La organización posee una parte de los mensajes de Usenet, pero una parte muy pequeña en comparación con la de Google.

Google, el reincidente

De hecho, no es la primera vez que algo ocurre. En 2009 un artículo publicado en Wired denunció que Google había empeorado el sistema de búsquedas de Google Groups de forma similar, y logró que unaño después la compañía lo arreglara. Esperemos que esta vez ocurra lo mismo y que a partir de ahora en Mountain View sean más cuidadosos con estos pequeños tesoros de historia reciente que poseen.

Vía Motherboard

Read more...

WIKILEAKS FACILITA BUSQUEDA EN DOCUMENTOS DIPLOMATICOS DE EEUU AÑOS 1973 - 1976

>>  martes, 9 de abril de 2013

WikiLeaks lanza motor de búsqueda
http://www.cnnexpansion.com/ 09/04/2013
La organización presentó este lunes la nueva herramienta de consulta de cables diplomáticos de EU; los documentos se presentarán de una manera más accesible, dijo un experto.
La organización activista WikiLeakslanzó este lunes un nuevo motor de búsqueda con la intención de facilitar al público la consulta de dos millones de cables diplomáticos estadounidenses emitidos entre 1973 y 1976.

Kristinn Hrafnsson, portavoz de la organización, dijo en conferencia de prensa que los documentos "tienen gran importancia" porque muestran las relaciones que Estados Unidos sostuvo con numerosas naciones durante un "periodo muy turbulento".

Al participar en la conferencia de prensa a través de una conexión de video desde la embajada ecuatoriana en Londres, el fundador de WikiLeaks Julian Assange criticó al Gobierno estadounidense por no haber difundido estos documentos previamente.

Assange se asiló en junio de 2012 en la embajada ecuatoriana para evitar su extradición a Suecia por acusaciones relacionadas con delitos sexuales.

El Departamento estadounidense de Justicia comenzó a investigar WikiLeaks desde que empezó a difundir cientos de miles de documentos confidenciales. Pero escasos detalles sobre la investigación han salido a la luz pública.

Peter Kornbluh, analista senior en el centro de investigación sin fines de lucro Archivo de Seguridad Nacional, dijo a AP que los documentos incluidos en la base de datos presentada este lunes por WikiLeaks han estado disponibles para su consulta gracias a un programa creado por el Gobierno estadounidense para difundir documentos desclasificados, llamado Acceso a Bases de Datos de Archivos (AAD por sus siglas en inglés).

"El motor de búsqueda del Archivo Nacional (ente gubernamental) tiene muchos problemas, por la manera en que han colocado el material en la web", dijo Kornbluh. "WikiLeaks dijo 'hagamos (un motor de búsqueda) más popular'. Lo que tenemos es una competencia de bases de datos, pero eso no quiere decir que el contenido es nuevo".

Read more...

MerDES: SUITES DE INVESTIGADORES DE LOS MEDIOS DE EXPLORACION DE DATOS

>>  lunes, 3 de septiembre de 2012

Smarter buscar en los archivos utilizando la interfaz de nuevo desarrollo
http://phys.org/ 03/09/2012

Grandes cantidades de datos están fluyendo en los archivos cada día: Los periódicos y libros se están digitalizando, mientras que el material de vídeo que se está suministrando directamente en formato digital. Por lo tanto cada vez más importancia esta tomando la Tecnología de motores de búsqueda. Todo este material digitalizado ofrece una gran cantidad de información para los investigadores de las humanidades y las ciencias sociales, sino que también puede encontrar lo que está buscando, entre estos llamados "grandes datos"?

Según Marc Bron, estudiante de doctorado en el Laboratorio de Sistemas Inteligentes Amsterdam (ISLA) de la Universidad de Amsterdam, que depende de varios factores. Por cierto material, los investigadores saben que está en el archivo y que los términos de búsqueda que deben utilizar para recuperarla. Sin embargo, en la mayoría de los casos, los investigadores llegan a la archivo con una pregunta de investigación y que primero debe buscar material adecuado y explorar el contenido del archivo. Encontrar material relevante Una dificultad importante en la búsqueda de material relevante radica en la formulación de la pregunta de búsqueda que se pueden introducir en el motor de búsqueda. Los términos de búsqueda utilizados por los investigadores pueden diferir de los archiveros terminología para describir el material, a pesar de que ambos significan más o menos lo mismo. Por ejemplo, un investigador puede introducir el término 'migrante', mientras que un archivero ha utilizado el término "extranjero". El segundo problema surge si el material se encuentra. Los investigadores no pueden establecer si se han recogido todo el material pertinente o si otras cosas interesantes se pueden todavía encontrar que todavía no son conscientes. Exploratorio interfaz proporciona una solución Para hacer frente a estos problemas, se ha desarrollado un Bron exploratorio interfaz junto con sus colegas en la Isla, el Centro de Transición de Televisión en la Universidad de Utrecht y el Instituto Holandés para el Sonido y Visión. Esta interfaz se llama Merdes, un acrónimo de "Suite de investigadores de los medios de exploración de datos. Puede ser utilizado para comparar los resultados de diferentes búsquedas en los archivos ricos, como los del Instituto Holandés de Imagen y Sonido. Los investigadores pueden visualizar el número de programas que son relevantes para cada uno de los de búsqueda consultas con el fin de hacerse una idea sobre la cantidad de información está disponible en distintos aspectos de un tema. Por ejemplo, con este enfoque, el creciente uso del término 'inmigrante' en material de archivo puede ser comparado con el uso de "extranjero" del término. La cantidad de material disponible para un sujeto y cómo se compara con otros temas pueden ejercer una influencia considerable sobre el método utilizado para la investigación y las preguntas que en última instancia puede ser respondida. Bron y Marc postdoc Jasmijn Van Gorp (Universidad de Utrecht) probó la interfaz mediante la realización de un estudio de usuarios de 40 científicos de los medios. Bron presentó los resultados de su investigación en la conferencia internacional del Grupo de Interés Especial de Recuperación de Información (SIGIR) que se celebrará del 12 al 16 de agosto en Portland (Oregón, Estados Unidos). Una demostración de la interfaz está disponible en: zookma.science.uva.nl / merdesdemo .

También está disponible un vídeo tutorial hablado en holandés. vídeo tutorial

Esto puede diferir ligeramente de la versión actual a medida que seguimos para mejorar la interfaz.


Read more...

Snap Shots

Get Free Shots from Snap.com

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP