Evaluación del funcionamiento y recuperación de información textual de los principales motores de búsqueda y metabuscadores de la world wide web

  1. VIDAL BORDES, FRANCISCO JAVIER
Dirigida por:
  1. José Antonio Salvador Oliván Director/a

Universidad de defensa: Universidad de Zaragoza

Fecha de defensa: 02 de marzo de 2009

Tribunal:
  1. Félix Sagredo Fernández Presidente
  2. Genaro Lamarca Langa Secretario/a
  3. Ernest Abadal Vocal
  4. Esperanza Velasco de la Peña Vocal
  5. Rosario Arquero Avilés Vocal

Tipo: Tesis

Teseo: 200744 DIALNET lock_openTESEO editor

Resumen

El trabajo se estructura en cuatro grandes apartados: introducción, material y método, análisis de los resultados y conclusiones. En el primero se analiza la evolución y el contenido de la World Wide Web y sirve para establecer el marco conceptual del estudio, en el que también se trata de los sistemas de recuperación de información tradicionales, valorarando su influencia en las herramientas de recuperación de la Web. Su evaluación se hace cada vez más necesaria ante el gran número de buscadores existentes y por los problemas para llevar a cabo una recuperación de información precisa. Por su parte, los investigadores, profesionales de la recuperación de información y usuarios especializados, necesitan conocer su utilidad en búsquedas especializadas. El trabajo se plantea como objetivos: conocer el funcionamiento de los principales buscadores de la World Wide Web ante diferentes tipos de búsquedas, valorar su utilidad en búsquedas de recursos sobre temas especializados y conocer las características de la información recuperada. Se evalúan los principales motores (Google, MSN, Teoma, WiseNut y Yahoo) y metabuscadores (Dogpile, Excite, IXQuick, Profusión, Search, SurfWax y Vivisimo) mediante el lanzamiento de seis búsquedas relacionadas con el campo de la Documéntación. Se analizan los cincuenta primeros resultados utilizando indicadores que permiten valorar tanto aspectos de los registros'que aparecen en los listados de recursos recuperados; el funcionamiento de los buscadores en las diferentes búsquedas; diferentes. aspectos relacionados con los programas de búsqueda y recuperación; con la base de datos; la precisión técnica, la cobertura,' el solapamiento y la ordenación de los resultados. Se estudian además las características de la información en función de su interés para la investigación, comercial, institucional, etc.; la tipología documental y el formato de ficheros. Los resultados más destacados muestran que, en cuanto a la capacidad de búsqueda, son Google, MSN, Yahoo, Search, Vivisimo, Excite e Ixquick, que recuperan en todas las búsquedas; que la información de los registros que proporcionan Google, MSN y Yahoo, y los metabuscadores Excite, Search y Vivisimo es mejor que la del resto; la mayor profundidad en la indización de los sitios web corresponde a Google y a Yahoo y el mayor número de duplicados lo recuperan Google y los metabuscadores Profusión y Search. Más generalizado es el problema de la recuperación de recursos inactivos. El análisis de las características de la información indican que MSN es el motor que ofrece la información más actual, y que Google, Yahoo y de nuevo MSN, son los buscadores que facilitan un mayor número de recursos de interés para la investigación, lo que se corresponde, respecto a la tipología, con el hecho de que los dos primeros sean los que más artículos recuperan. Finalmente las bases de datos de Google y Yahoo son las más completas, atendiendo al formato de los ficheros recuperados. Respecto a la Cobertura y solapamiento, en el total de las búsquedas se registra un alto solapamiento, por lo que es recomendable conocer los buscadores entre los cuales es menor, para obtener una mayor exhaustividad, como es el caso de MSN, que puede utilizarse en combinación con Yahoo o Google. Entre los metabuscadores, Vivisimo supone un buen complemento, frente a Search, que es el metabuscador con mayor solapamiento. La precisión técnica es baja como muestran los resultados de la primera búsqueda, en la que el término aparece en el 38,2% de los recursos recuperados. Las búsquedas por frase y por campo ofrecen un mayor índice de precisión. Finamente, respecto al Ranking, los motores en los que se aprecia una mayor presencia de los términos de búsqueda en las etiquetas key y description son Teoma, WiseNut y Yahoo, siendo superados de forma general por los metabuscadores. En relación con los valores de la frecuencia y el Peso de los términos, su intervención en la ordenación es muy variada, ya que mientras que en Google hay una relación para los treinta primeros resultados, en Yahoo, los valores decrecen de forma más armónica en los cincuenta analizados. Entre los metabuscadores sólo Search presenta una secuencia lógica en estos valores, mientras que Excite se centra en los diez primeros. Este último análisis, además, permite recomendar la consulta de un mayor número de recursos recuperados, sobre todo en el caso de Google y Excite, ya que los valores de la Frecuencia y el Peso pueden ser mayores en recursos situados más allá de los veinte primeros, aspecto que ha de tenerse en cuenta también en la evaluación.