Una colección de documentos que parecen describir cómo Google clasifica los resultados de búsqueda apareció en camino, probablemente como resultado de una publicación accidental por parte de un autómata interno.
La documentación filtrada describe una lectura antigua de la API Content Warehouse de Google y proporciona información sobre el funcionamiento interno de la Búsqueda de Google.
El material parece deber sido cometido sin darse cuenta a un repositorio propiedad de Google de golpe notorio en GitHub más o menos del 13 de marzo mediante las propias herramientas automatizadas del titán web. Esta automatización incluyó una deshonestidad de código extenso Apache 2.0 en la confirmación, como es normalizado en la documentación pública de Google. A compromiso de seguimiento el 7 de mayo intentó deshacer la filtración.
Aun así, el material fue descubierto por Erfan AzimiCEO de la empresa de optimización de motores de búsqueda (SEO) EA Digital Eagle y fueron revelados el domingo por sus compañeros agentes de SEO Rand Fishkin, director ejecutante de SparkToro y Michael King, director ejecutante de iPullRank.
Estos documentos no contienen código ni cero similar y, en cambio, describen cómo utilizar la API Content Warehouse de Google, que probablemente esté destinada exclusivamente a uso interno; La documentación filtrada incluye numerosas referencias a sistemas y proyectos internos. Aunque hay un con nombre similar La API de Google Cloud, que ya es pública, parece que lo que terminó en GitHub va mucho más allá.
Los archivos son dignos de mención por lo que revelan sobre las cosas que Google considera importantes al clasificar las páginas web según su relevancia, una cuestión de interés duradero para cualquier persona involucrada en el negocio de SEO y/o cualquiera que opere un sitio web y espere que Google le ayude a aventajar tráfico.
Entre las más de 2.500 páginas de documentación, reunidas para lectura fácil aquí, hay detalles sobre más de 14.000 atributos accesibles o asociados a la API, aunque la información sobre si se utilizan todas estas señales y su importancia es escasa. Por lo tanto, es difícil discernir el peso que Google otorga a los atributos en su operación de clasificación de resultados de búsqueda.
Pero los consultores SEO creen que los documentos contienen detalles dignos de mención porque difieren de las declaraciones públicas hechas por los representantes de Google.
«Muchos [Azimi’s] reclamos [in an email describing the leak] contradicen directamente las declaraciones públicas hechas por los empleados de Google a lo abundante de los abriles, en particular la carencia repetida de la compañía de que se emplean señales de adjudicatario centradas en los clics, la carencia de que los subdominios se consideren por separado en las clasificaciones, la carencia de una zona de pruebas para sitios más nuevos, la carencia de que se recopile la vida de un dominio o considerado, y más», explicó Fishkin de SparkToro en un informe.
Rey de iPullRank, en tu publicar en los documentos, señaló una enunciación hecha por el defensor de las búsquedas de Google, John Mueller, quien dijo en un video que «no tenemos cero parecido a una puntuación de autoridad del sitio», una medida de si Google considera un sitio digno de confianza y, por lo tanto, digno de una clasificación más ingreso en los resultados de búsqueda.
Pero King señala que los documentos revelan que, como parte de las señales de calidad comprimidas que Google almacena para los documentos, se puede calcular una puntuación de «siteAuthority».
En ambas publicaciones se citan varias otras revelaciones.
Uno es la importancia de los clics (y los diferentes tipos de clics (buenos, malos, largos, etc.)) para determinar la clasificación de una página web. Google durante Estados Unidos contra Google sensatez antimonopolio Reconocido [PDF] que considera las métricas de clics como un divisor de clasificación en la búsqueda web.
Otra es que Google utiliza los sitios vistos en Chrome como señal de calidad, vistos en la API como un parámetro. ChromeEnTotal. «Uno de los módulos relacionados con los puntajes de calidad de la página presenta una medida de las vistas de Chrome a nivel del sitio», según King.
Adicionalmente, los documentos indican que Google considera otros factores como la presente del contenido, la autoría, si una página se relaciona con el enfoque central del sitio, la alineamiento entre el título de la página y el contenido y «el promedio ponderado». tamaño de fuente de un término en el cuerpo del documento.»
Google no respondió a una solicitud de comentarios. ®