Sincronización de rastreo de Google

Google rastrea la Web en diferentes profundidades y en más de una programación. La llamada de rastreo profundo se produce aproximadamente una vez al mes.


Este amplio reconocimiento de contenido Web requiere más de una semana para completar y una longitud indeterminada de tiempo después de completar la construcción de los resultados en el índice. Por esta razón, puede tomar hasta seis semanas para una nueva página para que aparezca en Google. Nuevos sitios de marca a nuevas direcciones de dominio que nunca han sido rastreadas antes no podrían incluso ser indexados al principio.

Si Google se basó enteramente en el rastreo profundo, su índice se convertiría rápidamente obsoleta en la Web rápidamente cambiante. Para estar al día, Google lanza varios rastreos frescos suplementarios que rozan la Web más superficialmente y frecuencia que el arrastre de profundidad. Estas arañas suplementarios (programas de software automatizados que se desplazan de un enlace a uno de la Web, recogiendo el contenido de las páginas en línea) no se actualizan todo el índice, pero se refrescan mediante la actualización de los contenidos de algunos sitios. Google no divulga sus horarios o metas recién gatear, pero Webmasters puede obtener una indicación de la frecuencia de rastreo a través de la observancia agudo.

Google no tiene obligación de tocar cualquier URL en particular con un rastreo fresco. Los sitios pueden aumentar sus posibilidades de ser arrastrado a menudo, sin embargo, al cambiar su contenido y añadir páginas con frecuencia. Recuerde que el aspecto de la superficialidad de rastreo fresco; Google podría echar mano de la página principal de su sitio (la primera página, o página de índice), pero no sumergirse en una exploración profunda de las páginas interiores del sitio. (Es posible que, por ejemplo, cuenta que una nueva página de índice de su sitio aparezca en Google dentro de un día de sus actualizaciones, mientras que una nueva página interior añadido al mismo tiempo es posible que falte.) Pero la araña de Google puede comparar los resultados de rastreo anteriores con el rastreo actual, y si se aprende de la página de navegación superior que el nuevo contenido se agrega regularmente, podría empezar a gatear todo el sitio durante sus frecuentes visitas.

El arrastre de profundidad es más automática y sin pensar a fondo que el rastreo fresco. Es muy probable que en un ciclo de arrastre de profundidad, cualquier URL que ya están en el índice principal se volverá a evaluar a su última página. Sin embargo, Google no incluye necesariamente todas las páginas de un sitio. Como de costumbre, las razones y las fórmulas que participan en la exclusión de ciertas páginas no se divulgan. El hecho más importante para recordar es que Google aplica consideraciones de PageRank para cada página, no sólo para los dominios y páginas principales. Si una página específica es importante para usted y no aparecen en los resultados de búsqueda de Google, su tarea consiste en aplicar cada trabajo en red y la optimización táctica se puede imaginar a esa página. También puede enviar manualmente esa página específica Google.

Los términos de profundidad del arrastre y arrastre fresca se utilizan ampliamente en la comunidad de marketing en línea para distinguir entre el rastreo exhaustivo de la Web que Google lanza aproximadamente mensual y serie de terminales intermedios gatea ejecutar a discreción de Google. El propio Google reconoce tanto a nivel de actividad de la araña, pero es reservado acerca de los horarios exactos, profundidades de arrastre, y las fórmulas por el que la empresa opta por objetivos de rastreo. En gran medida, los objetivos se determinan mediante procesos automáticos incorporados en la programación de la araña, pero los seres humanos en Google también dirigen la araña a destinos específicos, por diversas razones.

Técnicamente, el índice de Google permanece estática entre los rastreos. Google coincide con palabras clave en el índice, no contra el contenido web en directo, por lo que ninguna de las páginas puestas en línea (o modificadas) entre la visita de la araña de Google permanecerá excluida de (o fuera de fecha en) la búsqueda de resultados hasta que se rastrean de nuevo. Sin embargo, dos factores trabajan contra el índice restante sin cambios por mucho tiempo. En primer lugar, la frecuencia de los rastreos frescos mantiene el índice de evolución en un estado que Google observadores llaman Everflux. En segundo lugar, se requiere un cierto tiempo para poner los resultados de rastreo en el índice en miles de servidores de Google. El agitado irregular y batido del índice que resulta de estos dos factores se llama la danza de Google.