Exclusiones de páginas Web

Para configurar el rastreador para evitar que importe páginas Web no deseadas en el portal:

  1. De forma predeterminada, el rastreador sigue las recomendaciones del servidor Web sobre las páginas que pueden resultar valiosas para los rastreadores automáticos. Si desea omitir estas recomendaciones, desactive la casilla de verificación Obedecer los protocolos de exclusión de robots del sitio de destino.

    En general, estas recomendaciones contribuyen a limitar el contenido no deseado que se rastrea en el portal. Sin embargo, algunos sitios ofrecen unas recomendaciones muy estrictas. Si el rastreador no importa ningún contenido de un sitio, intente desactivar esta opción.

  2. De forma predeterminada, el rastreador guarda las direcciones URL a las páginas Web importadas con las mayúsculas y minúsculas utilizadas en el sitio Web fuente. Para cambiar las direcciones URL a minúsculas, seleccione Convertir todas las direcciones URL a minúsculas.

  3. Para evitar la importación de contenido de un área de un sitio Web o la importación de determinadas páginas:

  4. De forma predeterminada, el rastreador no rastrea ni importa las páginas especificadas en las exclusiones. Si el rastreador va a acceder desde un vínculo de una página excluida a una página que no está excluida y se debe importar, elija Rastrear páginas excluidas, pero no importarlas.

  5. Para limitar el rastreo a un área de un sitio Web o a determinadas páginas:


  1. Haga clic en Administración.
  2. Abra el editor de rastreadores Web:
  3. En la parte izquierda, en Editar configuración de objeto, haga clic en Exclusiones de páginas Web.