Vamos a tratar de resolver un problema de indexación que el Google Search Console (GSC) nos presenta al descubrir Url’s del tipo: «https://tudominio.com/?wordfence_lh=1&hid=A0F7…«
Más precisos, en el apartado: «Rastreado: Actualmente sin indexar«, que está dentro del apartado «Indexación de página«, se presenta este problema, un repunte de url’s rastreadas con ese sufijo que obviamente nos recuerda al plugin de wordpress llamado Wordfence.
Precedentes
El que hayas llegado a este post significa que ya cuentas con ciertos conocimientos de la herramienta y también sobre SEO.
Entonces, revisando los datos generales que arroja la consola de google en su panel, observamos las páginas, que enviadas por un sitemap, deberían ser las que están indexadas para un sitio determinado.
Sin embargo, ahora también se ven las páginas descubiertas, como también las que están rastreadas pero que actualmente aún no están indexadas.
Es así que llegamos a ver una fluctuación que con las semanas se ve que el incremento de estas páginas rastreadas pero sin indexar sobrepasa toda lógica.
En este reporte se encuentra un botón que dice: Validar Corrección; Es decir, ¿Es este un problema a arreglar?
¿Por qué aparecen tantas Url’s de Wordfence? ¿Afecta o afectará el SEO de mi web?
Es menester para los webmaster estar constantemente revisando las consolas de búsqueda de todas las páginas que se tienen indexadas. Ya sea páginas propias o de clientes.
Dicho esto, presenciar tal desajuste hace ruido a la vista y más aún cuando son Url’s automáticas que NO queremos que se indexen.
¿Qué problema se tiene con Wordfence y estas Urls?
La versión gratis del plugin Wordfence nos permite tener un sitio seguro frente a las amenazas que presenta este mundo tecnológico.
Sin embargo, los robots rastreadores de GSC encuentran esta Url’s autogeneradas por Wordfence con el siguiente formato:
https://dominio.com/?wordfence_lh=1&hid=A0F7B448AAE15DD0B73DA3FB0FECD312
Al hacer clic para ver esas páginas, se encuentra uno con una página vacía, es decir no se imprime nada en pantalla.
En la consola podemos ver que esa Url generada por wordfence permite el rastreo y como esta, también todas las que este plugin ha creado.
Al principio tal vez hayan pasado desapercibido, pero de la noche a la mañana puede ser que veas apareciendo en los reporte 200 ó 400 url’s queriendo indexarse.
Es posible que nuestros esfuerzos por crear contenido de calidad se vean mellados por estos apartados en blanco sin contenido ni cometido serio para nuestra estratégia de posicionamiento SEO.
¿Por qué se crean estas páginas en blanco desde Wordfence?
Nos encontramos con un plugin que cuenta con más funciones de las que desearíamos.
En este caso una herramienta de la que Wordfence hace uso y es llamada Real-Time Live Traffic.
Lo que hace esta opción es mostrar cómo se muestra tu sitio en tiempo real para, por ejemplo, los robots de los motores de búsqueda. Estos no son registrables por Google Analytics ni otros trackers.
Cómo deshabilitar “Life Traffic” de Wordfence
Veamos, como lo explica matttutt en su post, existen 2 posibilidades para lograr desactivar esta opción en Wordfence y así ahorrarnos recursos de nuestro servidor.
La primera técnica radica en modificar los valores que esta opción tiene en el apartado de wordfence dentro del panel de wordpress mientras que la otra forma es deshabilitar por completo con un pequeño código.
Ajustar las opciones del plugin
Paso 1:
En el wp-admin del wordpress a corregir, dentro del menú de wordfence a la izquierda encontraremos: “Todas las opciones” o “All Options“.
Paso 2:
Luego de hacer scroll un poco veremos el desplegable de que dice: opciones de tráfico directo.
En él tenemos que ver estos 3 campos.
- Modo de registro de tráfico: Solo Seguridad.
- Cantidad de datos de tráfico en directo a almacenar: bajará a 100.
- Número máximo de días a mantener los datos: bajará a 1.
Con esto reduciremos el uso de recursos por parte de wordfence en el servidor. Y limitaremos las peticiones de creación de esos Url’s indeseados.
OJO: En la versión gratis de Wordfence del repositorio, no es posible desactivar el tráfico en vivo sin embargo, puede que no sea así en su versión premium.
Una vez realizados los cambios, es necesario que des clic en el botón guardar para que los cambios se graben.
Deshabilitar “Live traffic” desde: wp-config.php
Otra opción que seguro es un poco más complicada de llevar a cabo, es modificar el archivo wp-config.php de nuestro sitio en wordpress.
Para ello tenemos que navegar entre la carpeta de archivos del “public HTML” en la que tenemos alojada nuestra web.
Hay varias formas de acceder a estos archivos: por FTP, desde el Cpanel, o un Plugin desde el repositorio.
En dicha carpeta está suelto el archivo PHP llamado WP-CONFIG.
Se recomienda siempre hacer una copia de seguridad antes de cualquier modificación, ya sabes, en caso cometamos algún error y se caiga nuestra página.
Cuando editamos el documento, justo antes de esta línea:
/* That's all, stop editing! Happy blogging. */
Debemos escribir este código antes de ese mensaje.
define('WORDFENCE_DISABLE_LIVE_TRAFFIC', true);
Guarda la nueva configuración y asegúrate de subirla en la misma carpeta.
Modificando el robot.txt de tu sitio
Consultando más a fondo en foros y grupos de redes sociales, se comentó que era posible deshabilitar que los robots entren a estas url’s.
En la misma carpeta podemos crear o editar el documento robots.txt, en donde se explica qué quiero y no indexar, debemos rechazar (disallow) los sufijos con esas terminaciones, en este caso variables.
Añadiremos esta línea debajo de user agent
disallow: */?wordfence_lh=1&hid=
Aunque a los robots de google este archivo ya no les es tan importante, frente a la etiqueta “no-index” por ejemplo, reforzamos el rastreo de este tipo de url’s.
Resultados
Ahora para ver los resultados, vamos, estos recién se verán en unas semanas reflejadas en tu google search console. No esperes que sea algo rápido.
También se puede consultar los registros logs de tu servidor para ver si detecta que algún plugin o robot genera y/o accede a esas URL.
Con las configuraciones que hemos realizado anteriormente, ya no se debería crear ninguna página desde el plugin de wordfence. Si sigues viendo estos datos probablemente algo esté mal.
¿Existen problemas para tu SEO y estas Urls de Wordfence?
Al momento de realizar este post, en una de las webs que manejamos, uno de los reportes de la consola de google presentaba un incremento en el rastreo de páginas.
Al notar esto, y ver de dónde venían, no pudimos hacer otra cosa que estudiar el caso a fondo. No queremos que nuestros esfuerzos en crear contenido de valor que queremos se indexen se vean atrofiados por estas url’s automaticas sin valor en sí mismas.
Puede pasar que en algunos casos, en vez de mostrarte una página en blanco se redireccione a una página pilar o al home.
En estos casos, en múltiples foros de wordpress puedes encontrar que los creadores del plugin indican que esto se debe al tema que se está utilizando. Siendo que esta respuesta no nos es muy útil.
Se debería considerar conversar con los creadores del tema, o tal vez cambiar de tema. No es la solución que queríamos.
En todo caso, la consola de búsqueda tratará de indexar ese contenido y será uno duplicado. Ojo con eso.
El mismo contenido para diferentes Url’s podría solucionarse con agregar al original una etiqueta de canónico. Sin embargo, al no poder maniobrar estas páginas sí tendríamos un problema.
Si es que acaso sirve de algo, deberíamos hacerle la vida fácil a los motores de búsqueda y separar la buena yerba de la mala. En twitter se armó un hilo sobre el tema que te podria interesar.
Luego de varias semanas de haber aplicado los métodos mencionados en este post, notamos que poco a poco ha ido decreciendo la cantidad de páginas no indexadas.
Recuerda que el Seo es un proceso largo, sin embargo todo en este rubro es medible. Suerte.
Gracias por el aporte, de momento estoy probando y espero que funcione esta solución.
Gracias nuevamente por compartir.
Yo hace años elimine este complemento, pero aun veo estas url en la consola de Google, ¿quizás a quedado alguna tabla u opción activada?