Contenido duplicado ¿Qué es y Cómo solucionarlo?

El contenido duplicado básicamente es todo el contenido idéntico que se repite en distintas URLs de un mismo dominio o en una o varias URLs de otro dominio.

También es una de las técnicas más usadas en el Black Hat SEO y una de las más penalizadas tanto por Google como por otros motores de búsqueda.

Aunque el caso más común del contenido duplicado se refleja principalmente a nivel interno en la mayoría de las webs.

De todas formas, el posicionamiento se verá afectado y tendremos que trabajar para corregirlo.

¿Penaliza el contenido duplicado a nivel de SEO?

El contenido duplicado es un problema que puede repercutir de manera negativa en el posicionamiento web.

No es que exista una penalización algorítmica a nivel de buscador que penalicen aquellos dominios con un alto porcentaje de contenido duplicado, sino más bien que estaremos desperdiciando recursos y no estaremos realizando una buena optimización SEO On Page.

Si en tu caso sufres de contenido duplicado te puedes encontrar en las siguientes situaciones:

  • Google o cualquier otro buscador solo posicionará una de las URLs que comparten el mismo contenido.
  • Google perderá tiempo en rastrear URLs que nunca posicionarán y estarás perdiendo Crawl budget.
  • Si las URLs con contenido duplicado reciben enlaces internos estarás perdiendo Link Juice.

Mi recomendación es nada más que lo detectes te pongas manos a la obra para solucionarlo.

¿Cómo encontrar contenido duplicado?

Hay distintas formas de encontrar contenido duplicado, aunque cada una de ellas servirá para encontrar un tipo de duplicidad.

Quizás la forma más común y universal que hay para encontrar este tipo de contenido es a través de los famosos footprints de Google.

footprint contenido duplicado

Aunque hay mucho más casos y forma de encontrar contenido duplicado como veremos ahora.

Contenido duplicado interno

A nivel interno pueden darse el contenido duplicado por diversas razones, aunque las más comunes son por problemas de programación o problemas de mala gestión de contenido.

Mala gestión de contenidos

Sin una buena planificación del contenido dentro de tu site puedes caer en el error de duplicar contenido, productos, páginas, etc.

La duplicidad de contenido no solo se basa en tener dos contenidos idénticos, también sería tener dos artículos que estén enfocados a la misma intención de búsqueda.

Herramienta: Footprint

Solución: Puedes usar cualquier herramienta estilo excel para ordenar todas las URLs de tu contenido, asignando cada URL a una focus keyword, de esta forma solo tendrás una URL concreta por cada keyword que tenga una intención de búsqueda única.

Este proceso siempre los suelo hacer al principio de cada proyecto en el keyword Research, te dejo mi artículo de cómo hacer un keyword Research, puede serte de gran ayuda.

Títulos y metadescripciones Duplicados

Sucede sobre todo en las paginaciones de categorías o subcategorías, todas tienen el mismo meta title y meta description que la primera página.

En este caso no sería un problema como tal, pero tienes que tener en cuenta que lo más seguro es que las paginaciones aunque puedan indexarse no posicionarán por ninguna keyword.

Herramienta: Screaming frog o Footprint

Solución: Yo no me preocuparía demasiado al menos que la paginaciones posicionen por encima de la página principal, en dicho caso lo que haría sería eliminar el título y metadrescription de las paginaciones para que de esta forma tuviera más peso a nivel de SEO la página principal, pero no optación por añadir el rel canonical a la primera página, aunque mucha gente diga que le ha funcionado.

Otra solución sería añadir el Noindex en las paginaciones, aunque los efectos a nivel de SEO son un poco más complicados de explicar.

Paginaciones

Sería un caso muy similar al anterior sobre títulos y metadescripciones duplicadas, en las paginaciones se suele duplicar el texto que tenemos en la primera página, lo que puede saltar las alarmas sobre contenido duplicado en algunas herramientas.

Herramienta: Screaming frog o Footprint

Solución: En este caso mi solución favorita sería igual que la del caso anterior, eliminar el texto que se está replicando en todas las las paginaciones, dejándolo solo en la primera página.

Web de Pruebas

En el caso de que un desarrollador monta una copia idéntica de la web original para hacer pruebas, pero se olvida de bloquear el acceso, Google accede al contenido y lo indexa.

Herramienta: Footprint

Solución: Lo más sencillo es que añadas la etiqueta Noindex en el Clon para que Google no indexe el contenido, aunque en este caso prefiero bloquear el acceso a la web mediante IP (que la web solo sea visible a través de una IP estática tuya, te dejo una guía)

Falta de Hreflang

Si queremos realizar una estrategia de SEO internacional, duplicando el contenido de una web principal en distintos dominios, esperando a que Google por si solo posicione cada contenido en un país concreto.

Herramienta: Screaming frog o Footprint

Solución: Para ello te recomiendo que eches un vistazo a este post sobre etiquetas hreflang.

Falta de etiqueta canonical en el dominio

La etiqueta canonical sirve para decir a Google que si existen dos URLs distintas con el mismo contenido cuál es la original de esas dos.

En el caso más común es cuando usamos  AMP en tu estrategia SEO tendrás dos URLs distintas con el mismo contenido, con la etiqueta canonical se le indica a Google que la URL AMP es canonical de la original.

Otro caso puede ser los buscadores internos dentro de una web, cuando se realiza una búsqueda interna se autogenera una nueva URL, esta nueva URL debe estar en Noindex y no debería estar enlazada desde ninguna URL interna.

En el caso de que sean indexables y estén enlazadas deberás vigilar de que contenga un rel canonical que apunte hacia una URL útil como puede ser tu home o una categoría principal en el caso de que la búsqueda se realice en una sección.

Herramienta: Screaming frog

Solución: Implementar rel canonical.

Contenido duplicado externo

Cuando un contenido se encuentra en dos sitios webs con diferentes duelos, esto puede pasar por los siguientes casos:

Copiando un contenido de otra web

Es lo que hacen las personas que quieren probar suerte haciendo un poco de Black (aunque más bien es una pérdida de tiempo en la mayoría de casos), consiste en ir a una web y copiar el contenido.

Herramienta: Footprint

Solución: En el caso de que te copien el contenido de forma literal es bastante complicado de solucionar, yo te aconsejaría que contactes con el dueño de la web y los soluciones de forma pacífica. En el caso de que no surta efecto tienes esta guía sobre cómo desindexar una URL en Google.

Compartir un artículo con otra web

Este caso se suele ver bastante con las notas de prensa, estas se basan en enviar el mismo texto a varios medios distintos a la espera de que publiquen la noticia para ganar un backlink.

Puede parecer una buena estrategia de Link Building, además de otros beneficios como enviar tráfico a tu site desde otras web, pero no soy muy amigo de esta técnica.

Herramienta: Footprint

Solución: Yo haría modificaciones en cada contenido que enviase a cada medio, de esta forma seguiría ganando autoridad y tráfico, además de que cada URL que me enlaza tendría un contenido único.

Conclusión

El contenido duplicado puede venir por distintas razones como hemos visto anteriormente, mi consejo es que vigiles bastante el contenido que hay tanto dentro como fuera de tu site para tenerlo controlado.

Aquí puedes ver más información externa sobre contenido duplicado:

antonio Muñoz

Antonio Muñoz

Enamorado del mundo del SEO y de la analítica web, cofundador de distintas agencias de SEO en España y a nivel internacional, SEO Manager y responsable de analítica web en Webempresa.

También soy todo un adicto a Netflix, Prime y HBO, y por supuesto a buen café expresso ;)