Le site communautaire du dropshipping

Duplicate content et dropshipping

Dans le cadre de procédures automatisées de remontées de catalogues produits telles qu’elles sont pratiquées par les plateformes professionnelles de dropshipping, une des difficultés majeures pour les revendeurs réside dans le duplicate content (duplication de contenu). Sur les milliards de documents indexés par les moteurs de recherche, l’enjeu est considérable puisque les algorithmes sont en mesure d’identifier des mêmes contenus à des adresses différentes et donc, parfois, de considérer comme contenu de moindre intérêt des pages à contenu identique. Comment s’en prémunir ?

La première question à se poser consiste à savoir quels sont les relais d’information sur les produits.

Si vous travaillez uniquement avec les market-places (Amazon par exemple), le contenu dupliqué aura moins d’importance que dans d’autres cas de figure. En effet, pour l’affichage d’un produit donné (dont la clé est bien souvent un code barre unique) la market place crée une seule et unique page d’information sur le produit, page sur laquelle figure  les différents prix pratiqués par les vendeurs. En d’autres termes, une seule et unique page concernant le produit sera identifiée par le moteur de recherche. Cela signifie aussi que vous n’avez pas la main sur les informations relatives au produit concerné. Les comparateurs de prix fonctionnent sur le même procédé.

Là où l’affaire se corse, c’est lorsque vous vendez uniquement sur votre site web, en dehors des marketplaces ou comparateurs de prix. Dans ce cas, vous ne pourrez malheureusement pas vous contenter de récupérer le flux d’information produit depuis la plateforme de dropshipping puisque ces flux sont identiques pour les revendeurs. Du coup, les moteurs de recherche vont considérer, lors de l’exploration de vos pages , que le contenu est très (trop) proche d’autres pages web qui ont pu relayer les mêmes descriptifs avant vous. La désindexation, partielle ou totale, des pages dépend notamment de la quantité de contenu dupliqué sur un site.

Si les moteurs font la chasse à ce fameux duplicate content, c’est surtout parce que, pendant longtemps, les contenus étaient volontairement dupliqués par des webmasters peu scrupuleux qui souhaitaient manipuler le classement des moteurs.

Aussi, pour améliorer la pertinence des réponses proposées, le moteur de recherche décidera de ne présenter de prime abord que les pages considérées comme « originales ». Cela ne signifie pas qu’il supprime les pages dupliquées, mais plutôt qu’il les classe dans une sorte de répertoire secondaire. Ainsi, Google, lorsqu’il identifie un contenu dupliqué, propose un lien en bas de page stipulant « Pour limiter les résultats aux pages les plus pertinentes, Google a ignoré certaines pages à contenu similaire. Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées« . Ces opérations permettent aux moteurs de gagner en pertinence en évitant d’afficher de nombreux doublons pour une même requête.

Lorsqu’un moteur identifie deux contenus identiques, comment fait-il sa sélection pour savoir lequel dispose du contenu original ? C’est là un problème considérable pour les moteurs de recherche : Imaginez la difficulté pour un algorithme de relayer et classer des actualités d’agences de presses lorsque les actualités publiées sont, par défaut, identiques. Google, dans ce cas, précise qu’il prendra comme contenu original le site le plus populaire au PageRank important (AFP par exemple). Or, le « scoop initial » a peut être été publié par un autre site web.
Pour répondre à ces problématiques, différentes techniques sont mises en œuvre : il existe désormais des liens de type « canoniques » (pour spécifier au moteur que l’article que je publie est basé sur un autre dont je fournis l’adresse); la date de publication de l’article, l’indice de confiance de l’éditeur du site, son champ lexical, etc… peuvent également entrer en ligne de compte.

Dans un tel environnement, nous conseillons donc fortement aux revendeurs de ré-écrire les fiches produits afin qu’elles présentent un contenu original. L’idéal est de fournir du contenu en quantité suffisante (150 mots minimum qui reprendront les grandes caractéristiques des produits vendus). Dans le cas de produits déclinés (un même produit cosmétique en différentes contenances par exemple), nous vous invitons à créer des déclinaisons de telle sorte que, sur une seule et même page, votre client puisse avoir une liste déroulante des combinaisons (taille,couleur,contenance,etc…). Parallèlement, essayez d’obtenir des liens externes vers votre site qui soient des liens de qualité, améliorant de fait le référencement naturel du site. Evitez d’utiliser nos grandes familles de produits, et reclassez votre catalogue dans une arborescence qui vous soit propre et originale, en fonction de la thématique de votre site internet. Soyez également vigilants à ne pas proposer un même produit à description identique sur des pages avec des url différentes. Au-delà du contenu des fiches produits à proprement parler, vous avez tout intérêt à bien travailler vos balises « title », « description » et « keywords », en les personnalisant. Ces balises devront être différentes d’une page produit à l’autre, sous peine de pénalités de référencement. Un soin particulier devra être apporté aux balises « title » et « description », dont l’écriture devra correspondre au contenu réel de la page, avec une parfaite cohérence.

En attendant, pour éviter d’être pénalisé par les filtres du duplicate content, prenez un peu de temps pour ré-écrire vos fiches. Cela améliorera votre référencement naturel et vos ventes.