Tag : duplicate-content

Trois outils pour vous aider à faire du contenu unique sur Internet

Tout le monde le sait pour émerger dans les résultats des moteurs de recherche il faut de la pertinence mais aussi de l’unicité. Produire du contenu unique est essentiel et parfois il faut s’aider de quelques outils pour être encore plus différent dans la rédaction de votre article. Voici trois petits outils à mettre en favori et à utiliser selon le besoin.

Le premier est un dictionnaire de synonymes proposé par le laboratoire CRISCO de l’Université de Caen. Vous mettez un mot l’outil vous proposera des synonymes classés par pertinence.

Le second outil est un outil pour calculer le taux de similarité (appelé aussi duplicate content) entre deux textes (votre source par exemple et votre article). Très simple aussi, il est basé sur les algorithmes Shingles pour définir un taux de similarité entre les deux textes (méthode utilisée par les moteurs). Un bon moyen de vérifier le caractère unique de votre article versus un autre site (source ou repreneur de votre l’information).

Le troisième outil est le plus simple, c’est un calculateur de nombre de mots. Presque rien à voir avec le caractère unique d’un article mais c’est pratique parfois de savoir de combien de mots est composé un article sans avoir à ouvrir word ou wordpress! Par ailleurs on sait que Google intègre le nombre de mots dans ses algorithmes de classement…

Avec ces trois outils vous voilà armé pour écrire du beau contenu unique et original pour vos lecteurs et les moteurs de recherche!


L’AFP grand créateur de duplicate content

Certes Google a annoncé qu’il ne pénalisait pas les sites au contenu dupliqué (duplicate content) dans le classement des sources dans l’index de son moteur de recherche. Quoiqu’il en soit beaucoup de sites d’information utilisent des news issues de l’AFP qui produit du contenu frais et le vend par abonnement à de nombreux sites.

Le hic c’est que les news AFP sont publiées sans aucunes modifications de la part des éditeurs ce qui revient à produire du bon duplicate content comme on l’aime. Regardez cette recherche dans Google. A ce petit jeu on pourrait presque compter le nombre de clients de l’AFP sur Internet!

Heureusement qu’il n’y a pas de pénalité et que la majorité de ces sites s’abonnent à l’AFP pour avoir des informations fraiches et ne cherchent pas le référencement dans google car la concurrence est rude!


Vol de contenu… Que c’est chiant à gérer

Petite prise de tête ce matin avec un forum sur le design qui pompe du contenu à tous les endroits de l’internet. Regardez cet exemple c’est flagrant :

Le texte d’origine et la page du forum ici. C’est la version en cache de Google car l’auteur à modifié son texte depuis.

Lisez les commentaires de ce thread de ce forum je me fais ouvertement descendre, ils ne comprennent rien ces jeunes…

Sinon ce forum et ce blog sont truffés d’articles volés (ou a peine réécrit) et en plus ils sont font du blé avec adsense :

exemple sur le forum : la source, le voleur,
exemple sur leur blog : la source, le voleur

Ne pensez pas que je leur fasse de la pub ils ont un beau rel=nofollow sur l’url…

Conclusion je vais watermaker toutes les images maintenant!


Duplicate Content sortez les armes…

Pourquoi quand je recherche dans google une phrase issue de l’un des articles de 2803 (celui sur les outils pour optimiser ses sites par exemple) j’ai 46 réponses différentes (sites différents donc) et que ce $£#€ d’article original n’est qu’en troisième page…

google duplicate content

En effet cela n’est pas normal, j’ai fait en premier lieu le ménage sur mes propres sites pour limiter ce problème (cf les pages 4 et 5 de la recherche, les flux rss de la sidebar à viré). Les autres sites reprenant l’intégralité du flux rss se sont tous pris aujourd’hui un méchant email de ma part pour leur expliquer que cela n’allait pas dans le bon sens et que google n’appréciait certainement pas que ma prose soit publiée sur 46 supports à la fois…

Vous l’avez compris je lutte activement en ce moment contre le duplicate content et cela fait peur au vu de l’ampleur de la tâche… Car gardez bien à l’esprit que ces sites ne vous envoient pratiquement pas de visiteurs (j’ai les stats de chacun et c’est minable).