Categorie : seo

Pourquoi mettre en place un fichier robots.txt dans votre site

Les moteurs de recherche naviguent sur vos blogs et sites à la recherche de contenus à indexer. Malheureusement ces robots sont un peu gourmands et prennent donc tout ce qu’ils trouvent lors de leur exploration. Afin de les aider dans leur quête il est recommandé de mettre un petit fichier texte à la racine de votre blog afin de donner des directives sur la manière d’explorer votre site avec des go no go en fonction des dossiers ou types de fichiers.

Voici une illustration de l’intérêt d’un fichier robots.txt :

robots.txt

Avant de rentrer dans le vif du sujet il faut obligatoirement placer le fichier robots.txt à la racine de votre blog ou site. Mettre ce fichier dans le dossier « blog » si votre adresse est http://www.mondomaine.com/blog ne sert à rien il faut le mettre dans le dossier racine. En revanche si vous avez des sous-domaines il est possible de mettre en place un robots.txt par sous-domaine (ce que j’ai fait pour les blogs 2803).

Alors quoi mettre dans ce fichier robots.txt? Plutôt que des longs discours voici le fichier robots.txt de 2803 :


Sitemap: http://www.vingthuitzerotrois.fr/wp-sitemap.php

User-agent: *
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: /cgi-bin/
Disallow: /addons/
Disallow: /test/
Allow: /wp-sitemap.php

User-agent: Googlebot
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /z/
Disallow: /wp-*
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.txt$
Allow: /wp-content/uploads/
Allow: /wp-sitemap.php

User-agent: Googlebot-Image
Allow: /*

Voici quelques explications sur ce fichier txt vraiment important.

Notez que j’utilise plusieurs directives en fonction des « User-agent » (* pour tous les robots des moteurs de recherche, googlebot pour le robots de google, et Googlebot-Image pour le robots d’images de google).

La commande « Disallow » me permet d’interdire l’indexation d’un dossier ou d’une URL intégrant le chemin interdit.

A l’inverse la commande « Allow » autorise et vient en contradiction avec la « Disallow ». Par exemple si l’on a interdit une extension de fichier .php pour mon cas d’où un « Allow: /wp-sitemap.php ».

Pour le Googlebot mes restrictions sont encore plus importantes puisque j’interdis tout simplement l’indexation de fichiers dont l’extension se termine par php, js, xhtml, css… Cela permet de faire le ménage dans l’index de google et de diminuer sensiblement le « duplicate content« . En effet, en faisant cela j’interdis l’indexation du fichier index.php qui s’apparente à du « duplicate content » par rapport au nom de domaine sans index.php et qui affiche la même chose.

Bien entendu ce robots.txt est à adapter au cas par cas en fonction de la plateforme de blog et des dossiers à interdire ou non. Pour tester son fichier et pour valider que vous n’avez pas fait d’erreurs il est possible de le tester ici (bien pratique comme outil d’ailleurs).

robots.txt


Différence de comportement des visiteurs en fonction des moteurs de recherche

En regardant mes statistiques j’ai pu constater que les visiteurs n’avaient pas la même attitude en fonction du moteur de recherche de provenance. Voici les différences, regardez notamment le nombre de pages vues par visiteur (données sur les 6 derniers mois) :

analyse moteurs de recherche

Les visiteurs venant de MSN sont donc plus attentifs et visitent un peu plus de pages que ceux des autres moteurs. Yahoo génère lui aussi un nombre de pages vues honnête 2,1, Google étant l’un des plus faible pourvoyeur. Certainement que les utilisateurs en provenance de Google sont des chercheurs plus exigeants ou plus habitués à la recherche d’informations… Wikio est à un niveau tout à fait honorable pour un moteur aussi jeune…

Faites vous aussi le même constat?


Impact de la TV sur la fréquentation d’un site Internet

Hier soir, tard dans la soirée, dans l’émission « le droit de savoir » consacrée à la décoration, il y a eu un reportage sur le jeune mais non moins talentueux designer Ora ïto. Dans le reportage TV on le découvre présentant ses produits dont la nouvelle cuisine qu’il a réalisée en collaboration avec une grande marque du genre, Gorenje.

Quelques minutes plus tard sur blog déco design, les mots clés tapés dans les moteurs de recherche étaient ceux-ci :

cuisine gorenje
ora ito gorenje
cuisine ora-ito
ora ito cuisines
gorenje ora ito
le emaile de ora ito
ora ito cuisine
ora ito cuisine gorenje
cuisines ora ito
cuisine gorenje ora ito
cuisine ora ito
frigo ora ito

Tous pointant vers les deux articles en rapport avec Ora Ito.

Premier constat : La TV peut donc être prescripteur pour des sites internet à partir du moment où votre référencement est efficace sur le sujet.

Second constat : Les téléspectateurs regardent la TV avec un PC sur les genoux (comme moi d’ailleurs), j’imagine aisément les achats d’impulsion face à sa TV.

Troisième constat : Les médias convergent de plus en plus et c’est très bien!

Je serais curieux de voir l’audience d’un site qui anticiperait les émissions TV afin de faire du SEO-TV et ainsi capter du trafic TV…


Impact du SEO sur un blog, 7 mois après

Souvenez vous fin 2006 je faisais quelques modifications pour améliorer le SEO de ce blog. Voici l’évolution des visiteurs en provenance des moteurs de recherche :

SEO keywords
(la bulle est située à un mois après les modifications sur 2803)

Alros je ne sais pas comment interpréter ce graphique mais l’évolution du nombre de visiteurs en provenance de Google, Yahoo and co m’a l’air un peu lié à ces quelques modifications qui je vous le rappelle sont présentées ici .

Pour information je n’utilise plus que le plugin « SEO Title Tag » sur ceux présentés dans le post initial. Par ailleurs, le plugin « Ultimate Tag Warrior » dans sa dernière version offre la possibilité d’intégrer dynamiquement les Tags dans une balise Meta Keywords.