Underachievement Unlocked

Ma vie, mon oeuvre : beaucoup de potentiel et très peu de réalisation.

Très peu de posts sur ce blog, aussi. Mais vous trouverez peut-être quelque chose d’intéressant à lire si vous remontez de quelques années dans les archives.

7 jan. 2003

Tout réécrire ?

Il y a quelques jours, j’ai repensé au fait que la recherche par Google ne fonctionne pas sur mon site, et que j’ai dû coder la recherche moi-même à cause de ça. Et j’ai réalisé pourquoi Google me hait. Parce qu’ils sont jaloux. Que je sois un programmeur génial. Que je ne bosse pas pour eux malgré mon talent. Que mon site soit si bien. Qu’il soit en PHP.

Les adresses des pages de mon site sont toutes de la forme index.php?page=xxx&etc. Ce qui est mal pour plein de raisons, mais je viens tout juste d’en découvrir une nouvelle : Google (et probablement d’autres moteurs de recherche aussi) voit tout mes liens qui commencent par index.php, et décide qu’ils pointent tous vers la même page.

Les webmaster guidelines précisent : Si vous décidez d’utiliser des pages dynamiques (c’est-à-dire que l’URL contient un ’?’), soyez conscient que tous les robots de moteurs de recherche ne parcourent pas aussi bien les pages dynamiques que les statiques. Il vaut mieux que les paramètres restent courts, et que leur nombre soit réduit. Et c’est vrai que ma biographie, par exemple, bien qu’étant à l’adresse index.php?page=ego, a l’air d’être sur Google. Mais les archives du blog, non, parce que les paramètres sont plus loin, ou qu’ils sont plus gros, ou qu’ils ne s’appellent pas page. Je ne sais pas exactement, mais toujours est-il que, du blog, il ne reste que la page d’accueil dans les moteurs de recherche. Avec ça, comment espérer qu’on me trouve, par hasard, en cherchant du sexe sur le web ?

Au passage, ce problème ne concerne pas que moi. Il concerne aussi dendromatt, ce qui n’est pas étonnant vu que les scripts du site sont de la même famille que les miens. Mais, surtout, il y a des chances qu’il concerne également les utilisateurs de B2. Ceux de MovableType, GreyMatter, Pivot ou WhatHaveYou n’ont rien à craindre, mais B2 utilise le même style d’URL que mon site, donc il faut se méfier.

Si j’étais maître du serveur web qui héberge garoo.net, je pourrais utiliser le mod rewrite d’Apache pour transformer les URL en choses plus human-readable (comme a visiblement fait le créateur de B2). Mais ce n’est pas le cas ; je pourrais déménager le site sur le serveur dédié qu’on a qu’il est à nous, mais je n’aime pas l’idée de mettre tous ses oeufs dans le même panier. Enfin, ses oeufs, je ne sais pas, mais les miens à moi, j’y tiens. Alors, je vais être obligé de tout réorganiser, de changer toute la structure du site, de tout bouger partout, de créer un fichier PHP par post, de faire tout un bordel en arborescence sur le site, de transformer toute l’interface d’administration du blog et de génération des posts et des archives.

Ou alors, je peux décider de faire une croix sur Google. C’est bien aussi. C’est moins compliqué, surtout. Combien de lecteurs je gagnerais si j’étais correctement référencé ? Un demi ?

 

Archives

2001   01   02   03   04   05   06   07   08   09   10   11   12  

2002   01   02   03   04   05   06   07   08   09   10   11   12  

2003   01   02   03   04   05   06   07   08   09   10   11   12  

2004   01   02   03   04   05   06   07   08   09   10   11   12  

2005   01   02   03   04   05   06   07   08   09   10   11   12  

2006   01   02   03   04   05   06   07   08   09   10   11   12  

2007   01   02   03   04   05   06   07   08   09   10   11   12  

2008   01   02   03   04   05   06   07   08   09   10   11   12  

2009   01   02   03   04   05   06   07   08   09   10   11   12  

2010   01   02   03   04   05   06   07   08   09   10   11   12  

2011   01   02   03   04   05   06   07   08   09   10   11   12  

2012   01   02   03   04   05   06   07   08   09   10   11   12