Inside AdSense-Français
Le Blog officiel AdSense en français
Optimiser le crawling et l'indexation de votre site
vendredi 14 août 2009
Niveau Webmaster: intermédiaire -avancé
La plupart de nos éditeurs étant également Webmasters et suite aux commentaires positifs reçus à propos de la section "
Qualité de recherche
" sur ce Blog, nous sommes heureux de vous proposer un nouvel article qui vous aidera à mieux comprendre l'optimisation de l'indexation de votre site et qui, nous l'espérons, vous sera utile.
De nombreuses questions sur l'architecture d'un site, le crawling, la navigation, voire même les questions de classement, peuvent être réduites à une question centrale: les moteurs de recherche peuvent-ils parcourir facilement votre site ? Vous trouverez dans notre présentation les points importants à retenir (en anglais):
http://googlewebmastercentral.blogspot.com/2009/08/optimize-your-crawling-indexing.html
Le web est immense
; du contenu est créé à tout moment. Face à un nombre infini de contenu disponible en ligne, les ressources de Google ne sont pas infinies. Googlebot peut donc trouver et parcourir une section limitée de ce contenu. De plus, à partir du contenu parcouru, seule une portion est indexée.
Les URLs sont des passerelles entre votre site et les robots des moteurs de recherche: les robots doivent être à même de trouver et de traverser ces passerelles (par exemple trouver et parcourir vos URLs) afin d'obtenir le contenu de votre site. Si vos URLs sont compliquées ou en double, les robots vont perdre du temps à les trouver et parcourir toutes vos URLs. Si vos URLs sont organisées, et mènent directement à un contenu précis, les robots peuvent passer du temps plus utilement sur votre contenu ; au lieu de parcourir des pages vides, ou le même contenu sur des URLs différentes.
Dans la présentation (en anglais), vous trouverez des exemples de ce qu'il ne faut pas faire - de vrais exemples (les noms ont été changés) - des URLs maison avec des hacks, des encodages, des paramètres dans l'adresse de l'URL, des espaces de crawl infinis, et plus. Vous trouverez aussi des recommandations pour aider les robots à trouver votre contenu plus rapidement, dont:
- enlever de l'URL les détails spécifiques à l'utilisateur.
les paramètres qui ne changent pas le contenu de la page - comme les identifiants de session - peuvent être enlevés de l'URL et mis dans un cookie. En mettant cette information dans un cookie et en faisant une redirection 301 de cette URL vers une URL "propre", vous gardez l'information tout en réduisant le nombre d'URLs qui pointent vers ce même contenu.
- contrôler les espaces infinis.
Avez-vous un calendrier avec des liens vers un nombre infini de dates dans le passé ou le futur (chacune avec une URL unique) ? Avez-vous des pages formatées qui retournent un code 200 quand vous ajoutez &page=3563 à l'URL, même s'il n'y a pas un grand nombre de pages avec du contenu ? Si vous avez répondu oui, c'est que vous avez un
espace infini de crawl
sur votre site. Les robots vont gaspiller leur bande passante et la vôtre à essayer de tout parcourir. Lisez ces conseils afin de contrôler ces espaces infinis.
- désactiver les actions que Googlebot ne peut accomplir.
En utilisant le fichier
robots.txt
, vous pouvez désactiver le crawling des pages d'identification, les formulaires de contact, les paniers d'achat, et toutes les pages qui ont une fonctionnalité qui ne peut pas être effectuée par Googlebot. Cela permet aux robots de passer plus de temps à parcourir du contenu qu'ils peuvent utiliser par la suite.
- une URL, un contenu.
Dans un monde parfait, il y a une URL pour un contenu. Chaque URL mène vers un contenu unique, et chaque contenu unique peut être accédé à partir d'une URL. Plus vous vous rapprochez de cet idéal, plus il sera facile pour Googlebot de le parcourir et de l'indexer. Si votre CMS ou l'organisation de votre site ne vous facilitent pas la tâche, utilisez l'attribut
rel=canonical
pour indiquer l'URL préférée d'un contenu spécifique.
Si vous avez des questions sur l'optimisation de votre site pour le crawling et l'indexation, consultez notre
FAQ: Crawling, indexation
et classement ou les articles écrits à ce sujet dans
Aide au référencement
, ou allez dans le
Forum d'entraide pour les webmasters
.
Posté par Susan Moskwa - Webmaster Trends Analyst
Catégories
+1
10 ans; 10 éditeurs
AdSense pour les jeux
AdSense pour les Vidéos
Anniversaire AdSense
Autres
Autres Produits Google
Débutants
Divers
En savoir plus sur...
enquête
Evènements AdSense
Expériences d'autres éditeurs
Fonctionnalités
Google Display Network
Mobile
Nouvelle interface AdSense
Optimisation
Paiements
Politique
Pubtalk
Qualité de recherche
Rapports de performance
Règlement
Revenus
social
Témoignages Editeurs
Utilisateurs avancés
Vidéo
Archives
août
( 1 )
avr.
( 1 )
mars
( 1 )
juin
( 5 )
mars
( 3 )
févr.
( 3 )
janv.
( 1 )
nov.
( 1 )
oct.
( 2 )
sept.
( 2 )
juin
( 8 )
mai
( 13 )
févr.
( 1 )
déc.
( 5 )
nov.
( 11 )
oct.
( 9 )
sept.
( 10 )
août
( 6 )
juil.
( 4 )
juin
( 2 )
mai
( 2 )
avr.
( 4 )
mars
( 7 )
févr.
( 5 )
janv.
( 5 )
déc.
( 8 )
nov.
( 5 )
oct.
( 3 )
sept.
( 4 )
août
( 4 )
juil.
( 6 )
juin
( 7 )
mai
( 8 )
avr.
( 10 )
mars
( 12 )
févr.
( 7 )
janv.
( 8 )
déc.
( 5 )
nov.
( 4 )
oct.
( 5 )
sept.
( 1 )
août
( 2 )
juil.
( 4 )
juin
( 6 )
mai
( 5 )
avr.
( 11 )
mars
( 7 )
févr.
( 7 )
janv.
( 2 )
déc.
( 4 )
nov.
( 3 )
oct.
( 3 )
sept.
( 6 )
août
( 10 )
juil.
( 9 )
juin
( 6 )
mai
( 7 )
avr.
( 7 )
mars
( 7 )
févr.
( 10 )
janv.
( 6 )
déc.
( 3 )
nov.
( 7 )
oct.
( 5 )
sept.
( 8 )
août
( 8 )
juil.
( 7 )
juin
( 5 )
mai
( 5 )
avr.
( 7 )
mars
( 6 )
févr.
( 10 )
janv.
( 9 )
déc.
( 12 )
nov.
( 10 )
oct.
( 9 )
sept.
( 7 )
août
( 7 )
juil.
( 13 )
juin
( 7 )
Feed
Liens utiles
Get started with AdSense
Sign in to your account
AdSense Help Center
AdSense Help Forum
Envoyez vos commentaires dans
le Centre d'aide Google
.