jeudi 11 juin 2009

Comment optimiser un site en plusieurs langues pour les moteurs de recherche ?

Hitomi Studio n’a pas pour objectif de travailler avec des clients étrangers pour le moment, mais nous envisageons néanmoins de mettre en place une version anglaise de son site très bientôt. Cross Meter, l’application Air pour les propriétaires de boutiques Magento que nous sommes en train de concevoir, a en effet vraiment une portée internationale.

Et il serait dommage que les visiteurs anglo-saxons en provenance de Cross Meter et arrivant sur le site d’Hitomi Studio se retrouvent avec un contenu uniquement en français. Du coup, comment faire pour internationaliser ce dernier, surtout en prenant en compte les problèmes de référencement ?

Détection de la langue

Il existe tout d’abord différentes méthodes pour détecter la langue d’un visiteur :

  1. Analyser l’entête Accept-Language de la requête HTTP. Cette dernière contient en effet la liste des langues préférées de l’utilisateur, classée par ordre de priorité.
  2. Utiliser l’adresse IP de l’utilisateur pour déterminer dans quel pays il se trouve et en déduire la langue (il existe des bases de données pour effectuer ce genre de correspondances).

Ensuite, plusieurs stratégies sont envisageables. Soit le site va servir de manière totalement transparente le contenu dans la langue détectée, soit il va servir la langue par défaut et alerter l’utilisateur (grâce à un simple message) sur la disponibilité d’une version dans la langue qui a été détecté. Dans tous les cas, il faut prévoir sur son site une option pour que l’utilisateur puisse changer la langue de lui-même.

Pas de modification des urls

Dans ce premier cas de figure, la langue du visiteur est détectée et le contenu est servi en fonction de cette langue, sans le rediriger sur une page ou un domaine spécifique :

  • http://www.hitomistudio.com/company

Avantages

Une seule url à communiquer (.com)

Inconvénients

Le contenu de la langue secondaire n’est pas indexé

Noms de domaine séparés

Dans ce cas, il y aura un site en .com avec le contenu anglais et un site en .fr avec le contenu en français. Coca-Cola utilise par exemple cette stratégie (voir son site italien, français, …) :

  • http://www.hitomistudio.fr/societe
  • http://www.hitomistudio.com/company

Avantages

Les deux sites seront indexés correctement et indépendamment

C’est l’approche qui semble la plus logique

Inconvénients

Il faut communiquer sur la bonne url suivant les interlocuteurs

La position des sites dans les résultats des moteurs de recherche ne sera pas identique

Nom de domaine commun avec sous-domaines séparés

Lorsque le visiteur arrive sur le site en .com, il est automatiquement redirigé sur le sous-domaine de la langue détectée. C’est l’approche adoptée par exemple par Yahoo :

  • http://fr.hitomistudio.com/societe
  • http://en.hitomistudio.com/company

Avantages

Une seule url à communiquer (.com)

Un seul site est indexé et visible dans les résultats des moteurs de recherche

Inconvénients

L’espace de nommage des sous-domaines est pollué

Urls avec identifiant de la langue

Lorsque le visiteur arrive sur le .com, il est automatiquement redirigé sur une url comportant l’identifiant de la langue détectée. IBM a choisi cette méthode :

  • http://www.hitomistudio.com/fr/societe
  • http://www.hitomistudio.com/en/company

Avantages

Une seule url à communiquer (.com)

Un seul site est indexé et visible dans les résultats des moteurs de recherche

Inconvénients

Les urls sont plus longues et plus complexes

Le système de la page de garde

L’idée ici est simplement de mettre en place une page de garde (sur le .com) qui permettra au visiteur de choisir le pays et la langue souhaités. En fonction de son choix, il se retrouvera donc par exemple sur la version anglaise ou française. Un cookie est créé avec cette information, ce qui permettra de court-circuiter cette page lors de ses prochaines visites. Ce système peut s’appliquer quel que soit la stratégie adoptée et permet ainsi de ne communiquer que sur une seule url. Air Canada et Coca-Cola ont ainsi fait ce choix.

A ne pas oublier

Cet article se focalise surtout sur le schéma d’urls à mettre en place. Outre le titre et le contenu lui-même, il ne faut pas oublier que d’autres paramètres doivent également être modifiés en fonction de la langue utilisée :

  • Attributs de la balise XHTML précisant la langue de la page :
    fr” lang=”fr“>

  • Metatag précisant la langue du contenu :
    fr-FR” />

  • Metatag contenant la description de la page :
    création de sites ecommerce …” />

  • Metatag contenant la liste des mots-clés de la page :
    boutique, vente en ligne, …” />

  • Tout autre metatag dont le contenu doit être localisé :
    © 2009, tous droits réservés” />

Et bien sûr, il faut que les urls elles-mêmes soient localisées. On aura par exemple pour le site anglais :

  • http://www.hitomistudio.com/company
  • http://www.hitomistudio.com/usecases

Et pour le site français :

  • http://www.hitomistudio.fr/societe
  • http://www.hitomistudio.fr/usecases

Petite précision

Les spécialistes de l’internationalisation et de la régionalisation auront remarqué que je fais l’amalgame entre langue et pays. Heureusement, certains sites prennent bien en compte ces deux points correctement, comme par exemple IBM et Air Canada :

  • http://www.ibm.com/us/en/
  • http://www.aircanada.com/france/en/

Pour conclure

Cet article ne constitue vraiment qu’une première approche. Mes compétences en optimisation pour les moteurs de recherche et en internationalisation étant limitées, il comporte peut-être quelques inexactitudes. Vous êtes donc tout à fait les bienvenus pour le corriger ou le compléter dans les commentaires.

Pour le moment, je pense m’orienter vers la solution suivante :

  • Détection automatique de la langue en fonction de l’entête Accept-Language
  • Redirection automatique sur la version de cette langue
  • Utilisation des urls avec identifiant de la langue
  • Ajout d’un sélecteur de langue dans le pied de page
  • Page de garde qui permet de choisir entre la version française et anglaise

La page de garde n’apparaîtra seulement que lorsque la détection de la langue aura échoué. Au niveau des urls, cela va donner le schéma suivant :

  • http://www.hitomistudio.com
  • http://www.hitomistudio.com/en/usecases
  • http://www.hitomistudio.com/fr/exemples

Qu’en pensez-vous ? A votre avis, quelle est la meilleure stratégie à suivre pour optimiser le référencement d’un site en plusieurs langues ?

Aucun commentaire:

Enregistrer un commentaire