Blog webmaster xhtml xml asp net c# linq tutorial tuto totoriaux css
Referencement
Webmaster
Xhtml / Css
ASP.NET
C#
Xml, Sql Server, Linq
Articles > Referencement > Article référencement avancé - Méthode LSI où comment voir plus loin...

Article référencement avancé - Méthode LSI où comment voir plus loin...

Cela fait longtemps que de nombreux sites essaient de faire des guides type "how to" pour référencer un site.

Le problème de ces articles est qu'ils sont incomplets. On y revoit encore et toujours les mêmes conseils (certes importants) adressés toujours au même public. Pour aller plus loin, il faut toujours chercher des sites et articles plus pointus et travailler son site dans la durée.
Certains s'acharnent avec succès dans cette optique, d'autres cherchent sans cesses des résultats à court terme.

Un billet posté sur webRankInfo mérite un coup d'oeil. Il traite de la méthode LSI : Latent Semantic Analysis. Pourquoi un tel intérêt pour une méthode hypothétique ? Tout simplement parce qu'elle illustre bien ce qu'est devenu le référencement.

Au départ des moteurs de recherche, à l'age d'or d'altavista et de Yahoo, les balises meta "keywords", "title" et "description" étaient ce qu'il y avait, disait-on, de plus important pour référencer un site Internet. Avec les efforts de pertinence des moteurs, nous avons vu le référencement évoluer vers des conseils techniques plus poussés et des techniques, des trucs... Après les différentes techniques de spam, pages satellites, bombing et cloaking, on parle aujourd'hui, de nombreuses théories, toujours plus élaborées.

La méthode LSI

Qu'est-ce que "Latent Semantic Analysis" ? Ces mots "barbares", souvent présentés comme compliqués, expliquent un concept plutôt simple. La méthode est basée sur l'hypothèse que les moteurs de recherche tenteraient de déterminer le "sujet" de votre site en analysant votre contenu. Ce serait donc l'extension d'un résonnement qui commence avec l'analyse de la "densité idéale" ou du "poids" d'un mot clé dans votre page web.
La différence est que la méthode LSI ne compte pas la récurrence d'un mot clé mais l'analyse de termes proches. Elle encourage donc l'utilisation de mots différents et non plus la répétition de mots identiques. Par exemple, un site dont le sujet principale serait l'assurance de véhicule ne répèterait plus les mots assurance et voiture mais se "disperserait" un petit peu dans des synonymes pour assurance et différents types de véhicules. Ainsi, au fil des pages, le moteur de recherche pourrait "comprendre" ce dont parle votre site, au delà des mots clés employés.

Cependant, peu de monde pense que cette méthode est à ce point évoluée dans les moteurs de recherche. Au mieux, certains référenceurs pensent que cela a de l'incidence sur le "poids" des mots clés. D'autres "aident" les moteurs de recherche grace à un autre point largement abordé par les "how to" les plus simple : les liens internes.
Ainsi, Cendrillon sur WRI raconte pour son expérience : une page qui parle d'imprimante, nous aurons tendance à générer des liens vers d'autres modèles d'imprimantes, et si cette page parle plus particulièrement d'imprimante HP, alors nous générons des liens vers d'autres modèles d'imprimantes HP (c'est ce que nous appellons "génération de liens thématique")

Tout cela vous parait un peu "fou" ? Il ne faut pas. Un site sur lequel on se donne du mal grimpe largement dans les moteurs de recherche. Telcordia annonce que la méthode LSI peut faire gagner 30% de traffic, le laboratoire de recherche de Microsoft a déjà publié plusieurs "white papers" sur le sujet, ainsi que de nombreuses universités. Nous pouvons aussi parler des rachats et recherches de Microsoft (le plus gros budget R&D) dans le domaine des "questions naturelles" (qui éviteraient la recherche par mots-clés "classique"), les brevets déposés...
Dans ce cas là, on pourrait alors changer de point de vue et au lieu de dire "est-ce que google utilise la sémantique ?", on pourrait se demander "combien de temps faudra-t-il aux moteurs avant de nous pousser plus encore dans cette voie ?"...

Après ces nombreuses suppositions, nous ne pouvons être certains que d'une chose : les bons référenceurs ont de beaux jours devant eux... En attendant, vous pourrez chercher à maitriser les concepts de la méthode LSI et de la sémantique en général en vous penchant sur les sites et articles ci-dessous...

Telcordia Latent Semantic Indexing (LSI) Demo Machine (recherche)
Microsoft : From Latent Semantics to spacial hypertexts
Travaux universitaires : LSI related publications (articles, reports and books)
Newsletter Alexandra : Google and Latent Semantic Analysis.

This web site uses Kentico CMS, the content management system for ASP.NET developers.