Cet article est extrait de mon mémoire rédigé en 2008, lors de mon stage aux USA.
Obtenir des liens (des votes) n’est pas chose facile, cet environnement hors page est très difficilement maitrisable. C’est pour cette raison que les moteurs attachent autant d'importance aux liens.Pour Google, un lien émis d’une page A vers une page B est assimilé à un « vote » de A pour B. S’il on projette le système de vote des moteurs via les liens vers un système électoral ordinaire, l’achat de lien pourrait être assimilé à de la corruption. Non?
Depuis quelques années, des sociétés se sont spécialisées sur un marché de niche qui consiste à faire du courtage de liens. En effet, des places de marchés pour liens sont apparues récemment.Acheteurs et vendeurs commercent des liens pour des montants allant de quelques dizaines d’euros à plusieurs milliers d’euros par an.
Le défi est d’obtenir un nombre important de liens entrants avec des libellés pertinents. Les responsables de ces sociétés de courtages sont partis de cette idée :
Un responsable de site internet peut engager quelqu’un et lui demander d’accomplir la lourde tâche qui consiste à mettre en place des échanges de liens, tout en sachant que le taux de réussite ne sera pas faramineux. D’une part ce travail demande un investissement considérable en temps (donc en argent) et d’autre part les moteurs de recherche attachent moins d’importance aux liens réciproques.

L’achat de liens est une pratique bannie par les moteurs de recherche car elle consiste à acheter des « votes » auprès d’autres sites. S’il on projette le système de vote des moteurs via les liens avec un système électoral ordinaire, l’achat de lien pourrait être assimilé à de la corruption. En l’occurrence l’achat de « votes » sur des sites tiers est une technique qui ne respecte pas les directives des moteurs.
Pourquoi un tel enthousiasme pour l’achat de liens ?
Pourquoi cette pratique croit de manière significative alors quelle est interdite et comme toute pratique non éthique, son utilisation peut entraîner un blacklistage. Ainsi, les sites achetant des liens peuvent se retrouver du jour au lendemain supprimés de l’index d'un moteur. Une telle sanction pourrait diviser par deux (voire plus) le trafic d’un site internet et de surcroit son chiffre d’affaires.
Sur le plan technique et algorithme il est quasiment impossible de distinguer un vrai lien d’un lien corrompu. Les algorithmes se basent sur le code sources HTML des pages pour suivre les liens.
- Lien naturel (non acheté)
</a> <a href=’http://www.site-acheteur.com’>
Expression concurrentielle
</a>
- Lien acheté (corrompu)
</a> <a href=’http://www.site-acheteur.com’>
Expression concurrentielle
</a>
Il n’y a absolument aucune différence entre le vrai lien et celui acheté, ainsi dans le calcul de pertinence ils auront le même impact. Seuls les trois acteurs ont connaissance de cette manipulation à savoir l’acheteur, le vendeur et la plateforme d’achat .
Auparavant, très peu de responsable de sites internet s’autorisaient à tricher car à l’inverse des liens, les manipulations dans le code HTML étaient identifiables voire flagrantes. De plus, l’impact des liens est bien plus important que toute autre technique de référencement.
Les limites de l’achat de liens
Cette méthode, comme toutes les tricheries a ses avantages et ses limites. Chaque année, de nouvelles méthodes de dopage sportif sont découvertes, notamment lors des compétitions de cyclisme.
Dans un premier temps, les manipulations sont indétectables mais au fur et à mesure du temps, les technologies évoluent et toutes les tricheries sont démasquées. Les ingénieurs chargés de la pertinence des moteurs de recherche travaillent certainement sur un patch permettant de corriger les failles liées à l’importance des liens.
Des solutions peuvent être envisagées, en effet, en analysant certains critères spécifiques sur les liens, il est possible d’en définir le degré/niveau naturel d’un site.
Les symptômes d’une popularité de liens artificielle
Google a déjà pénalisé des sites pour des raisons liées aux achats de liens. En effet, un processus de développement et de création de liens dit naturel est quelques peu différent du processus issu de pratiques non éthiques comme l’achat de liens.
Les libellés sur-optimisés
Un site qui achète des liens aura tendance à avoir comme libellés de liens entrant des mots clés concurrentiels.
Exemple : un site proposant des services de crédits en ligne (www.credit7895.com) aura pour libellés principaux les termes suivants :
Libellé |
Nombre d’occurrences |
Rachat de crédit |
52 |
Regroupement de crédit |
45 |
Rachat de prêt |
12 |
Rachat de dette |
5 |
credit7895 |
5 |
www.credit7895.com |
2 |
Hors un site ayant une éthique irréprochable aurait pour libellés des liens entrants les termes suivants :
Libellé |
Nombre d’occurrences |
credit7895 |
60 |
www.credit7895.com |
15 |
Cliquez ici |
7 |
Rachat de dette |
5 |
Rachat de crédit en ligne |
2 |
Regrouper ses crédits |
1 |
Rachat de crédit avec credit7895 |
1 |
L’analyse des libellés montre des différences entre les sites achetant des liens et les sites respectant les directives des moteurs. Néanmoins, cette information n’est pas assez fiable pour supprimer un site douteux d’un index.
L’analyse des IP des serveurs hébergeant les liens entrants (back links)
L’enchainement de plusieurs critères pourrait permettre de déterminer le profil d’un site (son degré artificiel). Un même serveur avec une seule adresse IP peut héberger plusieurs sites internet via plusieurs noms de domaine.
En analysant les liens entrants, il est possible d’extraire les adresses IP des différents serveurs et ainsi établir un profil plus ou moins naturel par domaine. Cette analyse part du principe que des liens artificiels sont hébergés par le même propriétaire, donc sur un seul serveur web.

Dans l’exemple précédent, l’analyse était effectuée sur les IP (245.1.11.25, 215.157.11.9,215.157.11.25) et le rapport différencié trois IP distinctes. Cela représenté un taux de IP/site de 100% (1 site = une IP)
L’analyse des classes C des serveurs hébergeant les liens entrants
En élaborant des rapports, non plus liés à l’IP même du serveur mais en se basant plutôt sur sa classe C, il est possible de détecter des similitudes.
Ainsi, l’analyse des classes C montre que deux sites sont situés sur une même classe C.
Classes C répertoriées :
245.1.11
215.157.11
Quand un site dispose d’un taux de classe C trop faible (inférieur à 50% par exemple) cela signifie qu’il y a grande chance que le propriétaire de ce dernier ait mis en place des liens non naturels afin de manipuler les algorithmes de pertinence des moteurs de recherche.
L’emplacement des liens sur la page.
Lors d’une interview accordée à Eric Enge en juillet 2008, le directeur produit de Yahoo! Search Technology a communiqué quelques informations concernant l’algorithme de pertinence du moteur Yahoo. Il a indiqué que les liens situés en pied de page ne sont pas pris en compte dans le calcul de la pertinence. Or, dans la plupart des cas, les liens achetés ou tout simplement artificiels sont situés en bas de page, cela a pour effet, d’éliminer les liens non naturels.
Seuls les liens dans le corps de la page voire même dans le corps du texte sont vraiment naturels. Dorénavant, seuls les liens apparents et destinés aux visiteurs sont comptabilisés par le robot de Yahoo. Cela a pour effet d’améliorer sa pertinence et la qualité du moteur.
On peut supposer que cette méthode soit généralisée pour tous les moteurs de recherche majeurs.
Le nombre de liens sortants (out going links)
Un site qui vend des liens, n’a rarement qu’un seul client, ainsi les pages ayant trop de liens sortants sont susceptibles d’afficher des liens artificiels. Une page ayant plus de 50 liens sortants sera dans la plupart des cas écartée de procédure de demande d’échange de liens.
Pour obtenir le nombre de liens sortants, vous pouvez utiliser des outils comme celui que j'ai développé en stage. Pour le trouver, il suffit de chercher "link counter tool" sur Google.
La géo-localisation des liens
Dans les stratégies de référencement internationales, l’importance du pays de domiciliation du serveur est élevée. Il en est de même pour la géo localisation des liens entrants. Ainsi, si un site hébergé en France ne reçoit que des liens en provenance d’autres pays, le niveau naturel (son profil) sera affaibli.
Des sites français ont déjà été sanctionnés pour avoir trop de liens « suspects », ces sites avaient établis des partenariats ou achetés des liens en Roumanie et en Pologne. D’autres sites américains ont quand à eux été pénalisés pour avoir des liens entrants en provenance de Chine ou d’Inde.
Techniquement, la géo localisation d’un lien est identifiable via l’adresse IP du serveur hébergeant la page.






