Travaillant depuis plusieurs mois sur un projet basé sur l’API Yahoo, j’ai remarqué plusieurs choses intéressantes concernant les résultats retournés par Yahoo.
Ce post sur l’API Yahoo permettra d’introduire une série d’articles sur les stratégies de liens (sujet principal de mon stage).
De manière générale, j’ai remarqué que l’API ne fournissait pas la totalité des back links, elle ne fournit qu’un échantillon qui est néanmoins très représentatif de la popularité d’un site. Cet échantillon varie en général entre 1% et 80% de l’ensemble des liens entrants.

Quelques infos sur l’API.
Elle est gratuite, il suffit juste d’avoir un compte Yahoo! et de demander une clé d’authentification pour votre programme. Vous pouvez obtenir cette clé en quelques minutes. La limite quotidienne est fixée à 5000 requêtes (1 requête = 100 résultats maxi)
Plus d’infos : http://developer.yahoo.com/
Site wide links
Les « site wide links » sont des liens entrants (back links) situés sur toutes les pages d’un site (liens dans la barre latérale, en pied de page...).
Depuis que j’utilise l’API, j’ai fait environ 150 jeux d’essais. En réalisant ces tests, je me suis aperçu que Yahoo ne retournait qu’un échantillon de 2 à 3 pages par site. En effet, un lien peut être affiché sur toutes les pages d’un petit site (20 pages) ou alors d'un site de 10 000 pages, l’API ne retournera dans 98% des cas que 3 pages maximum.
Ces pages sont certainement celles qui reçoivent le plus de liens entrants et donc les plus populaires du site.
Néanmoins, ce nombre de pages par site peut varier en fonction des critères suivants :
- Quand plusieurs libellés (anchor text) sont utilisés sur l’ensemble du site.
Le nombre de pages par site retournées par l’API excède rarement 3. Par contre, si vous utilisez 10 libellés différents pour l’ensemble d'un site l’API vous retournera plus de résultats pour le site en question.
- Quand la structure de la page est différente.
Également, lorsque vous avez un site avec des pages qui se ressemble au niveau de leur structure et seul le contenu des pages diffère l’API ne retourne que 2 à 3 pages maximum. Notamment quand les liens sont placés aux mêmes endroits (barre latérale, pied de page…).
Par contre, quand vos pages sont structurées différemment et que les liens sortants sont situés à des endroits différents sur chaque page, l’API aura tendance à retourner un exemple de back link par structure/template.
L’échantillon
L’échantillon retourné peut varier entre 1 et 80% des pages indexées. Les sites dits « authority sites » auront un pourcentage plus important étant donné que se sont des sites cités sur une grande quantité de noms de domaine (avec des libellés très différents).
Les back links et les frames.
L’API Yahoo retourne en back link, les liens contenus dans des « frames ». En effet, Yahoo retourne la page mère à la Frame. Par contre à aucun moment je n’ai été confronté aux iframes.
Les liens vers les fichiers
J’ai également remarqué que les liens vers des fichiers PDF, JPG, GIF… étaient considérés comme des BL. (Pour Google, cela doit être la même chose étant donné qu’il affecte maintenant un Page Rank aux images…).
Le inline linking : l’utilisation de ressources externes
Quand une personne peu scrupuleuse affiche une image sur son site alors que cette dernière est hébergée sur un autre serveur, le fait d’utiliser cette ressource via la balise IMG est retourné (considéré) par l’API comme un lien entrant
Le langage HTML permet à quiconque d’afficher sur son propre site des ressources situées sur un serveur tiers. Cette fonctionnalité a beaucoup d’avantages mais parmi les inconvénients, on peut dans certains cas, voir sa bande passante utilisée par des tiers sans qu’aucune autorisation n’ait été accordée.
Ainsi, j’ai remarqué que Yahoo retourné en back link des pages dépourvues de lien sortant. En analysant la source HTML, je me suis rendu compte que ces pages affichaient des images hébergées sur le site que j’analysais.
Exemple de code hébergé sur le site du webmaster peu scrupuleux :
- <img src=http://www.lesitequejanalyse.com/image-pompee.jpg>
Je pense que ce genre de « back link img » a une importance moindre que les vrais liens (balise a) mais si Yahoo les retourne via l’API, c’est qu’ils doivent très probablement être inclus dans le calcul de la popularité.
De toute évidence, le fait d’utiliser une ressource externe peut être considéré comme un « vote » car seuls les ressources (images) ayant un intérêt particulier sont utilisées. Un peu comme les liens, plus le site est intéressant, plus il reçoit de liens.







