Si vous vous intéressez (un peu) au SEO, vous entendrez sûrement parler de Google Penguin, un algorithme de Google. Dans cet article, j’ai décidé de vous en dire un peu plus sur le Pingouin en question. A quoi sert-il ? Est-ce important pour votre site de le connaître ? Quelques éléments de réponse !
Google Penguin, un algorithme de Google parmi d’autres
Pour fournir aux internautes des réponses aussi pertinentes que possible, Google doit analyser plusieurs centaines de critères : le code des sites, leur contenu (que veulent dire les pages ? Sont-elles qualitatives ou pas ?), les liens que reçoit une page, etc. Pour mener à bien cette analyse, le moteur de recherche s’appuie sur une multitude de programmes informatiques, de formules, de calculs complexes : les algorithmes.
C’est grâce à eux que Google va pouvoir en permanence analyser les sites, essayer de comprendre de quoi ils parlent, de déterminer s’ils sont dignes de confiance, etc. Le but étant, à terme, de positionner les pages d’un site en fonction de leur pertinence, pour répondre à la perfection aux interrogations des internautes !
Certains algorithmes sont « spécialisés », c’est-à-dire qu’ils analysent des aspects précis d’un site. Par exemple…
- L’algorithme Rankbrain est basé sur l’intelligence artificielle : il permet à Google d’apprendre au fil du temps à mieux interpréter la complexité du langage humain.
- L’algorithme Panda s’intéresse à la qualité du contenu et essaie de détecter les pages qui ont un contenu de mauvaise qualité (contenu trop faible, contenu copié sur un autre site, etc).
- L’algorithme Google Penguin, lui, cible plus spécifiquement les liens qui sont faits vers votre site.
Les algorithmes évoluent en permanence. Google effectue plusieurs centaines de mises à jour chaque année. Beaucoup passent inaperçues… mais certaines impactent de manière importante les classements, tout en permettant de mieux comprendre le fonctionnement du moteur de recherche.
En effet, si des sites s’écroulent dans les résultats Google à une même période, on peut non seulement suspecter une mise à jour… mais aussi essayer de repérer ce que ces sites ont en commun. Il existe même une « météo des SERPs » sur certains sites, qui essaie de repérer les mouvements inhabituels dans les résultats de recherche.

Et l’algorithme Google Penguin, c’est quoi alors ?
L’algorithme Google Penguin a été lancé en avril 2012 et a subi depuis cette date plusieurs mises à jour majeures. Depuis septembre 2016 et la sortie de Penguin 4.0, Google Penguin fait partie de l’algorithme principal de Google : ça signifie qu’il est mis à jour en continu et « surveille le web en permanence ». Mais que surveille donc ce pingouin là ?
Les liens, au cœur d’une stratégie de référencement
Pour comprendre Google Penguin, il faut rappeler que le référencement d’un site ne s’appuie pas seulement sur le contenu qu’il comporte ou sur la façon dont le site est codé et organisé, mais aussi sur les liens que le site reçoit. J’avais d’ailleurs consacré un article aux bases du netlinking.
Ces liens sont autant d’indications sur la qualité d’une page, c’est un peu l’équivalent du « bouche-à-oreille » dans la vraie vie : si on parle de vous sur d’autres sites, que ces sites sont fiables et pertinents par rapport à votre thématique, les liens vous donnent un « vote de confiance » auprès de Google.
Un site de référence est censé recevoir des liens de manière naturelle par la simple qualité de son contenu.
Google Penguin, le gendarme du netlinking
Certains webmasters ont tenté par le passé de tricher et de manipuler les résultats de recherche en créant de nombreux liens vers leur site web sur d’autres sites de piètre qualité, avec des ancres optimisées pour tenter d’améliorer leur positionnement. Par exemple, imaginez un blog mode qui irait poster des dizaines de commentaires, de liens sur des forums ou des annuaires, de liens sur des sites sans aucun rapport avec la mode, en faisant à chaque fois le lien sur le mot clé « blog mode ».
Cette technique est encore utilisée par certains afin de nuire à des « concurrents » (on parle de negative SEO ou NSEO), l’agence Eskimoz en a par exemple fait les frais.
Google Penguin est intervenu pour pénaliser ces pratiques de netlinking abusives.
L’algorithme, aujourd’hui, a un fonctionnement plus fin qu’à ses débuts : il serait capable d’analyser individuellement chaque page ou groupe de pages au lieu de pénaliser un site dans son ensemble par défaut.
Comment éviter une pénalité liée à Penguin ?
D’abord, il faut être très prudent lorsque vous réalisez des liens dans le but de promouvoir votre propre blog. Prudence, en particulier, si vous…
- … multipliez les commentaires de blog publicitaires avec un lien vers votre propre site.
- … mettez systématiquement un lien vers votre site sur des sites dont la thématique n’a rien à voir avec la vôtre.
- … faites (abondamment) la publicité de votre blog sur des forums.
- … faites des liens vers votre blog sur des sites écrits dans une langue différente de celle de votre blog.
De même, quand vous faites un lien, évitez d’utiliser toujours la même expression comme ancre de lien. Par exemple, si vous avez un blog déco, évitez de poster des dizaines de commentaires en utilisant le pseudonyme « Blog déco ».
Enfin, mieux vaut éviter les liens sitewide, c’est-à-dire les liens présents sur toutes les pages d’un site (une blogroll dans une sidebar par exemple).
S’il est trop tard et que vous avez déjà fait des erreurs, vous pouvez d’abord essayer de supprimer les liens qui sont placés sous votre contrôle et de faire supprimer les liens les plus problématiques sur les sites où vous les avez postés. Notez cependant que ce ne sera pas toujours possible et certains webmasters aguerris facturent le retrait de liens, ce qui rappelle à chacun qu’on ne fait pas sa pub impunément sans en payer un jour les conséquences, au sens propre comme au sens figuré.
Si le retrait de liens est impossible, vous pouvez faire ce que l’on appelle un désaveu de liens auprès de Google. Il s’agit de lister dans un fichier les liens que Google doit ignorer. En d’autres termes, c’est un peu comme si vous signaliez à Google que vous ne cautionnez pas ces liens. Vous pouvez trouver des informations plus complètes pour désavouer des liens sur le site d’aide de Google.
Si vous gérez votre site de manière naturelle, vous ne devriez pas avoir à vous soucier de Google Penguin à part pour enrichir votre culture SEO personnelle :)
Hello ! Je suis en congé maternité jusqu'à l'été 2023. Pendant cette période, les commentaires du blog sont fermés.
En effet, Google Penguin 4 permettrait de rendre plus souple et plus réactive les pénalités automatiques. Depuis 2010, les règles ont vraiment changé en matière de linking. Je me rappelle de cette époque où il suffisait de faire un blast de liens en exatch match pour ranker sur n’importe quel mot clé. C’était presque trop facile.
Aujourd’hui, il s’agit surtout de faire des liens LSI en utilisant des mots clés connexes et très peu de liens en exact match. Surtout, éviter la création trop rapide de liens.
Personnellement, pour les sites qui me tiennent à cœur, comme pour bychouchouetloulou.com, je fais à 90% du liens brandé, je prends pas de risque.
Si j’avais du budget, j’hésiterais pas une seule seconde : j’achèterais du ndd expiré pour construire un réseau.
Je relativise beaucoup l’importance du linking aujourd’hui, même sur des thématiques concurrentielles. J’ai des blogs qui ne reçoivent quasiment aucun lien et qui devancent de gros sites.
Je vois beaucoup de sites qui sont obligés de faire un énorme travail de nettoyage, justement après une acquisition massive de backlinks assez « sales » par le passé.
C’est un sujet complexe dans lequel je me perds régulièrement. Ce que je comprends c’est que Google devrait avoir une approche page par page d’un blog avec un suivi temps réel.
L’impact négatif devrait donc être plus ciblé et ne pas concerner l’intégralité d’un blog. l’importance de l’anchor text va avoir encore plus de sens à mon avis.
Pour un blog amateur, au sens non professionnel, il n’est pas évident de déterminer les « liens négatifs » je n’ai pas trouvé d’outil qui le permette, mais je suis preneur.
J’utilise surtout un outil professionnel pour ma part car je peux y avoir accès dans mon job, Ahrefs, mais il n’est pas donné et pas à la portée d’un usage amateur côté budget… à moins de prendre la version d’essai à 7$ le temps de faire un scan du site et d’exporter toutes les informations (on peut faire des exports en PDF et sur un fichier Excel).
Sinon, en gratuit, Google Search Console permet déjà de voir une belle liste de liens dans le menu Trafic de recherche > Liens vers votre site. Par exemple, ça permet de repérer les liens sitewide (blogueurs qui t’ont généralement mis dans leur blogroll !). J’avoue en revanche que c’est délicat de demander le retrait de ce genre de lien. Il y a une blogueuse qui fait plus de 1700 liens vers No Tuxedo en ayant mis mon site dans sa blogroll. C’est très très moche d’un point de vue référencement… mais délicat de réclamer la suppression du lien :-/
En fait ce n’est pas trop le coût qui me retient mais le fait de passer du temps à apprivoiser un nouvel outil, je suis déjà loin de connaître tous les recoins de Google Search Console.
là je n’ai pas trouvé Trafic de recherche > Liens vers votre site sniff
Ah bon ? Je t’ai fait une petite capture du menu de gauche, je ne sais pas si ça t’éclaire !
moi je n’ai pas tout ça, je t’adresse un email pour ne pas polluer l’article