Bonjour tout le monde đ
En ce samedi reposant, je m’amusais avec mon logiciel de veille Ă faire une veille stratĂ©gique sur des infographies rigolotes, et j’ai trouvĂ© une illustration sur l’algorithme Hummingbird de Google. RĂ©cemment, on n’entend plus trop parler de lui (avec l’histoire du HTTPS qui a pris toute sa ampleur), et je me suis dit qu’il est bon de faire une petite piqĂ»re de rappel.
Pour rappel, l’algorithme Hummingbird est un robot de Google qui vise Ă implĂ©menter le web sĂ©mantique et Ă « sĂ©lectionner » les rĂ©ponses Ă afficher dans les rĂ©sultats de Google. Il a Ă©tĂ© mis en ligne dĂ©but septembre 2013. Il est dĂ©ployĂ© dans le monde entier (90% des requĂȘtes sont concernĂ©es).
Maintenant, si vous faites attention aux rĂ©sultats de recherche de Google, vous verrez que le moteur réécrit souvent les titles et les mĂ©ta descriptions en fonction des requĂȘtes des utilisateurs. Cet effet est liĂ© Ă cet algorithme. En fonction des mots-clĂ©s saisis par l’utilisateur, Google va afficher les pages les plus pertinentes, mais Ă©galement afficher un titre et une mĂ©ta description diffĂ©rente de ceux de la page.
Donc, comment contourner un peu cet algorithme et ne pas avoir peur de cela ? (surtout quand on a passĂ© un bon moment Ă optimiser son site …) ? Il faut penser au mobile pour s’adapter aux futurs algorithmes car plus de la moitiĂ© des recherches s’effectuent sur appareil mobile. Le Responsive Design reste une bonne solution.
L’infographie de Optimiz indique Ă©galement que la recherche vocale est l’avenir du search sur mobile. La recherche vocale implique donc des requĂȘtes plus longues (« Comment … ? », « OĂč … ? », « Pourquoi … ? ») car ce ne sont pas juste des mots-clĂ©s qui vont ĂȘtre tapĂ©s dans une barre de recherche. La recherche vocale implique donc aussi de l’analyse sĂ©mantique, d’oĂč l’intervention de Hummingbird pour afficher les meilleures pages par rapport aux requĂȘtes.
Au final, tout cela est issu de recherche et de dĂ©veloppement d’ingĂ©nierie linguistique et du traitement automatique des langues. En ayant fait un Master dans ce domaine, cela m’a paru tout Ă fait logique dĂšs la sortie de cet algorithme.
Lors de ma recherche universitaire pour mon mĂ©moire, j’ai Ă©tudiĂ© tout ce qui est moteur de recherche et algorithme de recherche pour crĂ©er mon logiciel de veille (mots-clĂ©s, requĂȘtes, collecte de pages web), et je pense que l’algorithme Hummingbird est Ă©galement liĂ© Ă ce qu’on appelle le TF-IDF :
Cette mesure statistique TF-IDF permet d’Ă©valuer l’importance d’un terme contenu dans un document, relativement Ă une collection ou un corpus.
Je ne veux pas rentrer dans des détails trop compliqués que la plupart des personnes ne comprendront pas. Mais en gros, ce robot de web sémantique va plus ou moins pondéré les pages web de la base de données de Google et afficher celles qui correspondent au mieux aux demandes des internautes avec la réécriture de leurs snippets.
VoilĂ , j’espĂšre que cet article vous aura plu. En tout cas, dĂšs que je commence Ă parler de TAL, SEO, je n’arrive plus Ă m’arrĂȘter haha.
Bon courage Ă tous !
VĂ©ronique Duong – autoveille@gmail.com
Oui cette article est sympa, mais on reste un peu sur notre fin. On aurait aimer en savoir plus sur cette aspect TF-IDF.
JâaimeJâaime
Bonjour ! Merci pour votre commentaire et votre intĂ©rĂȘt. Vous pouvez en apprendre plus sur le TF-IDF avec un autre article que j’ai rĂ©digĂ© l’annĂ©e derniĂšre : http://autoveille.info/2013/10/03/mots-cles-referencement-statistiques-tf-idf/
JâaimeJâaime
Vraiment sympa ce site, je trouve votre approche vraiment intéressante, Bravo pour la rédaction. je partage le
lien de suite Pauline de création de site internet
JâaimeJâaime