En passant

Content Spinning « naturel » grâce Ă  l’IngĂ©nierie Linguistique #TALN

Bonjour tout le monde !

Cela fait un moment que je n’ai pas eu le temps de dĂ©velopper des scripts Perl et autres outils d’automatisation ! Cependant, dans mon mĂ©tier de SEO Manager, je dois rĂ©gulièrement traiter beaucoup de donnĂ©es textuelles, et je pense utiliser plus amplement mes connaissances en ingĂ©nierie linguistique pour travailler certaines parties.

Parlant de donnĂ©es textuelles, je dĂ©signe avant tout la rĂ©daction de mĂ©ta tags, de contenu textuel, de URLs, etc. Pour les pages importantes, il faut bien Ă©videmment optimiser Ă  la main, mais pour les pages moins importantes, l’automatisation s’impose.

Voici un mini script Perl que j’ai dĂ©veloppĂ© ce matin pour remplacer un bout de la chaĂ®ne de caractères (« au bureau« ) par une autre (« aux alentours« ).

Script Perl - Automatisation content spinning - AUTOVEILLE

(J’ai pris une photo de mon Ă©cran de PC directement car je n’avais pas de WiFi …).

Une petite moulinette dans le Terminal de Linux et en voici la sortie :

IngĂ©nierie linguistique - Outil SEO : Content Spinning - AUTOVEILLEL’expression « au bureau » a Ă©tĂ© remplacĂ©e par « aux alentours » comme on peut le voir dans la capture Ă©cran. L’exemple d’ici est très simplifiĂ© pour que tout internaute comprenne ce que je suis en train de dĂ©montrer. Pour faire le « remplacement » de mots-clĂ©s dans un long texte, il faut mettre en place plusieurs Ă©lĂ©ments (base de donnĂ©es de termes-clĂ©s, textes gĂ©nĂ©riques, etc.)

Le content spinning bourratif est une technique non recommandée par Google. Mais de temps en temps pour créer des méta tags automatiquement ou des petits textes (dynamiques) descriptifs (pages produits, déclinaisons, etc.).

En tout cas, si vous ĂŞtes intĂ©ressĂ©s, n’hĂ©sitez pas Ă  me contacter pour en parler.

Bon courage Ă  tous !

VĂ©ronique Duong – autoveille@gmail.com

 

Publicités
Image

Algorithme Hummingbird, IngĂ©nierie Linguistique et Responsive Design ? Penser Mobile ! #SEO

Bonjour tout le monde 🙂

En ce samedi reposant, je m’amusais avec mon logiciel de veille Ă  faire une veille stratĂ©gique sur des infographies rigolotes, et j’ai trouvĂ© une illustration sur l’algorithme Hummingbird de Google. RĂ©cemment, on n’entend plus trop parler de lui (avec l’histoire du HTTPS qui a pris toute sa ampleur), et je me suis dit qu’il est bon de faire une petite piqĂ»re de rappel.

Algorithme Hummingbird Google - AUTOVEILLEPour rappel, l’algorithme Hummingbird est un robot de Google qui vise Ă  implĂ©menter le web sĂ©mantique et Ă  « sĂ©lectionner » les rĂ©ponses Ă  afficher dans les rĂ©sultats de Google. Il a Ă©tĂ© mis en ligne dĂ©but septembre 2013. Il est dĂ©ployĂ© dans le monde entier (90% des requĂŞtes sont concernĂ©es).

Maintenant, si vous faites attention aux rĂ©sultats de recherche de Google, vous verrez que le moteur rĂ©Ă©crit souvent les titles et les mĂ©ta descriptions  en fonction des requĂŞtes des utilisateurs. Cet effet est liĂ© Ă  cet algorithme. En fonction des mots-clĂ©s saisis par l’utilisateur, Google va afficher les pages les plus pertinentes, mais Ă©galement afficher un titre et une mĂ©ta description diffĂ©rente de ceux de la page.

Donc, comment contourner un peu cet algorithme et ne pas avoir peur de cela ? (surtout quand on a passĂ© un bon moment Ă  optimiser son site …) ? Il faut penser au mobile pour s’adapter aux futurs algorithmes car plus de la moitiĂ© des recherches s’effectuent sur appareil mobile. Le Responsive Design reste une bonne solution.

L’infographie de Optimiz indique Ă©galement que la recherche vocale est l’avenir du search sur mobile. La recherche vocale implique donc des requĂŞtes plus longues (« Comment … ? », « OĂą … ? », « Pourquoi … ? ») car ce ne sont pas juste des mots-clĂ©s qui vont ĂŞtre tapĂ©s dans une barre de recherche. La recherche vocale implique donc aussi de l’analyse sĂ©mantique, d’oĂą l’intervention de Hummingbird pour afficher les meilleures pages par rapport aux requĂŞtes.

Doit-on avoir peur de l'algorithme Hummingbird ? - AUTOVEILLE

Au final, tout cela est issu de recherche et de dĂ©veloppement d’ingĂ©nierie linguistique et du traitement automatique des langues. En ayant fait un Master dans ce domaine, cela m’a paru tout Ă  fait logique dès la sortie de cet algorithme.

Lors de ma recherche universitaire pour mon mĂ©moire, j’ai Ă©tudiĂ© tout ce qui est moteur de recherche et algorithme de recherche pour crĂ©er mon logiciel de veille (mots-clĂ©s, requĂŞtes, collecte de pages web), et je pense que l’algorithme Hummingbird est Ă©galement liĂ© Ă  ce qu’on appelle le TF-IDF :

Cette mesure statistique TF-IDF permet d’Ă©valuer l’importance d’un terme contenu dans un document, relativement Ă  une collection ou un corpus.

Je ne veux pas rentrer dans des détails trop compliqués que la plupart des personnes ne comprendront pas. Mais en gros, ce robot de web sémantique va plus ou moins pondéré les pages web de la base de données de Google et afficher celles qui correspondent au mieux aux demandes des internautes avec la réécriture de leurs snippets.

VoilĂ , j’espère que cet article vous aura plu. En tout cas, dès que je commence Ă  parler de TAL, SEO, je n’arrive plus Ă  m’arrĂŞter haha.

Bon courage Ă  tous !

VĂ©ronique Duong – autoveille@gmail.com