Que sont-ils et importent-ils?


Les gens disent que LSI les mots clés ont le pouvoir d’améliorer le classement Google. Est-ce vrai ou est-ce encore un autre SEO mythe?

Lisez presque n’importe quel article sur LSI mots-clés, et on vous dira deux choses:

  1. Google utilise une technologie appelée LSI pour indexer des pages Web.
  2. En utilisant LSI les mots clés de votre contenu vous aident à vous classer plus haut sur Google.

Ces deux affirmations sont techniquement fausses.

Dans ce guide, vous apprendrez pourquoi et pourquoi y remédier.

Mais d’abord, les bases…

LSI les mots clés sont des mots et des expressions que Google considère comme liés sémantiquement à un sujet,au moins selon beaucoup dans le SEO communauté. Si vous parlez de voitures, alors LSI les mots clés peuvent être voiture, moteur, route, pneus, véhicule, et transmission automatique.

Mais, selon John Mueller de Google, LSI les mots clés n’existent pas:

Alors, quel est le problème ici?

Avant de répondre à cette question, nous devons d’abord comprendre un peu plus LSI lui-même.

Qu’est-ce que l’indexation sémantique latente (LSI)?

Indexation sémantique latente (LSI), ou analyse sémantique latente (LSA), est une technique de traitement du langage naturel mise au point dans les années 80.

Malheureusement, à moins que vous ne soyez familier avec des concepts mathématiques comme valeurs propres, vecteurs, et décomposition de valeur unique, la technologie elle-même n’est pas si facile à comprendre.

Pour cette raison, nous ne nous attaquerons pas à la façon dont LSI travaux.

Au lieu de cela, nous allons nous concentrer sur le problème pour lequel il a été créé.

Voici comment les créateurs de LSI définir ce problème:

Les mots qu’un chercheur utilise ne sont souvent pas les mêmes que ceux par lesquels les informations recherchées ont été indexées.

Mais qu’est-ce que cela signifie réellement?

Dites que vous voulez savoir quand l’été se termine et que l’automne commence. Votre WiFi est en panne, alors vous allez à la vieille école et prenez une encyclopédie. Au lieu de parcourir aléatoirement des milliers de pages, vous recherchez «tomber» dans l’index et faites glisser vers la bonne page.

Voici ce que vous voyez:

mots-clés lsi tombent 1

De toute évidence, ce n’est pas le type de chute que vous vouliez découvrir.

Pas un à vaincre aussi facilement, vous reculez et réalisez que ce que vous recherchez est indexé sous « automne » – un autre nom pour l’automne.

mots-clés lsi automne saison 1

Le problème ici est que «tomber» est un mot synonyme et polysémique.

Quels sont les synonymes?

Les synonymes sont des mots ou des expressions qui signifient la même chose ou presque la même chose qu’un autre mot ou une autre expression.

Les exemples comprennent riches et riches, tomber et l’automne, et voitures et automobiles.

Voici pourquoi les synonymes sont problématiques, selon le LSI brevet:

[…] il y a une grande diversité dans les mots que les gens utilisent pour décrire le même objet ou concept; c’est ce qu’on appelle la synonymie. Les utilisateurs dans des contextes différents, ou avec des besoins, des connaissances ou des habitudes linguistiques différents décriront les mêmes informations en utilisant des termes différents. Par exemple, il a été démontré que deux personnes choisissent le même mot-clé principal pour un seul objet bien connu moins de 20% du temps en moyenne.

Mais comment cela se rapporte-t-il aux moteurs de recherche?

Imaginez que nous ayons deux pages Web sur les voitures. Les deux sont identiques, mais on remplace toutes les instances du mot voitures pour automobiles.

Si nous devions utiliser un moteur de recherche primitif qui indexe uniquement les mots et les phrases de la page, il ne renverrait qu’une de ces pages pour la requête «voitures».

synonyme automobile automobile 1

C’est mauvais car les deux résultats sont pertinents; c’est juste que l’on décrit ce que nous recherchons d’une manière différente. La page qui utilise le mot voiture au lieu de voitures pourrait même être le meilleur résultat.

Conclusion: les moteurs de recherche doivent comprendre les synonymes pour renvoyer les meilleurs résultats.

Que sont les mots polysémiques?

Les mots et expressions polysémiques sont ceux qui ont plusieurs significations différentes.

Les exemples incluent la souris (rongeur / ordinateur), la banque (institut financier / berge) et lumineuse (lumière / intelligente).

Voici pourquoi cela cause des problèmes, selon les créateurs de LSI:

Dans différents contextes ou lorsqu’il est utilisé par différentes personnes, le même mot revêt une signification référentielle variable (par exemple, «banque» sur la rive par rapport à «banque» sur une caisse d’épargne). Ainsi, l’utilisation d’un terme dans une requête de recherche ne signifie pas nécessairement qu’un objet texte contenant ou étiqueté par le même terme présente un intérêt.

Ces mots présentent aux moteurs de recherche un problème similaire aux synonymes.

Par exemple, disons que nous recherchons «ordinateur Apple». Notre moteur de recherche primitif peut renvoyer ces deux pages, même si ce n’est clairement pas ce que nous recherchons:

ordinateur apple polysemic 1

Conclusion: les moteurs de recherche qui ne comprennent pas les différentes significations des mots polysémiques sont susceptibles de renvoyer des résultats non pertinents.

Les ordinateurs sont stupides.

Ils n’ont pas la compréhension inhérente des relations verbales que nous, les humains.

Par exemple, tout le monde sait que gros et grand signifie la même chose. Et tout le monde sait que John Lennon était dans les Beatles.

Mais un ordinateur n’a pas cette connaissance sans qu’on le lui dise.

Le problème est qu’il n’y a aucun moyen de tout dire à un ordinateur. Cela prendrait trop de temps et d’efforts.

LSI résout ce problème en utilisant des formules mathématiques complexes pour dériver les relations entre les mots et les phrases d’un ensemble de documents.

En termes simples, si nous courons LSA sur un ensemble de documents sur les saisons, l’ordinateur peut probablement comprendre certaines choses:

Tout d’abord, le mot tomber est synonyme de l’automne:

automne automne 1

Deuxièmement, des mots comme saison, été, hiver, tomber, et printemps sont tous sémantiquement liés:

mots sémantiquement liés 1

Troisième, tomber est sémantiquement lié à deux ensembles de mots différents:

chute polysémique 1

Les moteurs de recherche peuvent ensuite utiliser ces informations pour aller au-delà de la correspondance exacte des requêtes et fournir des résultats de recherche plus pertinents.

résultat pertinent pour les moteurs de recherche 1

Compte tenu des problèmes LSI résout, il est facile de voir pourquoi les gens supposent que Google utilise LSI La technologie. Après tout, il est clair que la correspondance des requêtes exactes n’est pas un moyen fiable pour les moteurs de recherche de renvoyer des documents pertinents.

De plus, nous constatons chaque jour que Google comprend la synonymie:

1 graphique de connaissances riches 1

Et la polysémie:

2 graphe de connaissances de la souris 1

Mais malgré cela, Google n’utilise presque certainement pas LSI La technologie.

Comment savons nous? Les représentants de Google le disent.

Vous ne les croyez pas?

Voici trois autres éléments de preuve pour étayer ce fait:

1. LSI est une ancienne technologie

LSI a été inventé dans les années 1980 avant la création du World Wide Web. En tant que tel, il n’a jamais été destiné à s’appliquer à un si grand ensemble de documents.

C’est pourquoi Google a depuis développé une technologie meilleure et plus évolutive pour résoudre les mêmes problèmes.

Bill Slawski met le mieux:

LSI la technologie n’a pas été créée pour quelque chose de la taille du Web […] Google a développé une approche de vecteur de mots (utilisée pour Rankbrain) qui est beaucoup plus moderne, évolue beaucoup mieux et fonctionne sur le Web. En utilisant LSI lorsque vous avez Word2vec disponible, ce serait comme piloter une Ferrari avec un go-cart.

2. LSI a été créé pour indexer les collections de documents connues

Le World Wide Web est non seulement vaste mais aussi dynamique.

Cela signifie que les milliards de pages de l’index de Google changent régulièrement.

C’est un problème car le LSI Le brevet nous dit que l’analyse doit être exécutée « à chaque fois qu’il y a une mise à jour importante dans les fichiers de stockage ».

Cela prendrait beaucoup de puissance de traitement.

3. LSI est une technologie brevetée

le Indexation sémantique latente (LSI) brevet a été octroyée à Bell Communications Research, Inc. en 1989. Susan Dumais, l’une des co-inventeurs qui ont travaillé sur la technologie, a ensuite rejoint Microsoft en 1997, où elle a travaillé sur des innovations liées à la recherche.

Cela dit, NOUS les brevets expirent après 20 ans, ce qui signifie que le LSI expiré en 2008.

Étant donné que Google était assez bon pour comprendre le langage et renvoyer des résultats pertinents bien avant 2008, il s’agit là d’un autre élément de preuve suggérant que Google n’utilise pas LSI.

Encore une fois, Bill Slawski le dit le mieux:

Google tente d’indexer les synonymes et autres significations des mots. Mais il n’utilise pas LSI la technologie pour le faire. L’appeler LSI trompe les gens. Google propose des substitutions de synonymes et des améliorations de requête basées sur des synonymes depuis au moins 2003, mais cela ne signifie pas qu’ils utilisent LSI. Ce serait comme dire que vous utilisez un appareil télégraphique intelligent pour vous connecter au Web mobile.

La mention de mots, d’expressions et d’entités connexes peut-elle améliorer le classement?

La plupart des référenceurs voient « LSI mots-clés « comme rien de plus que des mots, des phrases et des entités connexes.

Si nous adoptons cette définition, bien qu’elle soit techniquement inexacte, alors oui, l’utilisation de mots et d’expressions connexes dans votre contenu peut presque certainement aider à améliorer SEO.

Comment savons nous? Google nous le dit indirectement ici:

Pensez-y: lorsque vous recherchez « chiens », vous ne voulez probablement pas une page contenant le mot « chiens » des centaines de fois. Dans cet esprit, les algorithmes évaluent si une page contient un autre contenu pertinent au-delà du mot clé « chiens » – comme des photos de chiens, des vidéos ou même une liste de races.

Sur une page sur les chiens, Google voit les noms des races individuelles comme sémantiquement liés.

Mais pourquoi ces pages d’aide se classent-elles pour les termes pertinents?

Simple: car ils aident Google à comprendre le sujet général de la page.

Par exemple, voici deux pages qui mentionnent chacune le mot «chiens» autant de fois:

chats chiens 1

En regardant d’autres mots et expressions importants sur chaque page, nous apprenons que seule la première concerne les chiens. Le second concerne principalement les chats.

Google utilise ces informations pour classer les pages pertinentes pour les requêtes pertinentes.

Comment trouver et utiliser des mots et des expressions connexes

Si vous connaissez un sujet, vous naturellement inclure des mots et des expressions connexes dans votre contenu.

Par exemple, il serait difficile d’écrire sur les meilleurs jeux vidéo sans mentionner des mots et des phrases comme « PS4 jeux « , » Call of Duty « et » Fallout « .

Mais il est facile de rater des sujets importants, en particulier avec des sujets plus complexes.

Par exemple, notre guide des liens nofollow ne mentionne rien au sujet des liens sponsorisés et UGC attributs de lien:

4 post nofolloow 1

Google considère probablement ces termes importants et sémantiquement liés que tout bon article sur le sujet devrait mentionner.

C’est peut-être la raison pour laquelle les articles qui parlent de ces choses nous dépassent.

Dans cet esprit, voici neuf façons de trouver des mots, des phrases et des entités potentiellement liés:

1. Faites preuve de bon sens

Vérifiez vos pages pour voir si vous avez manqué des points évidents.

Par exemple, si la page est un article biographique sur Donald Trump et ne mentionne pas sa mise en accusation, cela vaut probablement la peine d’ajouter une section à ce sujet.

Ce faisant, vous mentionnerez naturellement des mots, des phrases et des entités connexes tels que «Rapport Mueller», «Nancy Pelosi» et «dénonciateur».

Sidenote.

N’oubliez pas qu’il n’y a aucun moyen de savoir avec certitude si Google considère ces mots et expressions comme sémantiquement liés. Cependant, comme Google vise à comprendre les relations entre les mots et les entités que nous, humains, comprenons intrinsèquement, il y a quelque chose à dire pour utiliser le bon sens.

2. Regardez les résultats de la saisie semi-automatique

Les résultats de saisie semi-automatique n’indiquent pas toujours les mots clés associés importants, mais ils peuvent fournir des indices sur ceux qui méritent d’être mentionnés.

Par exemple, nous voyons «Donald Trump époux»,« Donald Trump âge»Et« Donald Trump Twitter»En tant que résultats de saisie semi-automatique pour« donald trump ».

5 saisie semi-automatique 1 1

Ces mots clés ne sont pas liés en eux-mêmes, mais les personnes et les choses auxquelles ils se réfèrent peuvent l’être. Dans ce cas, ce sont Melania Trump, 73 ans, et @realDonaldTrump.

Probablement toutes les choses qui devraient être mentionnées dans un article biographique, non?

3. Regardez les recherches connexes

Les recherches associées apparaissent en bas des résultats de recherche.

Comme les résultats de saisie semi-automatique, ils peuvent donner des indices sur les mots, expressions et entités potentiellement liés qui méritent d’être mentionnés.

Capture d'écran 2020 01 20 à 21.56.57 1

Ici, «éducation Donald Trump» fait référence à L’école Wharton de l’Université de Pennsylvanie qu’il a assisté.

4. Utilisez un « LSI outil « mot clé »

Populaire “LSI générateurs de mots clés « ont rien faire avec LSI. Cependant, ils renvoient parfois quelques idées utiles.

Par exemple, si nous connectons «Donald Trump» à un outil populaire, il attire des personnes (entités) apparentées comme son épouse, Melania Trump, et son fils, Barron Trump.

7 outil lsi 1

5. Examinez les autres mots clés pour lesquels les premières pages se classent

Utilisez le rapport sur les idées de mots clés « Classer également pour » dans l’Explorateur de mots clés d’Ahrefs pour rechercher des mots, des expressions et des entités potentiellement liés.

8 rangent également pour 1

S’il y en a trop à gérer, essayez d’exécuter une analyse de l’écart de contenu à l’aide de trois des pages les mieux classées, puis définissez le nombre d’intersections sur «3».

Cela montre les mots clés pour lesquels toutes les pages se classent, ce qui vous donne souvent une liste plus raffinée de mots et d’expressions connexes.

6. Exécutez un TF*IDF une analyse

TF-IDF a rien à voir avec l’indexation sémantique latente (LSI) ou analyse sémantique latente (LSA), mais cela peut parfois aider à découvrir des mots, des phrases et des entités «manquants».

9 tf idf 1

7. Regardez les bases de connaissances

Bases de connaissances comme Wikidata.org et Wikipédia sont des sources fantastiques de termes connexes.

Google extrait également les données du graphique des connaissances de ces deux bases de connaissances.
12 base de connaissances 1

8. Rétro-ingénierie du graphe des connaissances

Google stocke les relations entre de nombreuses personnes, des choses et des concepts dans ce que l’on appelle un graphe de connaissances. Les résultats du graphique des connaissances apparaissent souvent dans les résultats de recherche Google.

13 graphique des connaissances 1

14 graphique des connaissances 2 1

Essayez de rechercher votre mot-clé et voyez si des données du graphique de connaissances apparaissent.

Parce que ce sont des entités et des points de données que Google associe au sujet, il vaut vraiment la peine d’en parler pertinent ceux où cela a du sens.

9. Utilisez le langage naturel de Google API trouver des entités

Collez le texte d’une page de haut niveau dans Langue naturelle de Google API démo. Recherchez les entités pertinentes et potentiellement importantes que vous auriez pu manquer.

15 API de langue naturelle 1

Dernières pensées

LSI les mots clés n’existent pas, mais les mots, expressions et entités sémantiquement liés existent, et ils ont le pouvoir d’améliorer le classement.

Assurez-vous simplement de les utiliser là où cela a du sens, et de ne pas les saupoudrer au hasard quand et où.

Dans certains cas, cela peut signifier l’ajout de nouvelles sections à votre page.

Par exemple, si vous souhaitez ajouter des mots et des entités comme «impeachment» et «House Intelligence Committee» à un article sur Donald Trump, cela nécessitera probablement quelques nouveaux paragraphes sous une nouvelle sous-rubrique.

Avez-vous d’autres questions sur LSI mots clés?

Laisser un commentaire ou me cingler sur Twitter.



Posted on 1 mars 2020 in Blog

Share the Story

Back to Top