Comment Google comprend-il le texte ? • Levure

[ad_1]

Sur yoast.com, on parle beaucoup d’écriture et de lisibilité. Nous considérons qu’il s’agit d’une partie très importante du référencement. Votre texte doit être facile à suivre et il doit satisfaire les besoins de vos utilisateurs. Ceci, à son tour, aidera votre classement. Cependant, nous parlons rarement de la façon dont Google et les autres moteurs de recherche lisent et comprennent ces textes. Dans cet article, nous allons explorer ce que nous savons sur la façon dont Google analyse le texte en ligne.

Sommes-nous sûrs que Google comprend le texte ?

Nous savons que Google comprend le texte dans une certaine mesure. Pensez-y. L’une des choses les plus importantes que Google doit faire est de faire correspondre ce que quelqu’un tape dans la barre de recherche à un résultat de recherche approprié. Les signaux des utilisateurs (comme les taux de clics et de rebond) à eux seuls n’aideront pas Google à le faire. De plus, nous savons qu’il est possible de classer une phrase que vous n’utilisez pas dans votre texte (bien qu’il soit toujours de bonne pratique d’identifier et d’utiliser une ou plusieurs phrases clés spécifiques). Il est donc clair que Google fait quelque chose pour lire et évaluer votre texte d’une manière ou d’une autre.

Comment Google comprend le texte

Revenons à notre question initiale : Comment Google comprend-il le texte ? Pour être honnête, nous ne savons pas cela en détail. Malheureusement, cette information n’est pas disponible gratuitement. Et nous savons aussi, à en juger par les résultats de la recherche, qu’il reste encore beaucoup de travail à faire. Mais il y a quelques indices ici et là dont nous pouvons tirer des conclusions. Nous savons que Google a fait de grands pas dans la compréhension du contexte. Nous savons également que le moteur de recherche essaie de déterminer comment les mots et les concepts sont liés les uns aux autres. Comment savons-nous cela? D’une part, en gardant un œil sur toute l’actualité autour de l’algorithme de Google. D’autre part, en considérant comment les pages de résultats de recherche réelles ont changé.

Incrustations de mots

Une technique intéressante pour laquelle Google a déposé des brevets et sur laquelle elle a travaillé s’appelle l’intégration de mots. Nous enregistrerons les détails pour un autre article, mais le but est essentiellement de découvrir quels mots sont étroitement liés à d’autres mots. Voici ce qui se passe : un programme informatique reçoit une certaine quantité de texte. Il analyse ensuite les mots de ce texte et détermine quels mots ont tendance à apparaître ensemble. Ensuite, il traduit chaque mot en une série de nombres. Cela permet aux mots d’être représentés comme un point dans l’espace dans un diagramme, comme un nuage de points. Ce diagramme montre quels mots sont liés de quelles manières. Plus précisément, il montre la distance entre les mots, un peu comme une galaxie composée de mots. Ainsi, par exemple, un mot comme « mots-clés » serait beaucoup plus proche de « rédaction » que de « ustensiles de cuisine ».

Fait intéressant, cela peut également être fait pour des phrases, des phrases et des paragraphes. Plus l’ensemble de données que vous alimentez le programme est grand, mieux il sera capable de catégoriser et de comprendre les mots et de déterminer comment ils sont utilisés et ce qu’ils signifient. Et, que savez-vous, Google a une base de données de l’ensemble d’Internet. Avec un tel ensemble de données, il est possible de créer des modèles très fiables qui prédisent et évaluent la valeur du texte et du contexte.

Des incorporations de mots, il n’y a qu’un petit pas vers le concept d’entités liées. Jetons un coup d’œil aux résultats de la recherche pour illustrer ce que sont les entités associées. Si vous saisissez « types de pâtes », voici ce que vous verrez tout en haut de la SERP : une rubrique intitulée « variétés de pâtes », avec un certain nombre de résultats riches qui incluent une tonne de types de pâtes différents. Ces variétés de pâtes sont même subdivisées en « pâtes à ruban », « pâtes tubulaires » et autres sous-types de pâtes. Et il existe de nombreux SERP similaires qui reflètent la manière dont les mots et les concepts sont liés les uns aux autres.

types de pâtes google entités
Après avoir tapé [types of pasta] Google affiche désormais ce résultat enrichi basé sur les entités

Le brevet des entités liées que Google a déposé mentionne en fait la base de données d’index des entités liées. Il s’agit d’une base de données qui stocke des concepts ou des entités, comme des pâtes. Ces entités ont aussi des caractéristiques. La lasagne, par exemple, est une pâte. Il est également fait de pâte. Et c’est de la nourriture. Désormais, en analysant les caractéristiques des entités, elles peuvent être regroupées et catégorisées de toutes sortes de manières différentes. Cela permet à Google de mieux comprendre comment les mots sont liés et, par conséquent, de mieux comprendre le contexte.

Google investit massivement dans la PNL

Le traitement du langage naturel est la compréhension du langage par les machines. C’est l’une des parties les plus difficiles de l’informatique et celle où le plus de progrès sont réalisés. Aujourd’hui, avec un monde de plus en plus alimenté par des systèmes gérés par l’IA, une bonne compréhension du langage est essentielle. Google le comprend et investit énormément dans le développement de modèles NLP. Un système clé était BERT, un modèle qui pouvait comprendre le texte à venir après les mots contenus et avant que ces mots. De cette façon, le système a le contexte complet d’une phrase pour donner un sens approprié à sa signification. Ce que BERT a fait est génial, mais Google en fait plus. Rencontrez MAMAN.

MUM : le prochain modèle linguistique de Google

Lors d’un événement cette année, Google a présenté un nouveau modèle de langage : MUM. Selon Google, il est censé être 1000 fois plus puissant que BERT, un modèle de langage antérieur. Comment? Eh bien, apparemment, MUM peut effectuer plusieurs tâches à la fois. Cela signifie que ce modèle peut lire du texte, comprendre sa signification, approfondir ses connaissances sur le sujet, utiliser d’autres médias pour enrichir ces connaissances, obtenir des informations dans plus de 75 langues et tout traduire en contenu répondant à des requêtes de recherche complexes. Tout en même temps.

Le modèle de langage MUM de Google
Une représentation visuelle du fonctionnement de Google MUM (image de le blog de Google)

Conclusions pratiques

Alors, comment Google comprend-il exactement le texte ? Ce que nous savons nous amène à deux points très importants :

1. Le contexte est la clé

Si Google comprend le contexte d’une manière ou d’une autre, il est probable qu’il évaluera et jugera également le contexte. Plus votre copie correspond à la notion de contexte de Google, meilleures sont ses chances de bien se classer. Une copie mince avec une portée limitée va donc être désavantagée. Vous devez couvrir vos sujets correctement et de manière exhaustive. Et à plus grande échelle, couvrir des concepts connexes et présenter un ensemble complet de travaux sur votre site renforcera votre autorité sur le sujet sur lequel vous écrivez et dans lequel vous vous spécialisez.

2. Écrivez pour votre lecteur

Des textes plus simples qui reflètent clairement les relations entre les concepts ne profitent pas seulement à vos lecteurs, ils aident également Google. Difficile, incohérent et écrit avec une mauvaise structure est plus difficile à comprendre pour les humains et les machines. Vous pouvez aider le moteur de recherche à comprendre vos textes en vous concentrant sur :

  • Lisibilité : rendre votre texte aussi facile à lire que possible sans compromettre votre message.
  • Bonne structure : ajouter des sous-titres clairs et utiliser des mots de transition.
  • Bon contenu : ajouter des explications claires qui montrent comment ce que vous dites se rapporte à ce que l’on sait déjà sur un sujet.

Mieux vous faites, plus vos utilisateurs et Google comprendront facilement votre texte et ce qu’il essaie d’accomplir. Ce qui vous aide également à vous classer avec les bonnes pages lorsqu’un utilisateur tape une certaine requête de recherche. Surtout parce que Google crée essentiellement un modèle qui imite la façon dont nous, les humains, traitons le langage et l’information.

Google veut être un lecteur

Au final, cela se résume à ce message : Google devient de plus en plus un véritable lecteur. En rédigeant un contenu riche, bien structuré et facile à lire et clairement intégré au contexte du sujet traité, vous améliorerez vos chances de bien figurer dans les résultats de recherche.

Lire la suite : Rédaction SEO : le guide ultime »

[ad_2]

Posted on 26 juin 2021 in Blog

Share the Story

Back to Top