¿Cómo entiende Google el texto? • Yoast


En yoast.com, hablamos mucho sobre escritura y legibilidad. Lo consideramos una parte muy importante del SEO. Su texto debe ser fácil de seguir y debe satisfacer las necesidades de sus usuarios. Esto, a su vez, ayudará a su clasificación. Sin embargo, rara vez hablamos de cómo Google y otros motores de búsqueda leen y entienden estos textos. En esta publicación, exploraremos lo que sabemos sobre cómo Google analiza el texto en línea.

¿Estamos seguros de que Google comprende el texto?

Sabemos que Google comprende el texto hasta cierto punto. Solo piensa en ello. Una de las cosas más importantes que tiene que hacer Google es hacer coincidir lo que alguien escribe en la barra de búsqueda con un resultado de búsqueda adecuado. Señales de usuario (como el porcentaje de clics y de rebote) por sí solo no ayudará a Google a hacer esto. Además, sabemos que es posible clasificar una frase que no usa en su texto (aunque sigue siendo una buena práctica identificar y usar una o más frases específicas frases clave). Claramente, Google hace algo para leer y evaluar su texto de una forma u otra.

Cómo entiende Google el texto

Volviendo a nuestra pregunta inicial: Cómo ¿Google entiende el texto? Para ser honesto, no sabemos esto en detalle. Desafortunadamente, esa información no está disponible gratuitamente. Y también sabemos, a juzgar por los resultados de la búsqueda, que todavía queda mucho trabajo por hacer. Pero hay algunas pistas aquí y allá de las que podemos sacar conclusiones. Sabemos que Google ha tomado grandes pasos cuando se trata de comprender el contexto. También sabemos que el motor de búsqueda intenta determinar cómo se relacionan las palabras y los conceptos entre sí. Cómo sabemos esto? Por un lado, al estar atento a las noticias que rodean Algoritmo de Google. Por otro lado, considerando cómo han cambiado las páginas de resultados de búsqueda reales.

Incrustaciones de palabras

Una técnica interesante para la que Google ha presentado patentes y en la que ha trabajado se llama incrustación de palabras. Guardaremos los detalles para otra publicación, pero el objetivo es básicamente averiguar qué palabras están estrechamente relacionadas con otras palabras. Esto es lo que sucede: un programa de computadora recibe una cierta cantidad de texto. Luego analiza las palabras en ese texto y determina qué palabras tienden a aparecer juntas. Luego, traduce cada palabra en una serie de números. Esto permite que las palabras se representen como un punto en el espacio en un diagrama, como un diagrama de dispersión. Este diagrama muestra qué palabras están relacionadas de qué manera. Más exactamente, muestra la distancia entre palabras, algo así como una galaxia formada por palabras. Por ejemplo, una palabra como “palabras clave” estaría mucho más cerca de “redacción publicitaria” que de “utensilios de cocina”.

Curiosamente, esto también se puede hacer para frases, oraciones y párrafos. Cuanto mayor sea el conjunto de datos con el que alimente el programa, mejor podrá categorizar y comprender las palabras y determinar cómo se usan y qué significan. Y, qué sabes, Google tiene una base de datos de todo Internet. Con un conjunto de datos como ese, es posible crear modelos muy confiables que predicen y evalúan el valor del texto y el contexto.

Desde las incrustaciones de palabras, es solo un pequeño paso hacia el concepto de entidades relacionadas. Echemos un vistazo a los resultados de la búsqueda para ilustrar qué son las entidades relacionadas. Si escribe “tipos de pasta”, esto es lo que verá justo en la parte superior de la SERP: un encabezado llamado “variedades de pasta”, con una serie de resultados ricos que incluyen una tonelada de diferentes tipos de pasta. Estas variedades de pasta se subcategorizan incluso en “pasta de cinta”, “pasta tubular” y otros subtipos de pasta. Y hay muchísimas SERP similares que reflejan la forma en que las palabras y los conceptos se relacionan entre sí.

entidades de google tipos de pasta
Después de escribir [types of pasta] Google ahora muestra este resultado enriquecido basado en entidades

La patente de entidades relacionadas que Google ha presentado en realidad menciona la base de datos del índice de entidades relacionadas. Se trata de una base de datos que almacena conceptos o entidades, como pasta. Estas entidades también tienen características. Lasaña, por ejemplo, es una pasta. También está hecho de masa. Y es comida. Ahora, al analizar las características de las entidades, se pueden agrupar y categorizar de todo tipo de formas diferentes. Esto permite a Google comprender mejor cómo se relacionan las palabras y, por lo tanto, comprender mejor el contexto.

Google está invirtiendo fuertemente en PNL

El procesamiento del lenguaje natural es la comprensión del lenguaje por máquinas. Es una de las partes más difíciles de la informática y en la que se están realizando más avances. Hoy, con un mundo cada vez más impulsado por sistemas administrados por IA, la comprensión adecuada del lenguaje es clave. Google comprende esto e invierte mucho en el desarrollo de modelos de PNL. Un sistema clave fue BERT, un modelo que podría entender el texto que viene después las palabras de contenido y antes de esas palabras. De esta manera, el sistema tiene el contexto completo de una oración para darle sentido a su significado. Lo que hizo BERT es asombroso, pero Google está haciendo más. Conoce a MUM.

MUM: el próximo modelo de lenguaje de Google

En un evento de este año, Google presentó un nuevo modelo de lenguaje: MUM. Según Google, se supone que es 1000 veces más potente que BERT, un modelo de lenguaje anterior. ¿Cómo? Bueno, aparentemente, MUM puede realizar múltiples tareas. Esto significa que este modelo puede leer texto, comprender su significado, adquirir un conocimiento más profundo sobre el tema, utilizar otros medios para enriquecer ese conocimiento, obtener información de más de 75 idiomas y traducir todo en contenido que responda a consultas de búsqueda complejas. Todo al mismo tiempo.

Modelo de lenguaje MUM de Google
Una representación visual de cómo funciona Google MUM (imagen de Blog de Google)

Conclusiones practicas

Entonces, ¿cómo entiende Google exactamente el texto? Lo que sabemos nos lleva a dos puntos muy importantes:

1. El contexto es clave

Si Google entiende el contexto de una forma u otra, es probable que también evalúe y juzgue el contexto. Cuanto mejor coincida tu copia con la noción de contexto de Google, mayores serán sus posibilidades de obtener una buena clasificación. Entonces copia fina con un alcance limitado va a estar en desventaja. Debe cubrir sus temas de manera adecuada y exhaustiva. Y a mayor escala, cubrir conceptos relacionados y presentar un cuerpo completo de trabajo en su sitio reforzará su autoridad sobre el tema sobre el que escribe y en el que se especializa.

2. Escribe para tu lector

Los textos más fáciles que reflejan claramente las relaciones entre los conceptos no solo benefician a sus lectores, también ayudan a Google. La escritura difícil, inconsistente y con una estructura pobre es más difícil de entender tanto para humanos como para máquinas. Puede ayudar al motor de búsqueda a comprender sus textos centrándose en:

  • Legibilidad: hacer que su texto sea fácil de leer como sea posible sin comprometer su mensaje.
  • Buena estructura: agregando claro subtítulos y usando palabras de transición.
  • Buen contenido: agregar explicaciones claras que muestren cómo lo que estás diciendo se relaciona con lo que ya se sabe sobre un tema.

Cuanto mejor lo hagas, más fácil será que tus usuarios y Google comprendan tu texto y lo que intenta conseguir. Que también te ayuda clasificar con las páginas correctas cuando un usuario escribe una determinada consulta de búsqueda. Especialmente porque Google básicamente está creando un modelo que imita la forma en que los humanos procesamos el lenguaje y la información.

Google quiere ser lector

Al final, todo se reduce a este mensaje: Google se está convirtiendo cada vez más en un lector real. Al escribir contenido enriquecido que esté bien estructurado y sea fácil de leer y que esté claramente integrado en el contexto del tema en cuestión, mejorará sus posibilidades de obtener buenos resultados en los resultados de búsqueda.

Lee mas: Redacción SEO: la guía definitiva »



Source link

0 comentarios

Dejar un comentario

¿Quieres unirte a la conversación?
Siéntete libre de contribuir!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *