Recientemente, Google sorprendía a la sociedad digital anunciando un nuevo modelo de procesamiento del lenguaje. Se trata de KELM (Knowledge Enhanced Language Model pre training). El objetivo es el de reducir el seso y el contenido tóxico que se puede encontrar en internet. Logrando aumentar la precisión fáctica a la hora de llevar a cabo la búsqueda de nuestro contenido.
El principal elemento diferenciador entre KELM y el resto de modelos de procesamiento de lenguaje natural, como es el caso de BERT, es que extrae información de fuentes únicamente confiables, como es el caso de Knowledge Graphs. Convirtiendo su contenido en texto natural y mostrándoselo al usuario de una forma natural y proactiva.
¿Qué es Google KELM?
Google KELM es el acrónimo de Knowledge Enhanced Language Model pre training. Un nuevo modelo de procesamiento de lenguaje natural que comparte esencia con BERT, pero con notables diferencias.
Mientras que BERT está entrenado para extraer información en documentos web y en otras fuentes de información, KELM eleva su precisión a un nivel superior. Siendo capaz de apoyarse en gráficos y traducir su contenido a texto. De este modo, es posible mostrarlo al usuario a través de un formato cómodo y versátil.
Oficialmente, Google todavía no se ha pronunciado acerca de si KELM ya está activo, influyendo en las búsquedas del usuario. No obstante, parece indicar que su anuncio está muy ligado a la presentación de Google MUM. Estableciendo vínculos entre la extracción de datos fiables y la capacidad de MUM para llevar a cabo el procesamiento de idiomas.
La necesidad de apoyarse en datos confiables
Fueron los propios investigadores de Google los que propusieron el uso de gráficos de conocimiento para lograr mejorar la precisión de los hechos. Puesto que son una de las fuentes de datos más fiables que podemos encontrar en la red.
«Las fuentes alternativas de información son los gráficos de conocimiento (KG), que consisten en datos estructurados. Los KG son de naturaleza fáctica porque la información generalmente se extrae de fuentes más confiables, y los filtros de posprocesamiento y los editores humanos aseguran que se elimine el contenido inapropiado e incorrecto«. Según afirman fuentes internas de Google.
Una vez se introduzca Google KELM, su ejercicio podría afectar considerablemente al orden de los resultados que muestra. Especialmente en aquellos casos en los que los sitios web devuelvan resultados con datos que son objetivamente incorrectos.
Reduciendo el sesgo y mejorando la precisión de las búsquedas
KELM ofrece importantes mejoras a la hora de evolucionar la precisión fáctica del lenguaje. Al mismo tiempo que reduce el sesgo. Ofreciendo, por tanto, resultados mucho más fiables al usuario.
Para entender su impacto, es necesario tener en cuenta que actualmente Google no investiga en torno a la verificación de los hechos de los resultados que devuelve. Además, Google ha optado por lanzar KELM bajo una licencia Creative Commons. Es decir, cualquier otra empresa o buscador podría utilizarlo para mejorar sus métodos de procesamiento de lenguaje natural.