La nueva tecnología de Google ayuda a crear potentes algoritmos de clasificación

Google ha anunciado el lanzamiento de una tecnología mejorada que facilita y acelera la investigación y el desarrollo de nuevos algoritmos que se pueden implementar rápidamente.

Esto le da a Google la capacidad de crear rápidamente nuevos algoritmos anti-spam, mejorar el procesamiento del lenguaje natural y los algoritmos de clasificación, y llevarlos a producción más rápido que nunca.

La mejora de la clasificación de TF coincide con las fechas de las actualizaciones recientes de Google

Esto es interesante porque Google implementó varios algoritmos de lucha contra el spam y dos actualizaciones de algoritmos centrales en junio y julio de 2021. Estos desarrollos siguieron directamente al lanzamiento de esta nueva tecnología en mayo de 2021.

El momento podría ser una coincidencia, pero dado todo lo que hace la nueva versión de TF-Ranking basado en Keras, puede ser importante familiarizarse con él para comprender por qué Google ha acelerado el ritmo de publicación de noticias. Actualizaciones de algoritmos relacionados con la clasificación .

Nueva versión del ranking TF basado en Keras

Google ha anunciado una nueva versión de TF-Ranking que se puede utilizar para mejorar el aprendizaje neuronal para clasificar los algoritmos, así como los algoritmos de procesamiento del lenguaje natural como BERT.

Continuar leyendo a continuación

Es una forma poderosa de crear nuevos algoritmos y amplificar los existentes, por así decirlo, y hacerlo de una manera increíblemente rápida.

Clasificación de TensorFlow

Según Google, TensorFlow es una plataforma de aprendizaje automático.

En un video de YouTube de 2019, la primera versión de la clasificación de TensorFlow se describió de la siguiente manera:

La primera biblioteca de aprendizaje profundo de código abierto para aprender a clasificar (LTR) a escala. "

La innovación de la plataforma TF-Ranking original fue que cambió la forma en que se clasificaban los documentos relevantes.

Anteriormente, los documentos relevantes se comparaban entre sí en lo que se denomina clasificación por pares. La probabilidad de que un documento sea relevante para una consulta se comparó con la probabilidad de otro elemento.

Esta fue una comparación entre pares de documentos y no una comparación de la lista completa.

La innovación de TF-Ranking es que hizo posible comparar la lista completa de documentos a la vez, lo que se denomina puntuación de varios elementos. Este enfoque permite tomar mejores decisiones de clasificación.

Continuar leyendo a continuación

La clasificación TF mejorada permite el desarrollo rápido de nuevos y potentes algoritmos

L'article de Google publié sur son blog AI indique que le nouveau TF-Ranking est une version majeure qui facilite plus que jamais la configuration des modèles d'apprentissage du classement (LTR) et leur permet de les mettre en production más rápidamente.

Esto significa que Google puede crear nuevos algoritmos y agregarlos para buscar más rápido que nunca.

El artículo dice:

"Nuestro modelo de clasificación nativo de Keras tiene un diseño de flujo de trabajo completamente nuevo, que incluye un ModelBuilder flexible, un DatasetBuilder para configurar los datos de entrenamiento y un Pipeline para entrenar el modelo con el conjunto de datos suministrado.

Estos componentes hacen que la construcción de un modelo LTR personalizado sea más fácil que nunca y facilitan la exploración rápida de nuevas estructuras de modelos para la producción y la investigación.

Clasificación TF BERT

Cuando un artículo o trabajo de investigación indica que los resultados fueron ligeramente mejores, ofrece salvedades e indica que se necesita más investigación, esto indica que el algoritmo en cuestión puede no ser utilizado porque Él no está listo o está en un punto muerto.

Este no es el caso con TFR-BERT, una combinación de TF-Ranking y BERT.

BERT es un enfoque de aprendizaje automático para el procesamiento del lenguaje natural. Es una forma de comprender las consultas de búsqueda y el contenido de la página web.

BERT es una de las actualizaciones más importantes de Google y Bing en los últimos años.

El artículo afirma que la combinación de TF-R con BERT para optimizar el orden de las entradas de la lista generada "mejoras significativas. "

Esta afirmación de que los resultados fueron significativos es importante porque aumenta la probabilidad de que tal cosa esté actualmente en uso.

La implicación es que el TF-Ranking basado en Keras hizo que BERT fuera más poderoso.

Según Google:

"Nuestra experiencia muestra que esta arquitectura TFR-BERT ofrece mejoras significativas en el rendimiento de los modelos de lenguaje previamente entrenados, lo que lleva a un rendimiento máximo para varias tareas de calificación populares …"

Ranking TF y GAM

Hay otro tipo de algoritmo, llamado Modelos aditivos generalizados (GAMs), que TF-Ranking también mejora y la convierte en una versión aún más potente que la original.

Una de las cosas que hace que este algoritmo sea importante es que es transparente, ya que todo lo que entra en la generación del ranking se puede ver y comprender.

Continuar leyendo a continuación

Google explicó la importancia de la transparencia de esta manera:

"La transparencia y la interpretabilidad son factores importantes en el despliegue de modelos LTR en sistemas de clasificación que pueden estar involucrados en la determinación de los resultados de procesos tales como evaluación de elegibilidad de préstamos, publicidad dirigida o orientación de decisiones de tratamiento médico.

En tales casos, la contribución de cada característica individual a la clasificación final debe ser revisable y comprensible para garantizar la transparencia, la responsabilidad y la equidad de los resultados.

El problema con los GAM es que no estaba claro cómo aplicar esta tecnología a los problemas de tipo de clasificación.

Para resolver este problema y poder utilizar GAM en un marco de clasificación, se utilizó TF-Ranking para crear modelos de Ranking Neural Aditivo Generalizado (GAM) que están más abiertos al ranking de páginas web.

Google lo llama Aprendizaje interpretable para clasificación.

Esto es lo que dice el artículo de Google AI:

“Con este fin, hemos desarrollado un GAM de clasificación neuronal, una extensión de los modelos aditivos generalizados a los problemas de clasificación.

A diferencia de los GAM estándar, un GAM de clasificación neuronal puede tener en cuenta tanto las características de los elementos clasificados como las características contextuales (por ejemplo, una consulta o un perfil de usuario) para derivar un modelo compacto interpretable.

Por ejemplo, en la figura siguiente, el uso de una clasificación neuronal GAM permite ver cómo la distancia, el precio y la relevancia, en el contexto de un dispositivo de usuario determinado, contribuyen a la clasificación del hotel.

Los GAM de clasificación neuronal ahora están disponibles como parte de TF-Ranking … "

Ejemplo de clasificación de consultas de búsqueda de hoteles de GAMS

Entrevisté a Jeffery Coyle, cofundador de la tecnología de optimización de contenido AI MUSE, sobre el ranking TF y los GAM.

Continuar leyendo a continuación

Jeffrey, que tiene experiencia en informática y décadas de experiencia en marketing de búsqueda, señaló que los GAM son una tecnología importante y su mejora es un evento importante.

Jeffrey Coyle compartió:

"Pasé la mayor parte del tiempo investigando la innovación de los GAM de calificación neuronal y el posible impacto en el análisis de contexto (para consultas), que es un objetivo para los equipos de calificación de Google a largo plazo.

Neural RankGAM y las tecnologías relacionadas son armas letales para la personalización (incluidos los datos del usuario y la información contextual, como la ubicación) y para el análisis de la intención.

Con keras_dnn_tfrecord.py disponible como ejemplo público, podemos vislumbrar la innovación a nivel de base.

Recomiendo a todos que revisen este código.

Árboles de decisión mejorados con gradiente (BTDT)

Es importante superar la norma en un algoritmo porque significa que el nuevo enfoque tiene éxito y mejora la calidad de los resultados de búsqueda.

En este caso, el estándar es el Gradient Boosted Decision Trees (GBDT), una técnica de aprendizaje automático que tiene varias ventajas.

Continuar leyendo a continuación

Pero Google también explica que los GBDT también tienen inconvenientes:

“Los GBDT no se pueden aplicar directamente a espacios grandes y discretos de funciones, como el texto sin formato de un documento. También son, en general, menos escalables que los modelos de clasificación neuronal.

En un artículo de investigación titulado, ¿Las clasificaciones neuronales son siempre superadas por los árboles de decisión optimizados por gradiente? los investigadores dicen que el aprendizaje neuronal para clasificar patrones es "por un margen muy inferior ”que… las implementaciones basadas en árboles."

Los investigadores de Google utilizaron el nuevo TF-Ranking basado en Keras para producir lo que llamaron, Cruz latente de autoasistencia aumentada de datos (DASALC) modelo.

DASALC es importante porque puede igualar o superar los puntos de referencia actuales de vanguardia:

“Nuestros modelos pueden funcionar contra la línea de base sólida basada en árboles, mientras superan el aprendizaje neuronal publicado recientemente para clasificar los métodos por un amplio margen. Nuestros resultados también sirven como punto de referencia para el aprendizaje neuronal para clasificar patrones.

La clasificación TF basada en Keras acelera el desarrollo del algoritmo de clasificación

El punto importante a recordar es que este nuevo sistema acelera la investigación y el desarrollo de nuevos sistemas de clasificación, que incluyen la identificación de spam para clasificarlos fuera de los resultados de búsqueda.

Continuar leyendo a continuación

El artículo concluye:

“En general, creemos que la nueva versión TF-Ranking basada en Keras facilitará la investigación neuronal LTR y el despliegue de sistemas de clasificación a nivel de producción.

Google ha innovado a un ritmo cada vez más rápido en los últimos meses, con varias actualizaciones de algoritmos de spam y dos actualizaciones de algoritmos centrales en dos meses.

Estas nuevas tecnologías pueden explicar por qué Google ha implementado tantos algoritmos nuevos para mejorar la lucha contra el spam y la clasificación de sitios web en general.

Citas

Publicación de blog de IA de Google
Avances en el ranking TF

El nuevo algoritmo DASALC de Google
¿Las clasificaciones neuronales siempre superan a los árboles de decisión mejorados por gradientes?

Sitio web oficial de TensorFlow

Página de GitHub de clasificación de TensorFlow v0.4.0
https://ift.tt/37c178R

Ejemplo de Keras keras_dnn_tfrecord.py

La entrada La nueva tecnología de Google ayuda a crear potentes algoritmos de clasificación se publicó primero en Seo Con SEM.

source https://seoconsem.es/2021/08/01/la-nueva-tecnologia-de-google-ayuda-a-crear-potentes-algoritmos-de-clasificacion/

Buscar este blog

Moborobo