Recientemente, Google está tratando de mejorar el reconocimiento de escritura a mano en Gboard, teclado virtual para dispositivos iOS y Android, mediante la integración de nuevos sistemas de inteligencia artificial. Según los investigadores de Google AI, la nueva plataforma de inteligencia artificial permitirá que esta función se implemente más rápidamente y, en particular, será de un 20 a un 40% menos propensa a errores que los modelos de aprendizaje automático utilizados. utilizado antes.
- Google lanza Backstory: nueva herramienta de seguridad de red para empresas
“Los avances en el desarrollo de modelos de aprendizaje automático han permitido a los investigadores crear nuevas arquitecturas de modelos y métodos de entrenamiento, lo que nos permite modificar el enfoque original, en lugar de construir uno. El modelo único funciona con todos los datos de entrada. Lanzamos nuevos modelos para todos los idiomas latinos en Gboard a principios de este año ‘, compartieron dos ingenieros sénior de software de Google, Sandro Feuz y Pedro Gonnet, en una publicación. en el blog personal.
Como explican Feuz y Gonnet, la mayoría de los sistemas de reconocimiento de escritura a mano suelen utilizar puntos de contacto (puntos de contacto) para manejar los caracteres latinos delineados. Estos datos de entrada se representan como una serie de guiones y estos guiones, a su vez, contendrán muchas secuencias de puntos específicos con una marca de tiempo. Primero, Gboard normalizará las coordenadas del punto de contacto para garantizar que permanezcan consistentes en todos los dispositivos con diferentes velocidades de muestreo y precisión, luego las convertirá en una serie de curvas Bezier (las líneas de curvas paramétricas se usan a menudo en gráficos por computadora).
La principal ventaja de estas cadenas, como dijeron los dos expertos Feuz y Gonnet, es que son más compactas que la serie de puntos de entrada básicos. En cuanto al punto final, cada curva estará representada por un polinomio (expresión de variables y coeficientes), determinado por el punto de inicio, punto final y punto de control. Por ejemplo, la palabra “go go” puede contener 186 de estos puntos, indicados por una secuencia de 4 curvas de Bézier para la letra ‘G’ (y 2 puntos de control) y 2 curvas para la letra ‘O’.
- Google lanzó TensorFlow Lite 1.0 para dispositivos móviles e integrados
Estas secuencias proporcionarán redes neuronales artificiales recurrentes (entrenadas para reconocer caracteres escritos a mano, específicamente, versiones bidimensionales de redes neuronales artificiales de regresión aproximada (QRNN)). Esta es una red de paralelización eficiente y, por lo tanto, ofrece un mejor rendimiento predictivo. Lo importante aquí es que el QRNN también mantendrá relativamente pequeño el número de pesos (la potencia de las conexiones entre las funciones matemáticas o los nodos que componen la red), lo que ayuda a reducir el tamaño del archivo.
Entonces, ¿cómo crean los modelos de IA la punta o la punta de las curvas? Específicamente, creando una matriz de columnas y filas, donde cada columna corresponde a una curva de entrada y cada línea corresponde a una letra del alfabeto. Las salidas de la red neuronal se combinarán con modelos de lenguaje basados en caracteres, dando lugar a cadenas de lenguaje populares y “penalizaciones” por cadenas inusuales y separadas. Al mismo tiempo, la secuencia de puntos de contacto se convertirá en cadenas más cortas, correspondientes a una curva. Finalmente, el identificador basado en QRNN producirá una serie de probabilidades relacionadas con caracteres.
- Aplicación Google AI para la detección de enfermedades oculares
El reconocimiento de escritura a mano de Gboard se realizará desde el dispositivo a los modelos de TensorFlow Lite, un logro que el grupo logró al transformar los modelos de reconocimiento (entrenados en estructuras de aprendizaje automático). Google TensorFlow). Esto permite no solo reducir el tiempo de inferencia en comparación con la implementación completa de TensorFlow, sino que también ayuda a reducir la cantidad de almacenamiento de datos de Gboard.
‘Seguiremos impulsando la implementación de esta herramienta, además de mejorar el identificador básico de la lengua latina. El equipo de Google ha estado trabajando duro para crear un nuevo modelo para todos los idiomas escritos a mano compatibles con Gboard ‘, comparten Sandro Feuz y Pedro Gonnet.
Teclado virtual gboard ai con reconocimiento de escritura a mano de Google
Recientemente, Google está tratando de mejorar el reconocimiento de escritura a mano en Gboard, teclado virtual para dispositivos iOS y Android, mediante la integración de nuevos sistemas de inteligencia artificial. Según los investigadores de inteligencia artificial de Google, la nueva plataforma de inteligencia artificial permitirá que esta función se implemente más rápidamente y, en particular, será de un 20 a un 40% menos propensa a errores que los modelos de aprendizaje automático utilizados. utilizado antes.
- Google lanza Backstory: nueva herramienta de seguridad de red para empresas
“Los avances en el desarrollo de modelos de aprendizaje automático han permitido a los investigadores crear nuevas arquitecturas de modelos y métodos de entrenamiento, lo que nos permite modificar el enfoque original, en lugar de construir uno. El modelo único funciona con todos los datos de entrada. Lanzamos nuevos modelos para todos los idiomas latinos en Gboard a principios de este año ”, compartieron dos ingenieros de software senior de Google, Sandro Feuz y Pedro Gonnet, en una publicación. en el blog personal.
Como explican Feuz y Gonnet, la mayoría de los sistemas de reconocimiento de escritura a mano suelen utilizar puntos de contacto (puntos de contacto) para manejar los caracteres latinos delineados. Estos datos de entrada se representan como una serie de guiones y estos guiones, a su vez, contendrán muchas secuencias de puntos específicos con marca de tiempo. Primero, Gboard normalizará las coordenadas de los puntos de contacto para garantizar que permanezcan consistentes en todos los dispositivos con diferentes velocidades de muestreo y precisión, luego las convertirá en una serie de curvas Bezier (las líneas de curvas paramétricas se usan a menudo en gráficos por computadora).
La principal ventaja de estas cadenas, como dijeron los dos expertos Feuz y Gonnet, es que son más compactas que la serie de puntos de entrada básicos. En cuanto al punto final, cada curva estará representada por un polinomio (expresión de variables y coeficientes), determinado por el punto de inicio, punto final y punto de control. Por ejemplo, la palabra “go go” puede contener 186 de estos puntos, indicados por una secuencia de 4 curvas de Bézier para la letra ‘G’ (y 2 puntos de control) y 2 curvas para la letra ‘O’.
- Google lanzó TensorFlow Lite 1.0 para dispositivos móviles e integrados
Estas secuencias proporcionarán redes neuronales artificiales recurrentes (entrenadas para reconocer caracteres escritos a mano, específicamente, versiones bidimensionales de redes neuronales artificiales de regresión aproximada (QRNN)). Esta es una red de paralelización eficiente y, por lo tanto, ofrece un mejor rendimiento predictivo. Lo importante aquí es que QRNN también mantendrá relativamente pequeño el número de pesos (la potencia de las conexiones entre las funciones matemáticas o los nodos que componen la red), lo que ayuda a reducir el tamaño del archivo.
Entonces, ¿cómo crean los modelos de IA la punta o la punta de las curvas? Específicamente, creando una matriz de columnas y filas, donde cada columna corresponde a una curva de entrada y cada línea corresponde a una letra del alfabeto. Las salidas de la red neuronal se combinarán con modelos de lenguaje basados en caracteres, dando lugar a cadenas de lenguaje populares y “penalizaciones” por cadenas inusuales y separadas. Al mismo tiempo, la secuencia de puntos de contacto se convertirá en cadenas más cortas, correspondientes a una curva. Finalmente, el identificador basado en QRNN producirá una serie de probabilidades relacionadas con los caracteres.
- Aplicación Google AI para la detección de enfermedades oculares
El reconocimiento de escritura a mano de Gboard se ejecutará desde el dispositivo hasta los modelos de TensorFlow Lite, una hazaña que el grupo ha logrado al transformar los modelos de reconocimiento (entrenados en estructuras de aprendizaje automático). Google TensorFlow). Esto permite no solo reducir el tiempo de inferencia en comparación con la implementación completa de TensorFlow, sino que también ayuda a reducir la cantidad de almacenamiento de datos de Gboard.
“Seguiremos impulsando la implementación de esta herramienta, además de mejorar el identificador básico de la lengua latina. El equipo de Google trabajó duro para crear un nuevo modelo para todos los lenguajes escritos a mano compatibles con Gboard ‘, comparten Sandro Feuz y Pedro Gonnet.