Google Meet está empezando a implementar cancelación de ruido por inteligencia artificial basada en la nube. Esta función permite eliminar todos aquellos ruidos molestos cuando estamos en una reunión (clicks de bolígrafo, ruidos de sillas moviéndose, puertas, gente que haya por nuestra casa, etc.). A pesar de que la función se despliegue primero para los usuarios de cuentas G Suite, es bastante curioso conocer cómo Google ha logrado esto, ya que hablamos de cancelar sonido mediante aprendizaje automático.
Serge Lachapelle, director de gestión de producto en G Suite, ha explicado en VentureBeat cómo funciona este sistema de cancelación de ruido activa mediante IA, ya que es bastante curioso cómo se logra y todo el trabajo y mecanismos que hay detrás de que esta tecnología funcione en tiempo real.
Analizando el ruido en tiempo real mediante aprendizaje automático
Lachapelle cuenta que Google lleva trabajando en este mecanismo desde 2017. Todo empezó cuando Google adquirió Limes Audio para mejorar la calidad de llamadas en Hangouts. Desde el principio, la idea fue eliminar ruidos molestos mientras se realizan videollamadas, sobre todo cuando los participantes de la llamada pertenecen a distintas franjas horarias.
"Empezó como un proyecto desde nuestras salas de conferencias. Yo vivo en Estocolmo. Cuando nos reunimos con los EE.UU., por lo general, allí es por la mañana y en Europa de noche. Se escuchan un montón de ruidos extraños, personas comiendo el desayuno o la cena, o haciendo reuniones tardías en casa, niños gritando... de todo. Fue realmente lo que desencadenó este proyecto hace un año y medio" Serge Lachapelle.
Según Lachapelle esto nunca se había hecho, y Google no tenía claro si necesitaría algún tipo de hardware adicional dedicado para el aprendizaje automático, aunque posteriormente vieron que todo se podía hacer mediante software. Lo primero que hicieron fue desarrollar un algoritmo. Para este desarrollo utilizaron un conjunto de datos mixtos de ruido y voz utilizando tanto al propio equipo de Google (empleados) como vídeos de YouTube en los que aparecía bastante gente hablando, todo valía.
El segundo paso para construir el algoritmo fue decidir qué es ruido y qué no. Perros ladrando, niños dando voces, sonidos de puertas, aspiradoras... Desde Google comentan que el tema de los sonidos se actualizará de forma constante según vayan detectando necesidades de los usuarios, ya que es complejo establecer de forma exacta los sonidos que se deben eliminar y los que no.
Pero, ¿cómo sabe Google lo que es voz y lo que es ruido? Cuando hablamos, nuestra voz se envía desde el dispositivo (Android, iOS u ordenador) a un centro de datos en la nube de Google, pasa por el modelo de aprendizaje de Google, se cifra de nuevo y se devuelve a la reunión. Es decir, el algoritmo analiza la voz en tiempo real. Esto puede plantear dudas a nivel de privacidad, aunque Chapelle afirma que las voces que reciben no se usan para entrenar a la IA y que todos los datos se gestionan de forma confidencial y segura.
"Hay muchas maneras de aplicar estos modelos. Algunos requieren un buen ordenador, una extensión o una tarjeta gráfica más potente. No queríamos ir por ahí. Queríamos asegurarnos de que el acceso a esto sería posible en los teléfonos, no importa qué teléfono tengas, y al igual en los ordenadores portátiles. Estos son cada vez más delgados, ya no tienen ventiladores. Cargarles demasiado la CPU no es una buena idea. Así que decidimos ver si podíamos hacer esto en la nube".
Esta característica estará activa por defecto para miembros de G-Suite. Como siempre, el despliege es progresivo, por lo que puede tardar unos días en llegar a todos los usuarios. No obstante, Google Meet y sus funciones premium están disponibles hasta septiembre para el resto de usuarios por lo que, sobre el papel, deberíamos poder probar esta función sin menor problema. Vendrá activada por defecto ya que, según Lachapelle "no es algo que los usuarios vayan a querer desactivar", aunque siempre podremos quitarla desde los ajustes si no nos convence.
Vía | Venturebeat
Ver 1 comentarios