¿Google falsificó su demostración de IA dúplex?

Hace unas semanas, en Google I / O, el director ejecutivo de la empresa, Sundar Pichai, hizo una demostración de un avance increíble en tecnología de voz e inteligencia artificial. La demostración involucró a un nuevo asistente de IA que hacía llamadas telefónicas a dos negocios, una peluquería y un restaurante, para hacer una cita y reservar una reserva, respectivamente. Puede ver la demostración original a continuación, pero para aquellos de ustedes que no tienen acceso a video, las llamadas son impresionantes porque la IA responde (y suena) mucho más humana que su asistente de voz típico.

Hace una pausa. Dice 'Umm', de la misma manera que lo haría un humano, al considerar opciones. Cuando el que toma la reserva en el restaurante confunde la solicitud de la IA, la IA no comienza a burlarse de tonterías. Ni siquiera se agita. Ambas demostraciones son impresionantes, pero la demostración del restaurante es, personalmente, creo, que hizo que la gente se sentara y parpadeara. Pero también hay rarezas en las grabaciones que noté, incluso en ese momento. Ahora Axios ha escrito un poco más sobre el evento, incluidas algunas preguntas que Google, aparentemente, no quiere responder. Primero, aquí está el video:



Tenga en cuenta las rarezas:

  • Los negocios Nunca identificarse
  • Los humanos que toman el teléfono nunca dan sus nombres.
  • No hay ruido de fondo ambiental
  • Los tomadores de reservas nunca solicitan información. Sin número de teléfono de contacto. Sin nombre.

Axios llamó a más de dos docenas de salones de belleza, incluidos algunos en Mountain View, y todos los establecimientos comerciales dieron su nombre de inmediato cuando se los contactó. Este es simplemente un procedimiento estándar. Es extremadamente raro contactar a alguien en un lugar de trabajo y no recibir el nombre de la empresa, el nombre del orador o ambos. Incluso algo tan simple como 'Esta es Lisa, ¿en qué puedo ayudarlo?' le dice a la persona al otro lado del teléfono que se ha comunicado con una empresa y no con una línea personal. Sin embargo, Pichai afirma específicamente: Lo que vas a escuchar es que el asistente de Google realmente llama a real salón para programar una cita para usted. Vamos a escuchar.

Google se ha callado sobre el tema. Se niega a decir si las llamadas fueron editadas, incluso solo para eliminar los nombres comerciales y la información de identificación. Se niega a revelar nada sobre la demostración.

¿Importa?

Hay dos formas de ver esta situación. Por un lado, la tecnología de llamadas fue increíblemente impresionante. La IA hizo responda con pausas creíbles. No falló cuando se le presentó una comunicación nerviosa. Suponiendo que la IA en realidad generara esas respuestas por sí misma, sigue siendo un logro impresionante en la replicación de voz (y ya hemos cubierto el trabajo de Google en esta área antes).

Pero Sundar Pichai no presentó esta demostración como un avance realmente impresionante en tecnología de voz. Estaba haciendo una demostración (o afirmando hacer una demostración) de una situación en la que un asistente de inteligencia artificial podía responder a mensajes inesperados de conversación, confusión y escenarios del mundo real. Y es muy posible que la razón por la que Google organizó parcial o completamente la demostración (y, por lo tanto, mintió en el encuadre de la presentación) es porque no puede garantizar que la persona al otro lado del teléfono tenga un acento que su IA pueda. entender. Es posible que no pueda garantizar que la conversación no dar un giro que su IA pueda manejar. Y es posible que no pueda prometer que su IA comprenderá la información proporcionada dependiendo de cómo se ordene verbalmente esa información. Este tipo de procesamiento 'difuso' es algo en lo que los cerebros humanos son muy, muy buenos, y es un área donde la IA generalmente ha tenido problemas.

Pero aquí hay una cosa que sí sabemos. Cuando las empresas logran avances importantes, especialmente en un área como la tecnología de asistentes artificiales, normalmente no pueden Espere para lucirlos en tantos escenarios como sea posible. Cuando Apple lanzó Siri o Microsoft lanzó Cortana, mostraron sus respectivas capacidades en gran medida. Hasta el día de hoy, Microsoft publica noticias periódicas de Cortana sobre las características y capacidades de la plataforma.

Todo lo que tenemos en Google Duplex, por el contrario, es una demostración de IA enlatada que se muestra en un evento de Google, en condiciones que plantean preguntas reales sobre si el evento se realizó o no. La negativa de Google a responder preguntas sobre su demostración no deja que se vea bien en este escenario. Si Google realmente organizó este evento, retiramos nuestros comentarios anteriores. La compañia no pasó la prueba de Turing en absoluto. Simplemente demostró un escenario teórico que algún día podría conducir a tal logro.

Copyright © Todos Los Derechos Reservados | 2007es.com