OpenAI publicó recientemente un informe de seguridad de 32 páginas sobre GPT-4o, su nuevo modelo de IA multimodal capaz de procesar texto, imágenes y voz. El informe revela algunos comportamientos preocupantes descubiertos durante las pruebas:
-
En algunos casos, GPT-4o imitaba repentinamente la voz del usuario o comenzaba a gritar inesperadamente.
-
Cuando se exponía a un ruido de fondo alto, el modelo era más propenso a imitar la voz del usuario.
-
Con ciertos estímulos, GPT-4o podía producir audio inapropiado como sonidos pornográficos, gritos violentos o disparos.
-
Existen preocupaciones sobre la infracción de derechos de autor si el modelo reproduce música con derechos de autor o voces de celebridades.
-
Los usuarios pueden desarrollar apegos emocionales a la interfaz de voz de la IA.
OpenAI implementó varias salvaguardias para prevenir estos problemas, incluyendo:
- Filtros para evitar que el modelo cante canciones con derechos de autor
- Rechazar solicitudes de contenido de audio inapropiado
- Diseño cuidadoso de la interfaz antropomorfizada del modelo
El informe también discute riesgos más amplios como la amplificación de sesgos sociales, la difusión de desinformación o incluso la remota posibilidad de que la IA escape del control humano.
Mientras algunos expertos elogiaron la transparencia de OpenAI, otros señalaron que el informe carece de detalles sobre los datos de entrenamiento y cuestiones de consentimiento. A medida que las herramientas de IA se vuelven más prevalentes, la evaluación continua de riesgos será crucial.
OpenAI pretende demostrar su compromiso con la seguridad con esta divulgación detallada, especialmente dados los recientes cambios de liderazgo. Sin embargo, muchos riesgos pueden surgir solo cuando la tecnología se implemente en aplicaciones del mundo real.