De acordo com documentos internos vazados, a NVIDIA está supostamente desenvolvendo um modelo de IA de vídeo com o codinome Cosmos, liderado pelo vice-presidente de pesquisa Ming-Yu Liu. O projeto visa construir um modelo de vídeo fundamental de última geração combinando transporte de luz, física e simulação de inteligência para várias aplicações downstream.
E-mails vazados revelam o objetivo da NVIDIA de criar uma "fábrica de dados de vídeo" que possa produzir dados de treinamento equivalentes às experiências visuais de uma vida humana diariamente. A empresa estaria supostamente coletando grandes quantidades de dados não autorizados de fontes como YouTube e Netflix para treinar o modelo.
Funcionários da NVIDIA estariam usando ferramentas como yt-dlp para baixar vídeos, utilizando máquinas virtuais para evitar detecção. Quando solicitada a comentar, a NVIDIA afirmou que suas práticas são legais e cumprem as leis de direitos autorais, declarando que os direitos autorais não protegem fatos, ideias ou informações que podem ser livremente aprendidas de outras fontes.
No entanto, o CEO do YouTube já declarou anteriormente que usar seus vídeos para treinar modelos de IA como o Sora da OpenAI violaria seus termos de serviço. A Netflix também disse que não tem acordo de extração de conteúdo com a NVIDIA e seus termos proíbem a coleta de dados.
Isso ocorre enquanto criadores do YouTube buscam uma ação coletiva contra a OpenAI por supostamente usar milhões de vídeos do YouTube para treinar modelos de IA sem permissão ou compensação.
Embora controverso, dados de treinamento de alta qualidade de fontes originais da internet têm se mostrado valiosos para o desenvolvimento de modelos de IA. Pesquisas recentes sugerem que modelos treinados com dados da internet inicial podem ter vantagens sobre aqueles que usam dados gerados posteriormente por IA.
A ética e a legalidade da coleta de dados online para treinamento de IA permanecem uma questão controversa na indústria.