Vazamento Revela que Nvidia Coleta Vídeos do YouTube Diariamente para Treinar Modelos de IA
Comunicações Internas Mostram que a Empresa Está Usando Conteúdos do YouTube para Desenvolver Tecnologias Avançadas
Comunicações internas vazadas do Slack da Nvidia, obtidas pela 404 Media, revelaram que a empresa está coletando vídeos do YouTube diariamente para treinar seu modelo de IA de vídeo, conhecido como Cosmos. Até agora, a equipe compilou 38,5 milhões de horas de vídeo de várias fontes, principalmente do YouTube. Apesar de preocupações internas sobre direitos autorais, os executivos deram uma “aprovação geral” para continuar extraindo conteúdo.
Coleta de Dados e Treinamento de IA
A Nvidia está utilizando esses dados para treinar seu Omniverse, carros autônomos e “humanos digitais”. Segundo a investigação da 404 Media, a empresa está coletando cerca de “80 anos de vídeos por dia” do YouTube e outras fontes para esses projetos.
O Cosmos é um modelo de mundo de vídeo de IA destinado a impulsionar várias linhas da Nvidia, incluindo GeForce, arquitetura de GPU, DGX, frameworks Deep Learning, Omniverse, Avatar, Project GR00T e veículos autônomos. Os executivos da Nvidia descrevem o Cosmos como um modelo de base avançado que integra simulação de luz, física e inteligência, essencial para diversos aplicativos da empresa.
Métodos de Coleta e Controvérsias
Mensagens internas do Slack mostram que a equipe da Nvidia usou o programa de linha de comando yt-dlp para baixar vídeos do YouTube, utilizando de 20 a 30 máquinas virtuais da AWS para evitar bloqueios. O YouTube foi a principal fonte de vídeos, mas a equipe também considerou outras fontes como Netflix e Discovery Channel.
Embora alguns funcionários tenham levantado preocupações legais sobre o uso de conteúdo protegido por direitos autorais, os gerentes de projeto insistiram que a decisão de seguir em frente veio dos altos executivos. Entre os canais do YouTube selecionados para scraping estão MKBHD, PickUpLimes, Architectural Digest, Expedia, Mediastorm6801, 8kEarth e The CriticalDrinker.
Quando contatados pela 404 Media, tanto o YouTube quanto a Netflix afirmaram que extrair conteúdo de suas plataformas para treinar modelos de IA é uma violação clara de seus termos de serviço.
Implicações Legais e Futuro
O uso de dados protegidos por direitos autorais para treinar modelos de IA é uma área legalmente cinzenta. Embora existam conjuntos de dados públicos, como InternVid-10M e HD-VG-130M, destinados apenas para pesquisa acadêmica, a Nvidia está utilizando esses dados para desenvolver produtos comerciais.
No ano passado, o The New York Times processou a OpenAI e a Microsoft por uso não autorizado de artigos protegidos por direitos autorais para treinar modelos de IA. Em maio, artistas visuais processaram empresas como Stability AI, Midjourney, DeviantArt e Runway AI por usar cópias de seus trabalhos para treinar modelos de IA sem permissão.
Progresso e Perspectivas
Até o final de maio, a equipe da Nvidia havia compilado 38,5 milhões de URLs de vídeo, com a maioria sendo conteúdo cinematográfico. Eles também adicionaram conjuntos de dados como Ego-Exo4D, Ego4D, HOI4D e dados de jogos do GeForce Now. A Nvidia está atualmente treinando um modelo 1B, cada um com 16 nós, com planos de ampliá-lo para 10B.
Apesar das controvérsias, o CEO da Nvidia, Jensen Huang, está satisfeito com o progresso. Ele afirmou: “Ótima atualização. Muitas empresas precisam construir FM de vídeo [modelos fundamentais]. Podemos oferecer um pipeline totalmente acelerado.”
- Leia também: Nvidia Investe em Nova Tecnologia para Fornecer Chips de IA Personalizados para Grandes Empresas
A coleta de vídeos do YouTube pela Nvidia para treinar seus modelos de IA levanta questões legais e éticas significativas. Enquanto a empresa avança em suas pesquisas e desenvolvimento, a necessidade de regulamentação e proteção de direitos autorais torna-se cada vez mais urgente. Com o CEO da Nvidia otimista sobre o progresso, o impacto dessa prática no mercado de IA e nos direitos dos criadores de conteúdo continua a ser monitorado de perto.
Fonte: 404 Media | @jason_koebler no X
Share this content: