A OpenAI, empresa que ganhou destaque com o ChatGPT, anunciou na quinta-feira o lançamento do Sora, seu mais recente modelo de inteligência artificial voltado para a geração de vídeos.
A OpenAI, empresa que ganhou destaque com o ChatGPT, anunciou na quinta-feira o lançamento do Sora, seu mais recente modelo de inteligência artificial voltado para a geração de vídeos. Semelhante ao DALL-E, ferramenta de geração de imagens da OpenAI, o Sora permite aos usuários digitar uma cena desejada e receber um clipe de vídeo em alta definição como resultado.
De acordo com a empresa, o Sora é capaz de gerar vídeos inspirados em imagens estáticas, estender vídeos existentes ou preencher quadros ausentes. Com essa nova ferramenta, a OpenAI busca expandir suas capacidades no campo da multimodalidade, combinando geração de texto, imagem e vídeo.
O Sora chega em um momento em que a geração de vídeos por IA ganha cada vez mais destaque, seguindo a popularidade dos chatbots e geradores de imagens. No entanto, junto com as oportunidades criativas surgem preocupações sérias em relação à desinformação, especialmente com importantes eleições políticas se aproximando em todo o mundo.
Brad Lightcap, COO da OpenAI, destacou a importância da multimodalidade, afirmando que “o mundo é multimodal” e que as interfaces de IA devem refletir essa diversidade de percepções humanas.
Atualmente, o Sora está disponível apenas para um grupo seleto de testadores de segurança, que avaliam o modelo em relação a preocupações como desinformação e viés. A empresa também está desenvolvendo um “classificador de detecção” para identificar clipes de vídeo gerados pelo Sora e planeja incluir metadados específicos em sua saída para ajudar na identificação de conteúdo gerado por IA.
O Sora representa mais um avanço da OpenAI no campo da inteligência artificial, utilizando a arquitetura Transformer, introduzida por pesquisadores do Google em 2017, para simular e entender o mundo real.
A disponibilidade do Sora marca um novo capítulo na história da IA generativa e promete abrir novas possibilidades criativas para usuários em todo o mundo.