Sora, um programa gerador de vídeo de inteligência artificial (IA) criado pela startup OpenAI em 2021, está fazendo barulho ao sair da fase de pesquisa e foi oficialmente lançado ao público sob o novo nome de Sora Turbo.
O lançamento desencadeou um frenesi online entre os usuários, fazendo com que a empresa interrompesse temporariamente a criação de novas contas após se ver sobrecarregada por uma avalanche de tráfego.
Sora usa prompts de texto para criar conteúdo, semelhante a outros programas de criação de conteúdo, como o ChatGPT. Ao contrário dos programas tradicionais de IA que produzem respostas escritas, Sora cria vídeos de alta qualidade com base na entrada de texto do usuário.
Sora é repugnantemente boa, gj @O mesmo
Adicionando-o a @everartai o mais rápido possível para que você possa dar vida às suas imagens pic.twitter.com/wMehxOc8cm
-Jay A (@jay_azhang) 9 de dezembro de 2024
De acordo com um comunicado da OpenAI que acompanhou o lançamento em 9 de dezembro, o Sora Turbo é uma melhoria em relação ao programa Sora original, pois permite uma criação de vídeo mais rápida, vídeos de maior qualidade e uma série de recursos de edição de vídeo que permitem aos usuários recortar e criar vídeos. sequências e para alterar elementos em um vídeo enquanto preserva outras partes do vídeo.
Então, o que é exatamente Sora Turbo e como ele está mudando a indústria de criação de vídeo?
Como funciona o Sora Turbo?
O poder do Sora, e de muitos outros geradores de vídeo de IA, é sua capacidade de replicar o que os humanos podem fazer com equipamentos de filme de alta qualidade, mas em um tempo extremamente curto.
Os usuários podem fornecer instruções ao programa não apenas sobre o que incluir no vídeo, mas também sobre o tipo de câmera que desejam usar, seleção de lentes, configuração de iluminação, estética visual, composição e storyboard.
Um exemplo de prompt usando alguns desses detalhes poderia ser o seguinte:
“Use uma lente telefoto média (85 mm) para capturar um retrato íntimo de um vendedor ambulante trabalhando à noite. Ilumine a cena com uma mistura das luzes quentes e brilhantes do próprio vendedor e das luzes ambientais mais frias da cidade ao fundo. Concentre-se nos detalhes das mãos do vendedor enquanto ele prepara os alimentos ou mercadorias, equilibrando a moldura com seu rosto expressivo. A imagem deve evocar o trabalho árduo e o orgulho do seu ofício.”
Quão bom é Sora Turbo?
Não é perfeito.
Os usuários escrevem uma mensagem de texto sobre que tipo de vídeo gostariam de gerar e Sora cria o vídeo. Existem limitações na versão atual. A qualidade do vídeo é de até 1080p a 30 quadros por segundo e pode ter apenas 20 segundos de duração.
Este é um exemplo de vídeo Sora Turbo de Emi Kusana, artista multimídia e vocalista do Satellite Young, grupo musical inspirado em temas de J-pop e ficção científica dos anos 1980, usando temas de Takenoko-zoku, grupo de moda de década de 1980. Embora haja um limite de 20 segundos, o recurso Sora Storyboard permite aos usuários agrupar vários vídeos gerados por IA e organizá-los sequencialmente, conforme mostrado no vídeo abaixo.
Erros óbvios também aparecem em alguns vídeos. Por exemplo, no vídeo acima, na marca de 36 segundos, um dos dançarinos faz um giro de 180 graus no pescoço, o que obviamente não é humanamente possível, e continua a rotina de dança. A empresa terá que trabalhar mais para resolver bugs como esse, disse.
Num exemplo de vídeo de uma mulher cozinhando, postado em fevereiro por Sam Altman, fundador da OpenAI, os espectadores perceberão que a colher na mão direita da mulher desaparece depois que ela para de misturar.
-Sam Altman (@sama) 15 de fevereiro de 2024
Como o Sora Turbo foi recebido na indústria?
Alguns especialistas da indústria e diretores criativos estão preocupados com a forma como Sora pode perturbar a indústria cinematográfica, especialmente Hollywood.
Em março, um executivo de Hollywood disse à Al Jazeera sob condição de anonimato: “Não vejo isso como uma ameaça à produção, mas sim como uma ameaça à forma como a produção é feita como a conhecemos atualmente”.
Ele se referiu às mudanças na forma como a pós-produção era realizada no passado – como quando as pessoas começaram a editar vídeos em laptops pessoais, em vez de pagar empresas de pós-produção para fazer o trabalho.
“Muitas pessoas foram exterminadas nessa transição, enquanto outras puderam de repente pagar um editor adequado, sem as despesas gerais que uma agência de correio exige”, disse ele.
Sora é o único gerador de vídeo de IA?
Não, não é. O mercado de geradores de vídeo de IA cresce a cada dia. No entanto, um claro diferenciador entre Sora e outros concorrentes é a qualidade de vídeo e o realismo incomparáveis que Sora é capaz de produzir.
Além disso, o novo lançamento, Sora Turbo, vem com uma série de recursos avançados de edição de vídeo que os usuários podem encontrar no Adobe Premiere Pro ou Final Cut Pro, dois programas de software de edição de vídeo muito populares usados na criação de filmes, TV e conteúdo online.
Além disso, Sora é apoiado financeiramente pela megaempresa de software Microsoft. Até à data, a Microsoft investiu quase 14 mil milhões de dólares, com a última injecção de dinheiro de 10 mil milhões a 23 de Janeiro. De acordo com a CNBC em Outubro, a OpenAI tem agora uma linha de crédito rotativo de 4 mil milhões de dólares, elevando a sua liquidez total para mais de 10 mil milhões de dólares. Esse montante de investimento proporciona à Sora um nível de alavancagem que muitos outros concorrentes não possuem.
Quais outros geradores de vídeo estão disponíveis?
Existem vários outros geradores de vídeo de IA de primeira linha, incluindo:
Pista Geração 3
A Runway, fundada em 2018, levantou um total de US$ 237 milhões em financiamento e está supostamente em negociações com a empresa de capital de risco General Atlantic para levantar US$ 450 milhões em novos financiamentos, de acordo com The Information, uma publicação que cobre a indústria de tecnologia e a indústria de capital de risco. A versão gratuita do Runway Gen 3 pode gerar videoclipes de 10 segundos com resolução de 720p e 30 quadros por segundo. Para assinantes pagos, os videoclipes podem ser definidos para 1440p ou 2160p.
Semelhante ao Sora, ele pode criar um vídeo com base em um prompt de texto, mas depende fortemente de criadores de mídia social e profissionais de marketing que o utilizam para criar publicidade devido à sua alta velocidade e eficiência em projetos de vídeo curtos.
Um dos desafios do vídeo longo gerado por IA é a consistência entre vários vídeos gerados. Vídeos mais longos exigem refinamento interativo para fazer com que todos os vídeos tenham a mesma aparência.
Lâmina IA
A Kling, apoiada pela Kuaishou, também conhecida internacionalmente como Kwai, é uma grande empresa chinesa de tecnologia com sede em Pequim, China. Kling foi lançado em junho de 2024 e está se posicionando como concorrente de plataformas como Sora da OpenAI. Kling pode gerar vídeos de até dois minutos com resolução de 1080p a 30 quadros por segundo.
MiniMax
A MiniMax, uma startup chinesa de IA, é apoiada pelo Alibaba Group Holding, uma empresa multinacional especializada em comércio eletrónico, serviços de Internet e serviços de tecnologia com sede na China e cuja mais recente ronda de financiamento foi de 600 milhões de dólares em março. A MiniMax foi fundada em 2021 por ex-funcionários da SenseTime, uma empresa líder em IA com sede em Shatin, Hong Kong.
O Minimax pode gerar videoclipes de seis segundos com resolução de 720p e 25 quadros por segundo.