Após o anúncio da série Blackwell RTX 50 na noite passada, houve alguma confusão. Em uma sessão de perguntas e respostas ao vivo hoje, o CEO da Nvidia, Jensen Huang, pudemos pedir esclarecimentos sobre o DLSS 4 e algumas das outras técnicas de renderização neural que a Nvidia demonstrou. Sendo a IA um elemento-chave da arquitetura Blackwell, é importante compreender melhor como ela está sendo usada e o que isso significa para vários casos de uso.
Um dos grandes “multiplicadores” de desempenho do DLSS 4 é a geração de vários quadros. Com o DLSS 3, a Nvidia renderizaria dois quadros e então usaria IA para interpolar um quadro intermediário. Isso adiciona alguma latência ao pipeline de renderização do jogo e também causa alguns problemas de ritmo de quadros. Superficialmente, parecia que o DLSS 4 faria algo semelhante, mas em vez de gerar um quadro, geraria dois ou três quadros – em outras palavras, vários quadros de interpolação. Acontece que isso está incorreto.
Quando perguntamos como funciona a geração de vários quadros do DLSS 4 e se ainda estava interpolando, Jensen proclamou corajosamente que o DLSS 4 “prevê o futuro” em vez de “interpolar o passado”. Isso muda drasticamente a forma como funciona, o que requer em termos de capacidades de hardware e o que podemos esperar em termos de latência.
Ainda há trabalho sendo feito sem a entrada de novos usuários, embora a funcionalidade de distorção do Reflex 2 possa mitigar isso, pelo menos parcialmente. Mas com base em quadros renderizados anteriormente, vetores de movimento e outros dados, o DLSS 4 gerará novos quadros para criar uma experiência mais suave. Ele também possui novos requisitos de hardware que o ajudam a manter um melhor ritmo de quadros.
Ainda não pudemos testá-lo pessoalmente, então não podemos dizer com certeza como a geração de vários quadros do DLSS 4 se compara à geração de quadros do DLSS 3 e à renderização normal. Parece que ainda há uma penalidade de latência, mas o quanto isso será sentido – e particularmente como será em diferentes níveis de GPUs da série RTX 50 – é uma consideração importante.
Sabemos pelo DLSS 3 que se você obtiver apenas um FPS gerado de 40 como exemplo, pode parecer muito lento e lento, mesmo que pareça razoavelmente suave. Isso ocorre porque a entrada do usuário é amostrada a 20 FPS. Com o DLSS 4, isso significa potencialmente que você poderia ter uma taxa de quadros gerada de 80 FPS com amostragem do usuário de 20 FPS. Ou, em termos diferentes, geralmente sentimos que você precisa de taxas de amostragem de pelo menos 40-50 FPS para que um jogo pareça responsivo ao usar framegen.
Com a geração de vários quadros, isso significaria que poderíamos precisar de taxas de quadros geradas de 160 a 200 FPS para uma experiência semelhante. Isso pode ser ótimo em um monitor de 240 Hz e adoraríamos ver isso, mas da mesma forma, a geração de vários quadros em um monitor de 60 Hz ou mesmo 120 Hz pode não ser tão incrível.
Nossa outra pergunta foi em relação às texturas neurais e à renderização mostrada. A Nvidia mostrou alguns exemplos de uso de memória de 48 MB para materiais padrão e reduziu para 16 MB com “RTX Neural Materials”. Mas o que isso significa exatamente e como isso afetará a experiência de jogo? Estávamos particularmente interessados em saber se havia ou não potencial para ajudar GPUs que não têm tanta VRAM, como o RTX 4060 com 8 GB de memória.
Infelizmente, Jensen diz que esses materiais neurais exigirão implementação específica por parte dos criadores de conteúdo. Ele disse que a Blackwell tem novos recursos que permitem aos desenvolvedores e artistas colocar código de shader misturado com instruções de renderização neural nos materiais. As descrições dos materiais tornaram-se bastante complexas e descrevê-los matematicamente pode ser difícil. Mas Jensen também disse que “a IA pode aprender como fazer isso por nós”.
Esses novos recursos não estarão disponíveis nas GPUs da geração anterior, pois elas não possuem os recursos de hardware necessários para misturar código shader com código neural. Portanto, para obter o benefício, os materiais neurais exigirão trabalho de conteúdo e, portanto, os desenvolvedores precisarão adotar especificamente esses novos recursos.
Isso significa, por um lado, que se acabarmos com uma placa RTX 5060 de 8 GB como exemplo, para uma série de jogos existentes, os 8 GB de VRAM ainda podem ser um fator limitante. Isso também significa que RTX 4060 e 4060 Ti com 8 GB não terão uma nova vida graças à renderização neural. Ou pelo menos é assim que interpretamos as coisas. Mas talvez uma rede de IA possa aprender como fazer algumas dessas coisas para nós no futuro.