A Alibaba acaba de lançar o WanX 2.1, uma ferramenta de IA gratuita e de código aberto capaz de gerar imagens e vídeos a partir de textos ou outras imagens.
O lançamento inclui quatro versões do modelo: T2V-1.3B, T2V-14B, I2V-14B-720P e I2V-14B-480P, cada uma com capacidades específicas para criação de conteúdo visual.
O WanX 2.1 está disponível globalmente nas plataformas ModelScope da Alibaba Cloud e HuggingFace, sendo esta última voltada para uso acadêmico, de pesquisa e comercial.
Para quem não sabe, o “14B” no nome dos modelos indica que eles podem processar até 14 bilhões de parâmetros, o que significa resultados mais precisos e detalhados.
Segundo a Alibaba, o Wan-VAE (uma parte essencial do sistema) oferece eficiência e desempenho excepcionais, codificando e decodificando vídeos em 1080p de qualquer duração, mantendo as informações temporais. Isso faz dele uma base ideal para geração de vídeos e imagens de alta qualidade.
Se você é desenvolvedor, pesquisador ou apenas um entusiasta de IA, já pode baixar o WanX 2.1 diretamente da página do Github e começar a explorar suas funcionalidades.
Veja mais sobre web!