DeepSeek lança gerador de imagens para competir com DALL·E e Stable Diffusion

A DeepSeek está chegando com força total. Após causar um grande impacto na indústria de IA com um concorrente do ChatGPT, a startup chinesa acaba de lançar mais um modelo de inteligência artificial de código aberto — dessa vez, um gerador de imagens que promete superar o DALL·E 3, da OpenAI.

Chamado Janus-Pro 7B, o modelo tem sete bilhões de parâmetros em sua configuração completa e foi disponibilizado para download no GitHub e no Hugging Face nesta segunda-feira. Além disso, uma versão mais leve, com um bilhão de parâmetros, também foi lançada.

O Janus-Pro 7B é uma evolução da versão anterior do Janus, lançada no ano passado, e, de acordo com a DeepSeek, traz melhorias significativas.

Para quem quiser testar, há demonstrações disponíveis online, mostrando tanto a geração quanto a compreensão de imagens pelo modelo.

Os resultados podem variar, mas as imagens fornecidas pela empresa indicam um desempenho promissor.

No artigo técnico que acompanha o lançamento, a DeepSeek afirma que o Janus-Pro supera o DALL·E 3 e o Stable Diffusion XL em dois benchmarks importantes:

GenEval, onde o modelo apresenta uma vantagem considerável
DPG-Bench, onde o desempenho é semelhante ao dos concorrentes

Curiosamente, Midjourney ficou de fora das comparações.

É importante lembrar que benchmarks são apenas parte da história, e o verdadeiro teste virá quando mais usuários começarem a experimentar o modelo no dia a dia.

Mesmo assim, a DeepSeek parece confiante no impacto do Janus-Pro.

“O Janus-Pro supera modelos anteriores e iguala ou excede o desempenho de modelos especializados em tarefas específicas,” afirmou a empresa no Hugging Face. “Sua simplicidade, flexibilidade e eficiência fazem dele um forte candidato para os modelos multimodais da próxima geração.”

O lançamento do Janus-Pro 7B acontece logo após a DeepSeek surpreender o mercado de tecnologia dos EUA com o R1, um modelo de IA baseado em raciocínio em cadeia (chain-of-thought).

Apesar de ter sido desenvolvido com um orçamento de menos de US$ 6 milhões, o R1 conseguiu igualar o desempenho de modelos de ponta, como o OpenAI o1, consumindo muito menos recursos e energia.

O sucesso do chatbot gerou um grande debate sobre os bilhões de dólares investidos por empresas de tecnologia no desenvolvimento de IA.

Será que todo esse custo realmente se justifica? A DeepSeek parece estar provando que é possível obter resultados de alto nível sem precisar de orçamentos gigantescos.

Veja mais sobre tecnologia!

DeepSeek lança gerador de imagens para competir com DALL·E e Stable Diffusion

Relacionado

Publicações relacionadas