A DeepSeek está chegando com força total. Após causar um grande impacto na indústria de IA com um concorrente do ChatGPT, a startup chinesa acaba de lançar mais um modelo de inteligência artificial de código aberto — dessa vez, um gerador de imagens que promete superar o DALL·E 3, da OpenAI.
Chamado Janus-Pro 7B, o modelo tem sete bilhões de parâmetros em sua configuração completa e foi disponibilizado para download no GitHub e no Hugging Face nesta segunda-feira. Além disso, uma versão mais leve, com um bilhão de parâmetros, também foi lançada.
O Janus-Pro 7B é uma evolução da versão anterior do Janus, lançada no ano passado, e, de acordo com a DeepSeek, traz melhorias significativas.
Para quem quiser testar, há demonstrações disponíveis online, mostrando tanto a geração quanto a compreensão de imagens pelo modelo.
Os resultados podem variar, mas as imagens fornecidas pela empresa indicam um desempenho promissor.
No artigo técnico que acompanha o lançamento, a DeepSeek afirma que o Janus-Pro supera o DALL·E 3 e o Stable Diffusion XL em dois benchmarks importantes:
- GenEval, onde o modelo apresenta uma vantagem considerável
- DPG-Bench, onde o desempenho é semelhante ao dos concorrentes
Curiosamente, Midjourney ficou de fora das comparações.
É importante lembrar que benchmarks são apenas parte da história, e o verdadeiro teste virá quando mais usuários começarem a experimentar o modelo no dia a dia.
Mesmo assim, a DeepSeek parece confiante no impacto do Janus-Pro.
“O Janus-Pro supera modelos anteriores e iguala ou excede o desempenho de modelos especializados em tarefas específicas,” afirmou a empresa no Hugging Face. “Sua simplicidade, flexibilidade e eficiência fazem dele um forte candidato para os modelos multimodais da próxima geração.”
O lançamento do Janus-Pro 7B acontece logo após a DeepSeek surpreender o mercado de tecnologia dos EUA com o R1, um modelo de IA baseado em raciocínio em cadeia (chain-of-thought).
Apesar de ter sido desenvolvido com um orçamento de menos de US$ 6 milhões, o R1 conseguiu igualar o desempenho de modelos de ponta, como o OpenAI o1, consumindo muito menos recursos e energia.
O sucesso do chatbot gerou um grande debate sobre os bilhões de dólares investidos por empresas de tecnologia no desenvolvimento de IA.
Será que todo esse custo realmente se justifica? A DeepSeek parece estar provando que é possível obter resultados de alto nível sem precisar de orçamentos gigantescos.
Veja mais sobre tecnologia!