nova geração da deepseek
DeepSeek da China lança modelo de IA de nova geração
terça-feira, 30 de setembro de 2025, 10h53
O DeepSeek, uma startup chinesa de inteligência artificial, lançou uma versão experimental de seu modelo de nova geração, o DeepSeek-V3.2-Exp.
A principal inovação deste modelo reside na introdução de um novo recurso chamado DSA (DeepSeek Sparse Attention), que visa aumentar significativamente a eficiência e reduzir os custos operacionais pela metade em comparação com a versão anterior (V3.1-Terminus).
Essa nova arquitetura permite que a IA lide melhor com documentos e conversas longas, considerando apenas os dados que julga relevantes para a tarefa, em vez de processar todo o conjunto de informações.
Apesar dos benefícios em eficiência e escalabilidade, a abordagem da "sparse attention" levanta preocupações no Vale do Silício sobre a confiabilidade e segurança do modelo. Críticos apontam que, ao descartar informações, o modelo pode perder nuances importantes, o que pode ser problemático em questões de segurança e inclusão.
A DeepSeek garante que seu modelo experimental mantém um desempenho equivalente ao da versão anterior (V3.1-Terminus) e o disponibilizou em código aberto, alinhando-se com a estratégia de engajar a comunidade e manter a competitividade em meio à disputa geopolítica de IA entre China e Estados Unidos.
O lançamento demonstra que a eficiência está se tornando um fator tão crucial quanto a potência bruta no desenvolvimento de modelos de IA.
FONTE: timebrasil