iFlytek lança Spark X2-VL: o modelo multimodal treinado 100% com hardware chinês
A gigante da inteligência artificial iFlytek anunciou, durante a Feira de Robótica e Automação do Delta do Rio Yangtzé, em Wuxi, o seu mais novo modelo de linguagem: o Spark X2-VL. Este modelo multimodal chega com a proposta de elevar o patamar da IA focada em visão e raciocínio complexo, utilizando uma arquitetura exclusiva MoE (Mixture of Experts).
Independência tecnológica e foco em robótica
Um dos pontos mais destacados pela empresa durante a conferência é que o Spark X2-VL é, atualmente, o único modelo de grande escala (LLM) mainstream desenvolvido inteiramente sobre uma base de computação nacional chinesa. O treinamento foi acelerado pela plataforma local Taihu Xingyue, em Wuxi, sinalizando um esforço contínuo da China para reduzir a dependência de chips e infraestruturas estrangeiras — um movimento similar ao que observamos na corrida por uma nova geração de engenheiros artificiais capazes de resolver tarefas complexas com maior autonomia.
A iFlytek já estabeleceu uma subsidiária no distrito de Wuxi, que será responsável pela operação contínua do modelo. A aposta da empresa é que essa tecnologia seja o motor central para a nova onda de robôs humanoides e dispositivos de “inteligência incorporada” (embodied AI).
Desempenho acadêmico: 148 pontos no vestibular
Em testes práticos apresentados pela companhia, o Spark X2-VL demonstrou uma precisão de quase 95% ao interpretar e responder questões que misturam texto e imagens, típicas do ensino médio. O destaque ficou por conta de um teste cego organizado pela mídia local: em uma prova de matemática do “Gaokao” (o vestibular chinês), o modelo alcançou a pontuação impressionante de 148 de 150 pontos, superando outros quatro modelos concorrentes submetidos à mesma avaliação feita por especialistas.
Disponibilidade
É importante ressaltar que o Spark X2-VL da iFlytek é um produto voltado, neste momento, para o mercado chinês e para a infraestrutura de computação local daquele país. Não há, até o momento, qualquer previsão ou anúncio oficial sobre a disponibilidade do modelo ou de suas APIs para desenvolvedores e usuários no Brasil. O setor de IA, que vive momentos de intensas discussões éticas e de desenvolvimento — como visto em incidentes recentes com outras grandes unidades de IA —, continua monitorando de perto como essas soluções regionais irão performar em comparação aos modelos globais dominantes.
A chegada do Spark X2-VL reflete o avanço acelerado das capacidades de raciocínio lógico em IAs multimodais. Resta observar como a integração desse modelo com o hardware robótico se comportará em aplicações práticas fora dos ambientes controlados de laboratório, à medida que a tecnologia for implementada em escala industrial nos próximos anos.
Via: IT之家

