Representando um marco no desenvolvimento do ecossistema inteligente da Xiaomi e da comunidade de pesquisa de IA mais ampla, a Xiaomi lançou oficialmente e abriu totalmente o código-fonte de seu modelo incorporado em grande escala MiMo-Embodied. Com o aumento da inteligência incorporada em casa e a aceitação mais ampla da direção autônoma, a Xiaomi agora pretende superar um desafio de longa data: desenvolver a interoperabilidade cognitiva e de capacidade entre robôs internos e veículos externos. Usando o MiMo-Embodied, a Xiaomi apresenta um modelo de base unificado que promove a direção autônoma, a inteligência incorporada e os recursos gerais de IA em uma única estrutura.
O que faz do MiMo-Embodied uma inovação?
De acordo com a Xiaomi, o MiMo-Embodied é o primeiro do setor em termos de um modelo de base incorporado para preencher as lacunas entre a direção autônoma e a inteligência incorporada. Esse modelo une interpretação de tarefas, percepção e tomada de decisões em cenários domésticos e de mobilidade, estabelecendo uma base científica sólida para futuros sistemas de IA em todos os domínios. Esse movimento marca uma extensão das ambições da Xiaomi para além dos produtos eletrônicos de consumo, para uma robótica mais avançada e automação em larga escala.
Principais princípios técnicos por trás do modelo
O MiMo-Embodied incorpora um projeto arquitetônico profundo para dar suporte à cognição em vários cenários. O modelo se concentra na harmonização de tarefas incorporadas, que incluem raciocínio espacial e planejamento de tarefas, com tarefas de direção como percepção e geração de trajetória. Essa abordagem de processamento unificado permite que a Xiaomi passe de uma inteligência vertical especializada para uma colaboração inteligente escalável e entre domínios.
Três recursos principais da tecnologia
Ampla cobertura de recursos entre domínios
O modelo suporta, em conjunto, três tarefas cruciais no âmbito da inteligência incorporada, raciocínio de affordance, planejamento de tarefas e compreensão espacial, com três tarefas principais de direção autônoma: percepção do ambiente, previsão de estado e planejamento de direção. Juntos, esses recursos formam uma inteligência de cenário completa que abrange ambientes domésticos, robótica interna e tráfego no mundo real.
Inteligência colaborativa bidirecional
A Xiaomi destaca que o MiMo-Embodied permite a transferência de conhecimento entre a robótica interna e a direção autônoma. Durante o teste do sistema, eles mostraram que o aprimoramento das habilidades de tomada de decisão na robótica doméstica pode melhorar o desempenho da direção rodoviária e vice-versa. O aprimoramento bidirecional cria uma nova estrutura para sistemas inteligentes integrados.
Otimização de cadeia completa para implantações no mundo real
Para garantir que a implementação seja confiável, a Xiaomi projetou um pipeline de treinamento em vários estágios, incluindo aprendizado de capacidade, aprimoramento da inferência da cadeia de pensamento (CoT) e ajuste fino do aprendizado por reforço (RL). Essa abordagem reforça a robustez do ambiente real, tornando o modelo adequado para cenários complexos e dinâmicos.
Desempenho em 29 benchmarks
A Xiaomi afirma que o MiMo-Embodied superou os principais modelos de código aberto, de código fechado e proprietários em **29 benchmarks críticos.
Resultados da inteligência incorporada
O MiMo-Embodied obteve desempenho de ponta em 17 benchmarks, demonstrando habilidades excepcionais em planejamento de tarefas, compreensão espacial e previsão de recursos.
Resultados da condução autônoma
Obteve resultados de última geração em 12 benchmarks, desde a percepção até a previsão de estado e o planejamento da direção, estabelecendo um novo padrão para a inteligência de direção em vários estágios.
Compreensão geral de linguagem visual
O MiMo-Embodied também demonstrou generalização avançada em tarefas de linguagem visual, confirmando sua versatilidade em domínios de IA mais amplos.
A Xiaomi abre totalmente o modelo para desenvolvedores e pesquisadores
O modelo e a base de código do MiMo-Embodied foram abertos pela Xiaomi, reforçando o compromisso da empresa com a pesquisa transparente e colaborativa. Os desenvolvedores podem explorar, adaptar e desenvolver o modelo por meio dos repositórios oficiais. Ao abrir o MiMo-Embodied, a Xiaomi quer acelerar a inovação no espaço da robótica inteligente, da mobilidade inteligente e dos ecossistemas conectados.

Emir Bardakçı
