tradingkey.logo

MiniMax da China lança três modelos de código aberto para rivalizar com os principais chatbots fabricados nos EUA

Cryptopolitan16 de jan de 2025 às 13:03

MiniMax, uma startup chinesa lançou três modelos de IA de código aberto de baixo custo, que lançou para competir com os principais chatbots, como o ChatGPT da OpenAI e outros modelos fabricados nos EUA.

De acordo com um do SCMP , este lançamento de modelos multimodais ocorre semanas depois de a rival DeepSeek também ter estabelecido um novo padrão com os seus próprios modelos de código aberto, intensificando a concorrência nas empresas de tecnologia do continente.

MiniMax lançou uma série de modelos com diferentes capacidades 

A startup apoiada pelo Alibaba e pela Tencent lançou seus modelos na terça-feira. Isso inclui a cesta de modelo de linguagem grande (MML) MiniMax-01 que inclui um modelo fundamental de uso geral, o MiniMax-Text-01, e o MiniMax-VL-01 multimodal. O MiniMax-VL-01 possui recursos visuais.

De acordo com a empresa, o modelo de linguagem fundamental exibiu capacidades que estão no mesmo nível dos modelos de IA líderes mundiais em avaliações que incluem a resolução de problemas matemáticos. Em testes de benchmark que a empresa publicou na sua conta WeChat, o MiniMax revelou outras capacidades do modelo, incluindo conhecimento de domínio, capacidade de seguir instruções e evitar alucinações ou erros factuais.

Os benchmarks também revelaram que o desempenho dos seus novos modelos corresponde aos modelos de código fechado, que normalmente são considerados como tendo as capacidades mais avançadas da indústria. Modelos que suportam produtos como Gemini do Google, Claude da Anthropic, apoiado pela Amazon, e ChatGPT da OpenAI são de código fechado. Eles normalmente lideram as classificações do Chatbot Arena, um projeto de benchmarking de IA realizado por pesquisadores da UC Berkeley.

O MiniMax-Text-01, em particular, tem 465 bilhões de parâmetros de tamanho e tem desempenho melhor do que o Gemini 2.0 Flash lançado recentemente pelo Google em benchmarks como MMLU e SimpleQA, que mede a capacidade de um modelo de responder a problemas matemáticos.

De acordo com a empresa, o MiniMax-VL-01 rivaliza com o Claude 3.5 Sonnet da Anthropic em avaliações que requerem compreensão multimodal.

O desenvolvimento ocorre semanas depois que o concorrente DeepSeek, com sede em Hangzhou, conquistou a indústria mundial de tecnologia com seu modelo V3 de código aberto em dezembro. A crescente concorrência no lotado e em rápida evolução do mercado de IA do país empurrou gigantes da indústria e startups para uma corrida feroz pela supremacia da IA, superando-se uns aos outros a cada poucos meses com novos lançamentos.

MiniMax enfrenta vários desafios 

A MiniMax lançou seus modelos em um ambiente caracterizado por intensa competição. O lançamento de seus novos modelos também ocorre depois que a SenseTime, listada em Hong Kong, lançou um novo “modelo grande unificado” no mesmo dia.

De acordo com o SCMP, os testes de benchmark da SuperCLUE, especializada na avaliação de modelos chineses, classificaram o novo produto SenseTime como um dos principais concorrentes entre os modelos multimodais.

Apesar dos avanços na tecnologia de IA, as startups chinesas enfrentam desafios de monetização. Grandes empresas de tecnologia como a ByteDance , cujo Doubao foi o chatbot chinês mais popular em dezembro, têm recursos suficientes para levar seus produtos de IA a milhões de usuários gratuitamente.

Por outro lado, as startups precisam de equilibrar uma expansão ambiciosa com esforços de monetização para sustentar as operações.

Tempos difíceis ainda podem estar por vir para a MiniMax e seus produtos. Seu aplicativo companheiro Talkie, um dos principais contribuintes para sua receita, de acordo com um relatório do Financial Times – foi retirado da App Store da Apple nos EUA desde o final do ano passado por “razões técnicas” não especificadas. O aplicativo Android permanece acessível no Google Play.

A MiniMax foi fundada em 2021 por ex-funcionários de uma das maiores empresas de IA da China, a SenseTime. De acordo com a Tech Crunch, os produtos da empresa foram envolvidos em algumas pequenas controvérsias. Por exemplo, Talkie apresenta avatares de figuras públicas, incluindo Donald Trump, Elon Musk e LeBron James, nenhum dos quais parece ter consentido em aparecer no aplicativo.

A revista Broadcast informou em dezembro que os geradores de vídeo do MiniMax poderiam produzir logotipos de canais de televisão britânicos. Isso, segundo a revista, sugeria que os modelos da empresa foram treinados no conteúdo desses canais.

Além disso, a startup com sede em Xangai também está sendo processada pelo iQiyi, um serviço chinês de streaming de vídeo, alegando que o MiniMax treinou nas gravações protegidas por direitos autorais do iQiyi sem autorização.

Consiga um emprego bem remunerado na Web3 em 90 dias: o roteiro definitivo

Isenção de responsabilidade: o conteúdo acima visa ser um apoio à funcionalidade da nossa plataforma, não fornecendo qualquer aconselhamento comercial e não deve ser a base da tomada de quaisquer decisões comerciais.

Artigos relacionados