上海AI獨(dú)角獸發(fā)布全新開源模型,在全球范圍引起關(guān)注。
10月27日,澎湃新聞?dòng)浾攉@悉,MiniMax(稀宇極智)發(fā)布并開源新一代文本大模型MiniMax-M2,在全球權(quán)威測(cè)評(píng)榜單Artificial Analysis (AA)中總分位列全球前五、開源第一,躋身全球第一梯隊(duì),與OpenAI、谷歌等硅谷巨頭同臺(tái)競(jìng)技,這也是中國(guó)開源大模型首次在該榜單中躋身全球前五。
在性能方面,這款大模型的速度超越谷歌旗下Claude Sonnet 4.5近一倍,而價(jià)格僅為其8%。
圖片
“讓每個(gè)人都用得起AI,這是我們對(duì)AI發(fā)展的判斷。我們認(rèn)為AGI一定會(huì)實(shí)現(xiàn),并且一定會(huì)服務(wù)大眾、普惠大眾。”在過去不久的世界人工智能大會(huì)(WAIC)上,MiniMax創(chuàng)始人閆俊杰曾表示,在他看來,中國(guó)AI企業(yè)正以“高智能、低成本”的新組合,向全球AI格局發(fā)起正面沖擊。
性能對(duì)標(biāo)國(guó)際,成本大幅降低
此次全新發(fā)布的M2大模型,進(jìn)一步降低了大模型的使用成本:其綜合成本API(接口)價(jià)格定在每百萬Token輸入0.3美元/2.1元人民幣,以及輸出1.2美元/8.4元,同時(shí)在線上提供TPS(每秒輸出Token數(shù))在100左右的推理服務(wù)(還在快速提升)。
這也意味著,其綜合成本不到OpenAI旗下旗艦大模型GPT-5 (high) 的六分之一,并且不到 Claude 4.5 Sonnet的十分之一(大概為8%)。
在性能方面,MiniMax在代碼(Coding)、代理(Agentic)、深度搜索(Deep Search)等多方面進(jìn)行優(yōu)化,通過高效的激活參數(shù)設(shè)計(jì),實(shí)現(xiàn)智能、速度與成本的最佳平衡,在全球核心權(quán)威榜單上,得分超過谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 4.1 等最新的 SOTA 模型。過去國(guó)產(chǎn)模型多在文本生成上競(jìng)爭(zhēng),現(xiàn)在 MiniMax 能在“復(fù)雜信息檢索與推理”中與 GPT-5、Claude 這類 SOTA 模型并列,說明強(qiáng)化學(xué)習(xí)(RL)與推理優(yōu)化的策略,正在奏效。
這標(biāo)志著,中國(guó)開源模型首次在國(guó)際通用智能評(píng)測(cè)體系中達(dá)到“第一梯隊(duì)”水準(zhǔn),真正進(jìn)入“可與全球頂尖模型競(jìng)爭(zhēng)”的階段。
海外科技巨頭點(diǎn)贊
中國(guó)大模型的日新月異,也深受海外好評(píng)。
硅谷科技巨頭Meta曾在論文中提到,MiniMax的研究是近期強(qiáng)化學(xué)習(xí)(RL)突破的代表之一,他們?cè)诔^40萬小時(shí)的實(shí)驗(yàn)中,采用MiniMax提出的CISPO損失函數(shù)和FP32 Head技術(shù)。
這兩項(xiàng)技術(shù)也是MiniMax在強(qiáng)化學(xué)習(xí)(RL)階段中提出的關(guān)鍵創(chuàng)新點(diǎn),目標(biāo)是讓模型在“大規(guī)模訓(xùn)練”中更穩(wěn)、更準(zhǔn)、更具泛化能力,在同等算力下能“跑得更穩(wěn)、學(xué)得更深、用得更順”。
知名科技評(píng)測(cè)平臺(tái)LMarena第一時(shí)間在社交媒體上向開發(fā)者推薦M2模型測(cè)試; Reddit社區(qū)技術(shù)大V在基準(zhǔn)測(cè)試中運(yùn)行了MiniMax M2,“它獲得了58.3%的分?jǐn)?shù),這算是相當(dāng)不錯(cuò)的表現(xiàn)”。
圖片