新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)6月27日,騰訊混元宣布開(kāi)源首個(gè)混合推理MoE模型 Hunyuan-A13B,總參數(shù)80B,激活參數(shù)僅13B,效果比肩同等架構(gòu)領(lǐng)先開(kāi)源模型,但是推理速度更快,性?xún)r(jià)比更高。這意味著,開(kāi)發(fā)者可以用更低門(mén)檻的方式獲得更好的模型能力。


MeE是DeepSeek大模型采用的架構(gòu)類(lèi)型,并在DeepSeek爆火后得到了業(yè)界的更多認(rèn)可。而本次騰訊混元所發(fā)布的,是業(yè)界首個(gè)13B級(jí)別的MoE開(kāi)源混合推理模型,基于先進(jìn)的模型架構(gòu),Hunyuan-A13B表現(xiàn)出強(qiáng)大的通用能力,在多個(gè)業(yè)內(nèi)權(quán)威數(shù)據(jù)測(cè)試集上獲得好成績(jī),并且在Agent工具調(diào)用和長(zhǎng)文能力上有突出表現(xiàn)。


即日起,模型已經(jīng)在 Github 和 Huggingface 等開(kāi)源社區(qū)上線,同時(shí)模型API也在騰訊云官網(wǎng)正式上線,支持快速接入部署。


校對(duì) 穆祥桐