2.4萬億參數(shù)原生全模態(tài)大模型,文心5.0正式版上線
1月22日,百度發(fā)布并上線原生全模態(tài)大模型文心5.0正式版。該模型參數(shù)達(dá)2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備全模態(tài)理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。目前,個(gè)人用戶可在文心APP、文心一言官網(wǎng)體驗(yàn),企業(yè)與開發(fā)者可通過百度千帆平臺(tái)進(jìn)行調(diào)用。
在40余項(xiàng)權(quán)威基準(zhǔn)的綜合評(píng)測(cè)中,文心 5.0 正式版的語言與多模態(tài)理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,穩(wěn)居國際第一梯隊(duì)。圖像與視頻生成能力與垂直領(lǐng)域?qū)>P拖喈?dāng),整體處于全球領(lǐng)先水平。

百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜介紹,與業(yè)界多數(shù)采用“后期融合”的多模態(tài)方案不同,文心5.0的技術(shù)路線采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,將文本、圖像、視頻、音頻等多源數(shù)據(jù)在同一模型框架中進(jìn)行聯(lián)合訓(xùn)練,使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,實(shí)現(xiàn)原生的全模態(tài)統(tǒng)一理解與生成。
此外,文心5.0采用超大規(guī)模混合專家結(jié)構(gòu),具備超稀疏激活參數(shù),激活參數(shù)比低于 3%,在保持模型強(qiáng)大能力的同時(shí),有效提升推理效率。同時(shí),基于大規(guī)模工具環(huán)境,合成長程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動(dòng)鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
得益于原生全模態(tài)建模,文心5.0在多模理解、代碼、創(chuàng)意寫作等能力上實(shí)現(xiàn)顯著突破。大會(huì)現(xiàn)場(chǎng),僅輸入一段博主復(fù)刻“活了么”App教程視頻,文心5.0便能自動(dòng)拆解步驟,理解核心交互邏輯,并直接生成可運(yùn)行的前端代碼。在創(chuàng)意寫作任務(wù)中,還能模擬《紅樓夢(mèng)》中王熙鳳的語言風(fēng)格,生成融合古典語境與現(xiàn)代商業(yè)邏輯的“大觀園資產(chǎn)重組方案”,展現(xiàn)出較強(qiáng)的情境理解與創(chuàng)作能力。
吳甜現(xiàn)場(chǎng)介紹了“文心導(dǎo)師”計(jì)劃的最新進(jìn)展。文心導(dǎo)師隊(duì)伍持續(xù)壯大,目前已吸納835位來自科技、金融、文化、教育、醫(yī)療、能源等十余個(gè)重點(diǎn)行業(yè)以及數(shù)理化生文史哲等學(xué)科的專家,在知識(shí)傳授、鑒賞評(píng)價(jià)、專業(yè)校準(zhǔn)方面對(duì)大模型進(jìn)行指導(dǎo),幫助模型在邏輯嚴(yán)謹(jǐn)性、專業(yè)深度、創(chuàng)意質(zhì)量和價(jià)值觀對(duì)齊等方面不斷精進(jìn)。
有分析認(rèn)為,文心5.0正式版的上線,意味著原生全模態(tài)技術(shù)路線逐漸走向成熟與實(shí)用,體現(xiàn)了中國模型廠商在多模態(tài)大模型底層自主創(chuàng)新能力,有助于進(jìn)一提升中國AI在全球AI產(chǎn)業(yè)競(jìng)爭中的技術(shù)話語權(quán)。
據(jù)了解,2025年11月,百度發(fā)布文心大模型5.0并上線Preview版本。此后,文心5.0系列模型多次登上LMArena全球大模型競(jìng)技場(chǎng),多次位居文本榜和視覺理解榜國內(nèi)第一,躋身國際第一梯隊(duì)。1月15日,文心5.0以1460分位列LMArena文本榜國內(nèi)第一、全球第八,超過GPT-5.1-High、Gemini-2.5-Pro等多款國內(nèi)外主流模型。