听风微电影在线观看完整版|嫩草影院在线播放|不良教育电影未删减完整版|老司机亚洲精品,性生活免费网站,成人学院未删减版,一边吃奶一边添p好爽视频观看

數(shù)字報
小程序
公眾號
信容指標(biāo)揭開參數(shù)量之外的模型真本領(lǐng)
2025-12-11 20:28:01
來源:科技日報  作者: 馬愛平

隨著大模型技術(shù)的爆發(fā)和快速發(fā)展,各種參數(shù)、系列的模型層出不窮。它們之間有差異嗎?不同的大模型是否有各自的“天賦”?

近日,中國電信人工智能研究院(TeleAI)科研團(tuán)隊在5個開源異構(gòu)數(shù)據(jù)集上對近50個主流開源大模型測試了文本無損編碼壓縮增益,并統(tǒng)計實(shí)驗(yàn)中模型推理的計算開銷。結(jié)果顯示,不同系列模型要實(shí)現(xiàn)同等文本無損編碼壓縮增益,所需計算開銷有明顯差異。而同一系列模型,盡管尺寸各異,但文本無損編碼壓縮增益與計算開銷的比值(即大模型的信容)往往保持高度一致。

信容是信息與模型參數(shù)量的比值,用于表示模型內(nèi)存儲的知識密度。如果把模型比作海綿,信息比作水,那么信容就如同海綿的吸水效率,水吸得越多、越快,說明模型越“聰明”。信容為比較不同架構(gòu)和參數(shù)大模型的推理效率提供了量化依據(jù),可用于高效評估不同預(yù)訓(xùn)練數(shù)據(jù)、模型架構(gòu)和超參數(shù)的優(yōu)劣?;谛湃菰u估指標(biāo),通過對同源小尺寸模型的測試,就能預(yù)測大尺寸模型的性能表現(xiàn),從而加速模型的開發(fā)和迭代。

科研團(tuán)隊以智傳網(wǎng)理論框架為基礎(chǔ),通過“信容評估指標(biāo)”對大模型的效率進(jìn)行標(biāo)準(zhǔn)化度量。該指標(biāo)基于“壓縮即智能”的深刻洞察,結(jié)合壓縮性能與推理復(fù)雜度來定量評估模型效率,不僅能揭示模型在單位計算代價下產(chǎn)出的智能密度,還能在復(fù)雜的通算融合網(wǎng)絡(luò)中為“算”與“傳”的資源最優(yōu)配置提供理論依據(jù)。

隨著大模型推理負(fù)載消耗越來越多的計算資源和能源,如何準(zhǔn)確評估大模型的推理效率吸引了學(xué)界越來越多的關(guān)注。專家表示,科研團(tuán)隊通過信容指標(biāo)讓跨架構(gòu)和尺寸的大模型效率評估成為可能,并能有效指導(dǎo)模型的預(yù)訓(xùn)練和高效部署。這項(xiàng)研究不僅為大模型的綠色低碳發(fā)展提供了定量標(biāo)尺,也為未來通算融合網(wǎng)絡(luò)的設(shè)計指明了方向。隨著邊緣智能的快速發(fā)展,智傳網(wǎng)的“端-邊-云”分層網(wǎng)絡(luò)將在不遠(yuǎn)的未來取代傳統(tǒng)的以云上服務(wù)器為中心的計算范式,實(shí)現(xiàn)更精準(zhǔn)的模型選型與算力分配。

目前,該研究的相關(guān)代碼與數(shù)據(jù)已在相關(guān)平臺開源。

(受訪者供圖)

編輯:韓夢晨
相關(guān)閱讀:
高新視頻 更多
高新熱榜 全部本月
編輯推薦 更多

友情鏈接: 政府 高新園區(qū)合作媒體

Copyright 1999-2025 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5

電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》社有限責(zé)任公司