- 相關(guān)報道
- 【財新周刊】財新周刊|特別報道之二:內(nèi)容AI造 價值知多少
- 【財新周刊】財新周刊|ChatGPT會顛覆誰
- 【財新周刊】ChatGPT離人類智能還有多遠?|特稿精選
- GPT革命|專訪光年之外王慧文:做中國版GPT 最重要的是頂級人才
- 意大利暫時限制ChatGPT使用該國用戶數(shù)據(jù)
- GPT革命|專訪商湯楊帆:GPT教育了市場 但做大模型需要經(jīng)驗
- GPT革命|高盛:全球18%工作將由生成式AI自動化完成
- 小i機器人董事長袁輝:ChatGPT技術(shù)有望快速融入各行業(yè)
- 博客|ChatGPT不會對王安憶和余華構(gòu)成威脅,但會剝奪普通人樂趣
- GPT革命|瀾舟科技周明:新一輪AI競爭是持久戰(zhàn)
【財新網(wǎng)】“如果不具備泛用性,盡管模型比以前大一點、效果好一點,應(yīng)用場景仍然是割裂的,這些中小模型和原來有什么區(qū)別?” 主攻預(yù)訓(xùn)練大模型的智譜AI創(chuàng)始人、CEO張鵬近日接受財新專訪時指出,他認(rèn)為這一輪AI熱潮建立在大模型的泛化能力上,業(yè)界普遍的認(rèn)識是500一600億參數(shù)是大模型智能涌現(xiàn)的門檻。
張鵬指出,盡管適用于單場景的模型需要參數(shù)量、成本相對較低,但一旦應(yīng)用于新行業(yè)所有訓(xùn)練數(shù)據(jù)需要重新來過,泛化能力低。他認(rèn)為,大模型參數(shù)降下來很容易,同時還能保持很強的能力,但一個中模型、小模型提升則很困難?!跋裰癈V(計算機視覺)那些模型只做人臉識別,給一個寵物照片就傻了,大模型可以往下降維,但小模型沒法往上升維,”他說。