【財(cái)新網(wǎng)】開源大模型的推手Meta發(fā)新一代模型。北京時(shí)間4月19日凌晨,美國社交巨頭Meta(NASDAQ: META)宣布推出Llama 3開源模型系列,將陸續(xù)登陸亞馬遜AWS、Databricks、谷歌云、Hugging Face等大模型平臺(tái)。Meta稱,還會(huì)在接下來數(shù)月的時(shí)間提供更強(qiáng)的長文本能力、多種尺寸、多語言的模型,目標(biāo)是打造最好的基座模型。
具體來看,此次發(fā)布的包括80億、700億參數(shù)的兩個(gè)預(yù)訓(xùn)練語言模型,根據(jù)Meta的數(shù)據(jù),在考察常識(shí)能力、學(xué)科知識(shí)、代碼能力、數(shù)學(xué)能力的數(shù)據(jù)集榜單中,80億參數(shù)的版本全面領(lǐng)先谷歌的輕量開源模型Gemma 7B–it,和歐洲大模型公司Mistral的開源模型Mistral 7B Instruct;700億參數(shù)版本的整體得分小幅領(lǐng)先谷歌閉源模型Gemini Pro 1.5和Anthropic的閉源模型Claude 3 Sonnect。