中國網路巨頭「百度」3月發布被稱為「中國版ChatGPT」的人工智慧(AI)聊天機械人、生成式自然語言模型「文心一言」(ERNIE Bot),不過卻遭看衰,導致公司股價一度暴跌;近日內部人士宣布將迎來強化的文心大模型3.5(ERNIE 3.5),宣稱綜合能力實測得分已超越 ChatGPT,在中文能力部分也贏過GPT-4,引起討論。
《路透社》、《中國科學報》報導,百度創始人、董事長兼CEO李彥宏5月底透露「文心一言」 將迎來3.5版本,並於本月13日和ChatGPT、GPT-4、ChatGLM、LLaMa等6個語言模型分別進行AGIEval、C-Eval、MMLU3個權威評測,進行綜合能力評估。
百度發布的結果顯示,「文心大模型3.5」在AGIEval綜合評測中,以57.11分超越ChatGPT的44.73,略遜於GPT-4的61.48;AGIEval中文評測中,「文心大模型3.5」以64.37分超越了ChatGPT的40.27和GPT-4的56.96,位居第一;C-Eval中文評測中,「文心大模型3.5」也測出71.93的最高得分。
百度宣稱,從上述評測得分來看,「文心大模型3.5」中文能力突出,甚至超過GPT-4的表現;綜合能力稍遜於GPT-4,但已在評測中超越ChatGPT,遠遠領先於其他大模型。
◤日本旅遊必買清單◢