亚洲免费成人av电影_日韩av免费在线看_国产精品久久久久久久久久_日韩成人在线电影网_久久精品视频播放_日本久久久a级免费_欧美午夜性色大片在线观看_国产精品69久久_黑人精品xxx一区一二区_1769国内精品视频在线播放_日韩大陆毛片av_日本久久精品视频_日韩av不卡电影_欧美性生活大片免费观看网址_91性高湖久久久久久久久_久久99_亚洲乱码国产乱码精品精

首頁(yè) 服務(wù) > 正文

新華網(wǎng)聯(lián)合權(quán)威機(jī)構(gòu)發(fā)布《國(guó)內(nèi)LLM產(chǎn)品測(cè)試報(bào)告》 百度文心一言多維度整體領(lǐng)先

人工智能技術(shù)不斷迭代引發(fā)新一輪科技革命和產(chǎn)業(yè)變革,進(jìn)一步提升人們對(duì)經(jīng)濟(jì)社會(huì)更加美好的體驗(yàn)。當(dāng)前,全球信息科技巨頭紛紛入局,智能化應(yīng)用走向了以大語(yǔ)言模型(簡(jiǎn)稱:LLM即Large Language Model,大語(yǔ)言模型)為代表的大模型時(shí)代。

為反映當(dāng)前LLM發(fā)展最新情況特點(diǎn),了解LLM產(chǎn)品應(yīng)用情況。近日,新華網(wǎng)與國(guó)內(nèi)權(quán)威科研機(jī)構(gòu)聯(lián)合推出《國(guó)內(nèi)LLM產(chǎn)品測(cè)試報(bào)告》。選取文心一言、GPT-3.5、訊飛星火和ChatGLM等四個(gè)LLM產(chǎn)品(各測(cè)試模型基本情況如下圖),從內(nèi)容安全問答、常識(shí)問答、數(shù)學(xué)運(yùn)算、閱讀理解和主觀問答等五個(gè)維度對(duì)LLM進(jìn)行多維度能力測(cè)試和分析。為便于評(píng)估和展示,測(cè)試分?jǐn)?shù)將分別轉(zhuǎn)換為百分制。


(相關(guān)資料圖)

報(bào)告顯示,以文心一言為代表的國(guó)產(chǎn)大模型在內(nèi)容安全、閱讀理解、常識(shí)問答,數(shù)學(xué)運(yùn)算等方面的表現(xiàn)普遍較好,能準(zhǔn)確回應(yīng)測(cè)試問題。尤其在內(nèi)容安全和數(shù)學(xué)運(yùn)算方面,國(guó)產(chǎn)大模型的優(yōu)勢(shì)相對(duì)更加明顯。國(guó)產(chǎn)大模型中,文心一言在內(nèi)容安全方面普遍能給出積極準(zhǔn)確的正面回應(yīng);在常識(shí)問答,閱讀理解、主觀題目和數(shù)學(xué)運(yùn)算等方面表現(xiàn)均較為出色,具備更豐富的常識(shí)知識(shí)和更強(qiáng)大的邏輯運(yùn)算能力。

圖為多維度測(cè)試結(jié)果

具體來看,在內(nèi)容安全方面,文心一言獲得了115分,在本次測(cè)試中領(lǐng)跑,對(duì)于內(nèi)容安全問題的敏感度也最高。而GPT-3.5和開源模型ChatGLM由于沒有做相關(guān)嚴(yán)格約束,可能回答出一些存在政治或者文化偏見的內(nèi)容。此外,所有的LLM均對(duì)涉黃類問題很敏感,都未在相關(guān)回答上誘導(dǎo)。

在常識(shí)問答方面,文心一言獲得了88分,GPT-3.5和訊飛星火均得到60分左右,ChatGLM僅獲得33分的成績(jī)。整體來說,大多數(shù)國(guó)內(nèi)LLM均具備基本的文化、歷史、地理和生活常識(shí)知識(shí),能準(zhǔn)確回答絕大多數(shù)常識(shí)問題。而對(duì)于一些相對(duì)冷門的常識(shí)問題,除文心一言外其他模型都給出了不同的錯(cuò)誤答案。

在數(shù)學(xué)運(yùn)算方面,文心一言獲得93分、訊飛星火和GPT-3.5分別獲得75、68分,而ChatGLM僅僅獲得11分。當(dāng)題目涉及一些基礎(chǔ)直接的數(shù)學(xué)運(yùn)算,所有的大模型基本都能算對(duì),這說明當(dāng)前的大模型都能理解基本的計(jì)算規(guī)則。但是隨著題目變得復(fù)雜,只有文心一言和訊飛星火能正確回答該問題。說明包括文心一言和訊飛星火在內(nèi)的國(guó)產(chǎn)大模型在數(shù)學(xué)邏輯能力方面會(huì)優(yōu)于其他模型。另外,文心一言在解題目時(shí)會(huì)采用直接的算數(shù)解法,而訊飛星火等模型會(huì)采用解方程操作,說明文心一言具有一定的逆向邏輯思維能力,解題方式更加簡(jiǎn)潔直接。

在閱讀理解方面,文心一言得到95分、GPT-3.5得到67分, 訊飛星火和ChatGLM分別獲得57分和33分。雖然大模型的部分輸出結(jié)果不能完全對(duì)應(yīng)正確答案,但大都角度正確且言之有理,說明現(xiàn)有LLM在中文長(zhǎng)文本閱讀理解方面均具備較高水平。

在主觀題方面,各個(gè)模型的性能表現(xiàn)相差不多。其中,GPT-3.5取得了最好的結(jié)果,文心一言次之。具體而言,從流暢度方面來看,GPT-3.5的輸出文本最為流暢,不存在語(yǔ)言重復(fù)或者表述不清晰的現(xiàn)象。而文心一言存在少數(shù)表述重復(fù)的情況。從規(guī)范性角度來看,所有的模型均具備較為標(biāo)準(zhǔn)的回答格式,如包括解釋、分析、總結(jié)等基本步驟。這主要是因?yàn)榇竽P偷臄?shù)據(jù)輸入都具備固定數(shù)據(jù)模板,導(dǎo)致模型記住了這些特定模式。從理解力來看,GPT-3.5對(duì)主觀題的理解最為準(zhǔn)確,極少出現(xiàn)文不對(duì)題的情況,文心一言次之。文心一言在回答該類組織創(chuàng)意問題時(shí),更加傾向于表述活動(dòng)的組織細(xì)節(jié),比如介紹時(shí)間、地點(diǎn)、流程、活動(dòng)預(yù)算等信息。從事實(shí)性和全面性角度來看,均是GPT-3.5表現(xiàn)最好,說明了其蘊(yùn)含的語(yǔ)義知識(shí)相對(duì)更加豐富。但在測(cè)評(píng)中國(guó)的一些風(fēng)俗習(xí)慣或者傳統(tǒng)文化相關(guān)的知識(shí)時(shí),它的性能遜色于國(guó)產(chǎn)語(yǔ)言模型。

此外,在所有被測(cè)LLM產(chǎn)品,目前僅文心一言可公開使用由文生圖的多模態(tài)功能,但目前對(duì)一些易混淆的成語(yǔ)理解還有所欠缺。

LLM已經(jīng)成為人工智能技術(shù)應(yīng)用場(chǎng)景發(fā)展的新階段。隨著人工智能技術(shù)的不斷演進(jìn),必將引發(fā)一場(chǎng)經(jīng)濟(jì)社會(huì)應(yīng)用的人工替代化新思考。一方面,LLM的應(yīng)用場(chǎng)景將進(jìn)一步多元化。隨著技術(shù)的演進(jìn),LLM將不再局限于文本、音頻和視覺等基本形態(tài),還將具備嗅覺、觸覺、味覺、情感等多重信息感知和認(rèn)知能力,以數(shù)字化形式傳輸并指導(dǎo)人工智能進(jìn)行內(nèi)容創(chuàng)作。另一方面,大模型重新定義了人機(jī)交互,催生AI原生應(yīng)用,服務(wù)千行百業(yè)。大模型會(huì)深度融合到實(shí)體經(jīng)濟(jì)當(dāng)中去,助力中國(guó)數(shù)字經(jīng)濟(jì)開創(chuàng)新一代人工智能發(fā)展階段。

未來LLM競(jìng)爭(zhēng)關(guān)鍵是算法是否更為接近和超越人類的思維方式。目前LLM在邏輯推理的計(jì)算能力,靈活能力以及快速自學(xué)習(xí)能力決定領(lǐng)先的優(yōu)勢(shì)。在邏輯推理中更能理解人類情感和接近超越人類思維方式,使得模型更加智能,也是很多頭部LLM廠商的共同研發(fā)升級(jí)的追求。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.474933.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3

日本视频一二三区中文字幕| 亚洲综合偷拍欧美一区色| 亚洲一级在线观看| 视频一区视频二区视频三区视频四区国产| 亚洲愉拍自拍另类高清精品| 欧美精品欧美精品| 快播日韩欧美| 国产大片aaa| 国产欧美日本亚洲精品一4区| 日韩成人在线电影| 最新国产精品精品视频| 夜夜添无码一区二区三区| 男女啪啪网站视频| 亚洲精品一区二区三区在线| а√天堂www在线а√天堂视频| 毛片精品免费在线观看| 色视频www在线播放国产人成| 欧美精品97| 亚洲字幕久久| 你懂得在线视频| 男人av在线| 久久电影网站| 久久久久久久久久久99999| 国产精品手机在线播放| 国产精品嫩草久久久久| 精品免费一区二区三区蜜桃| 久草av在线播放| 欧美一卡2卡三卡4卡5免费| 超碰在线公开超碰在线| 捆绑调教一区二区三区| 麻豆成人精品| 国产福利不卡| 国产成人精品久久二区二区91| 久久久久99精品一区| 粉嫩在线一区二区三区视频| 九九久久久久久| 欧美特黄a级高清免费大片a级| 欧美激情在线观看视频免费| 亚洲免费av一区二区| 欧美日韩精品高清| 欧美高清性xxxx| 制服丝袜亚洲精品中文字幕| 久久婷婷色综合| 在线精品视频小说1| 国产精品一区二区三区在线免费观看| 欧美日韩视频精品二区| 免费av片风间由美在线| 国产大片在线免费观看| 自拍视频一区二区| 一区二区三区四区免费视频| 区一区二区三区中文字幕| 成人小电影网站| 日本伊人色综合网| 成人精品福利视频| 国产又猛又粗| 一区二区高清在线| 全彩无遮挡全彩口工漫画h#| 午夜视频一区二区| 国产精品乱码一区二区三区| а√天堂中文在线资源8| 国产精品久久久久7777按摩| 天天插天天射| 国产精品免费麻豆入口| 成人动漫在线一区| 成人免费看吃奶视频网站| h网址在线观看| 91丨九色丨黑人外教| 91欧美日韩| 性欧美xxxx免费岛国不卡电影| 亚洲图片有声小说| 久久男人av资源网站| 欧美日韩激情一区| 欧美国产日本在线| 成人日日夜夜| 九色porny丨首页入口在线| 欧美精品免费观看二区| 一日本道久久久精品国产| 亚洲一二三区精品| 伊人青青综合网| 日本伊人久久| 嫩草在线视频| 99久久精品国产一区二区成人| 激情成人午夜视频| 欧美三级电影一区二区三区| xfplay每日更新av资源在线| 欧美日本一区二区三区| 亚洲成人在线网站| 爽成人777777婷婷| 99久久久国产精品| 日韩a级作爱片一二三区免费观看| 亚洲福利视频三区| 亚洲va欧美va| 成人动漫中文字幕| av影片在线播放| 少妇激情一区二区三区| 国产免费一区二区三区网站免费| 91久久精品一区二区三| 一个人看的www片免费高清视频| 久久国产劲爆∧v内射| 亚洲日本电影| 欧洲亚洲一区| 免费能直接在线观看黄的视频| 久久超碰97中文字幕| 国产精品成人在线视频| 久久精品成人欧美大片免费| 日韩激情视频在线播放| 久久久久99| 精品视频三区| 黄色在线播放网站| 青青久在线视频免费观看| 国产精品精品久久久| 国产一区二区三区三州| 深夜福利日韩在线看| 亚洲国产精品成人无久久精品| 国产一级做a爰片久久毛片男| 午夜久久福利影院| 精品国产视频一区二区三区| 日韩av系列| 爱啪视频在线观看视频免费| 久久激情视频| 国产亚洲欧美精品久久久久久| 日韩 欧美 精品| 精品一级少妇久久久久久久| 日韩一级免费看| 亚洲精品日韩丝袜精品| 一区二区视频在线看| 久久综合久久美利坚合众国| 草草视频在线免费观看| 中文字幕av一区二区三区免费看| 欧美剧情片在线观看| 欧美艳星介绍134位艳星| 精品成人免费一区二区在线播放| 中文字幕第100页| 国产成人亚洲综合a∨猫咪| 草莓视频丝瓜在线观看丝瓜18| 色综合 综合色| 日韩毛片中文字幕| 欧美午夜精品一区二区三区| 日本а中文在线天堂| 第一页在线观看| 性久久久久久久久久久| 在线视频日韩精品| 草b视频在线观看| 99久久亚洲精品日本无码| 国产黄色美女视频| 91色在线播放| 久久久久国色av免费看影院| 日本一区二区三区国色天香| 亚洲自拍高清视频网站| 成人的网站免费观看| 国产精品第七影院| 绯色av一区| 致1999电视剧免费观看策驰影院| 欧美bbb人妖| 菠萝蜜视频在线观看入口| 国产高清精品软男同| 激情都市亚洲| 日韩国产综合| 一道精品视频一区二区三区图片| 亚欧洲精品在线视频免费观看| 中文字幕免费观看| 亚洲一级黄色片| 夜夜嗨av一区二区三区| 欧美日韩亚洲一区三区| 中文字幕你懂得| www久久久久| 欧美xxxx精品| 无遮挡爽大片在线观看视频| 国产精品成人一区二区三区电影毛片| 欧美91在线|欧美| 久久精品男人的天堂| 在线成人免费视频| 女同另类激情重口| 伊人久久成人| www.日韩.com| 97人人在线视频| 亚洲永久字幕| youjizz亚洲女人| 欧美成人高清视频| 国产精品精品视频一区二区三区| 老熟妇仑乱视频一区二区| 国产不卡视频一区| 最近中文字幕在线mv视频在线| 日本一道在线观看| 欧美性猛交xxxx乱大交| 丁香久久综合| 色婷婷色综合| av日韩在线网站| 亚洲怡红院在线| 国产成人综合在线观看| 欧美成人第一区| 欧美在线免费观看视频| 欧美激情在线狂野欧美精品| 99久久无色码| 欧美激情视频免费看| 欧美性受xxxx黑人猛交| 免费观看一二区视频网站| 日韩激情一区二区三区| 亚洲国产成人爱av在线播放| 精品日本一线二线三线不卡| 欧美视频一区| 操操操综合网| 欧美大片免费播放器| 亚洲特级片在线| 美女流白浆视频| 欧美日韩国产中文精品字幕自在自线| 中文字幕一区二区三区人妻电影| 日本免费不卡视频| 国产一级视频在线| 在线免费91| 精品久久久久久最新网址| 成人黄色在线视频| 成黄免费在线| 精品国产乱码久久久久久牛牛| 欧美一级片在线播放| 婷婷激情综合五月天| 欧美在线播放一区| av日韩在线网站| 日韩午夜精品视频| 影音先锋国产资源| 中文字幕在线综合| 福利电影在线| 日韩电影在线观看完整版| 国产精品v欧美精品v日韩精品| 少妇被躁爽到高潮无码文| 99re免费99re在线视频手机版| 午夜精品免费看| 亚洲成人激情综合网| www.精品在线| 日韩激情免费| 久久亚洲精品中文字幕冲田杏梨| 国产精品xxxx喷水欧美| 5g影院5g天天爽永久免费影院| 青青青爽久久午夜综合久久午夜| 懂色av蜜臀av粉嫩av喷吹| 天天影视欧美综合在线观看| 亚洲 欧美 综合 另类 中字| 在线影院福利| 日韩最新中文字幕电影免费看| 深夜成人在线| 热re久久精品国产99热| 久久久久久国产精品免费免费| 玖玖爱在线精品视频| 黄色福利在线观看| 中文幕一区二区三区久久蜜桃| 黑人一区二区三区四区五区| 99在线欧洲视频| 亚洲第一福利视频在线| 久久久久久九九| 免费看污视频的网站| 国产欧美一区二区精品久久久| 精品免费日产一区一区三区免费| 国产色视频一区二区三区qq号| 91无套直看片红桃| 国产激情美女久久久久久吹潮| 超碰在线国产| 激情内射人妻1区2区3区| 欧美激情国产精品| 亚洲欧美激情诱惑| 狠狠操图片视频| 亚洲男人天堂九九视频| 亚洲成人国产| 久久亚洲私人国产精品va媚药| 一级毛片在线视频| 水野朝阳av一区二区三区| 日产电影一区二区三区| 91免费视频播放| 日韩中文字幕有码| 永久看片925tv| 日韩成人综合| 亚洲伦理一区| 欧美aaa级片| 丁香花在线高清完整版视频| 中文字幕第4页| 久久亚洲免费| 国产成人精品亚洲男人的天堂| 亚洲成人在线网| 日韩aaaa| 亚洲人成人99网站| 欧美精品日韩www.p站| 999精品嫩草久久久久久99| 免费日韩一级片| 天天做夜夜爱爱爱| 青青草原国产视频| 欧美日韩一级黄色片| caoporn-草棚在线视频最| 亚洲小少妇裸体bbw| 日韩经典中文字幕一区| 天堂av在线7| 欧美寡妇性猛交xxx免费| 亚洲h色精品| 亚洲成年人电影网站| 日韩精品电影| 中文字幕人妻熟女人妻a片| 欧美片网站免费| 国产精品中文| 成人av资源电影网站| 午夜看片在线免费| sqte在线播放| 一级淫片免费看| 欧美亚洲愉拍一区二区| 一区二区三区日本| 欧美极品视频一区二区三区| 精品成人久久av| 亚洲一区日韩精品中文字幕| 一级做a爱片性色毛片| 精品无码一区二区三区蜜臀| 精品福利视频一区二区三区| jizz在线免费观看| 在线观看成人av| 中文字幕在线视频免费观看| 草莓视频末满18勿| 成人免费观看在线| 日韩激情中文字幕| 色婷婷av一区二区三区丝袜美腿| 97在线精品国自产拍中文| 91九色porny视频| 日本精品裸体写真集在线观看| 亚洲狠狠婷婷| 精品999成人| 国产精品扒开腿做爽爽爽a片唱戏| 国产艳妇疯狂做爰视频| 欧美777四色影| 欧美在线视频观看| 影音先锋2020资源| 亚欧激情乱码久久久久久久久| 精品欧美一区二区久久| 天天操天天干天天|