從GPT-4?VS?文心一言暢談百度的未來
隨著AI的大火,最近AI圈可謂風云際會,各方大佬紛紛登場。在3月14日,GPT-4的發(fā)布會圓滿結(jié)束,3月15日,百度的李彥宏也做了文心一言的發(fā)布會,沒看過的小伙伴,可以在網(wǎng)上搜搜發(fā)布會的視頻。
“文心一言”各種梗圖
百度真“人工”智能
機智的網(wǎng)友讓GPT-4評價文心一言,上演現(xiàn)實版的同行相輕
發(fā)布會上李彥宏步履蹣跚,表情略顯緊張,沒有往日的自信從容。那么百度的文心一言和GPT相比到底實力如何?是騾子是馬,咱們拉出來遛遛。
GPT-4 VS 文心一言
接下來主要從多模態(tài)生成,數(shù)理邏輯推算,編程方面,擬人化,算力方面,中文理解,應用生態(tài)等方面分析下到底誰強誰弱
GPT-4
OpenAI老板Sam Altman評價GPT-4是目前為止最強的AI,根據(jù)OpenAI官方的介紹,GPT-4是一個超大的多模態(tài)模型,它的輸入可以是文字(上限2.5萬字),還可以是圖像
最令人驚訝的是只需要簡單在紙上畫一個網(wǎng)站的草稿圖,拍一張照片上傳給GPT-4,它就可以立馬生成網(wǎng)站的HTML代碼?。ㄒ院蟪绦騿T真要失業(yè)了)
OpenAI自稱:在各種專業(yè)和學術(shù)基準上和人類相當!敢這么狂妄,背后還是有東西的!
多模態(tài)能力
所謂多模態(tài)能力,即可以接受圖像輸入并理解圖像內(nèi)容,并且可接受的文字輸入長度也增加到3.2萬個字符(約2.4萬單詞)。比如模擬律師考試,GPT-4取得了前10%的好成績,相比之下GPT-3.5是倒數(shù)10%,做美國高考SAT試題,GPT-4也在閱讀寫作中拿下710分高分、數(shù)學700分(滿分800)
看圖能力可以用來解釋表情包、梗圖
提問這張圖哪里好笑?GPT-4可以按順序描述出每一格的內(nèi)容,并總結(jié)出笑點:
用巨大的過時VGA接口給小巧的現(xiàn)代智能手機充電
數(shù)理邏輯推算
發(fā)GPT-4可以理解圖表中數(shù)據(jù)的含義,并做進一步計算
編程方面
發(fā)布會直播上,OpenAI總裁現(xiàn)場表演了一波GPT-4給代碼修Bug
出現(xiàn)問題啥也不用想,直接把2.4萬字的程序文檔一股腦扔給GPT-4就行。你只需要精通CV(復制粘貼)大法即可
并且能在幾秒鐘內(nèi)瞬間得到解決辦法
擬人化
GPT-4還開放了一個使用功能,允許修改“系統(tǒng)提示”,使其感覺更像真人一樣!之前ChatGPT的回答總是冗長而平淡,這是因為系統(tǒng)提示中規(guī)定了“你只是一個語言模型……你的知識截止于2021年9月。現(xiàn)在通過修改“系統(tǒng)提示”,GPT-4就可以展現(xiàn)出更多樣的性格,比如扮演蘇格拉底
應用生態(tài)
必應早就用上了GPT-4,并得到了微軟方面的證實
微軟給OpenAI提供超算服務吸引企業(yè)來使用Azure訓練自己的大模型,同時直接在Azure中提供OpenAI模型服務(Azure OpenAI Service),此前包括GPT-3、Codex和DALL·E 2等模型,都已經(jīng)接入Azure
中文理解
GPT-4在中文理解方面的確稍遜一籌。
文心一言
和GPT-4一樣,文心一言是一個多模態(tài)大模型。李彥宏會上展示了文心一言具備的5種能力,包括
文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成
文學創(chuàng)作
在文學創(chuàng)作上,李彥宏先來了一個最簡單的提問,問《三體》作者是哪里人?先讓文心一言介紹一下大劉,“畢竟我(文心一言)和劉慈欣是老鄉(xiāng)嘛,都來自陽泉”
結(jié)果大錯特錯,直接把劉慈欣的老家張冠李戴到了湖北省洪湖市
商業(yè)文案創(chuàng)作
比如給新公司起個名字,并且這個名字它還有理有據(jù),有跡可循
中文理解
發(fā)布會上,李彥宏向觀眾展示了文心一言對中文的理解能力,并自信地說:文心一言對中國文化的了解,理應超出任何一個預訓練大模型
為了證明這一點,李彥宏輸入了一個問題:“洛陽紙貴。到底有多貴?”,文心一言不僅展現(xiàn)了歷史淵源,還介紹了這個成語背后的經(jīng)濟學原理
我們再來問問GPT-4呢
在標準化的回答方面兩者似乎旗鼓相當
那么,難度再提高下,看看二者寫藏頭詩的能力
GPT-4沒有真正理解“藏頭詩”的含義
在中文理解上,屬實是文心一言“小勝一籌”了。不過在英文上,李彥宏也承認,雖然文心一言也能處理,但能力是顯著不如中文的。
數(shù)理邏輯推算
數(shù)學思維能力方面,文心一言處理的數(shù)學問題不算復雜,是小學常見的雞兔同籠問題
有趣的是,李彥宏現(xiàn)場展示的第一題,引得文心一言說出了《狂飆》里高啟盛的經(jīng)典臺詞:這題出得不對??雌饋砀邤M人化
李彥宏表示,這些題“不敢說百分之一百能做對,但至少體現(xiàn)了文心一言的思考歷程”
在邏輯推理方面相比GPT-4,個人覺得文心一言處理的還是有點小兒科了,擬人化方面暫時先對半分吧
多模態(tài)能力
為即將到來的2023世界智能交通大會創(chuàng)作海報,并且支持文字轉(zhuǎn)視頻,文字轉(zhuǎn)語音能力
相比GPT的強大,文心一言差的不是一星半點
編程方面
有些遺憾的是,在ChatGPT被頻頻稱贊的編程方面,文心一言并沒有現(xiàn)場展示相關(guān)能力,只能認為目前不具備或者只具備很弱的能力,和GPT不能相提并論
算力方面
文心一言底層算力支持,是位于李彥宏老家陽泉的百度陽泉智算中心,專門為自家大模型產(chǎn)品文心一言提供計算推理的算力需求,陽泉智算中心是亞洲單體最大的智算中心,算力規(guī)??蛇_4EFLOPS(每秒400億億次浮點計算)
但相比微軟的大投入,上萬張英偉達A100芯片,幾十萬張GPU還是稍遜
應用生態(tài)
目前,文心一言在百度內(nèi)部已經(jīng)接入百度搜索,小度和自動駕駛Apollo等產(chǎn)品,外部包括愛奇藝等650家公司也已經(jīng)接入
生態(tài)方面也僅限國內(nèi)相比還是不足
文心一言背后原理
據(jù)王海峰(百度首席技術(shù)官(CTO),深度學習技術(shù)及應用國家工程研究中心主任)介紹,文心一言主要脫胎于兩大模型,六項核心技術(shù)。
兩大模型:
百度ERNIE系列知識增強千億大模型,以及百度大規(guī)模開放域?qū)υ捘P蚉LATO
六項核心技術(shù):其中三個是廣為人知的大模型技術(shù),包括有監(jiān)督精調(diào)、人類反饋強化學習和提示構(gòu)建。另外三個,則是“百度特色”的技術(shù),
包括知識增強、檢索增強和對話增強技術(shù)
總結(jié)
誠然,文心一言和GPT-4還有很大差距。雖然網(wǎng)上很多人對文心一言抨擊的一文不值,批評的體無完膚,但是這也是大家對百度的期望太高。對比GPT-4的光芒萬丈就顯得自慚形穢了,但百度作為國內(nèi)AI的頭部企業(yè)實力還是不容小覷的,在中文處理方面有著得天獨厚的優(yōu)勢,而且在AI的很多應用場景也有著自己的貢獻。
希望大家能理性看待百度的文心一言,雖然還有缺陷,但隨著時間的流逝,我相信國產(chǎn)AI會有著屬于自己的輝煌,讓AI真正的服務給更多的人。
就像有句話說的,世界上不能只有一種聲音,一枝獨秀不是春,百花齊放才是春。
以上就是從GPT-4 VS 文心一言來探討百度的未來在哪里的詳細內(nèi)容,更多關(guān)于GPT-4 VS 文心一言的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
擔起凈化網(wǎng)絡環(huán)境責任 IDC行業(yè)在發(fā)展中成長
在去年年底我國就掀起了互聯(lián)網(wǎng)的整風浪潮,各行各業(yè)的整治行動都緊鑼密鼓地進行著。2009-09-09OpenAI發(fā)布GPT-4支持圖像文本輸入處理中文準確度大幅提升
這篇文章主要為大家介紹了OpenAI正式發(fā)布GPT-4:支持圖像和文本的輸入、?處理中文的準確度大幅提升,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-03-03