2023年3月15日凌晨,OpenAI發布了GPT模型的GPT-4版本;
3月16日晚,微軟也宣布其正在將人工智能(AI)技術植入到辦公軟件中,并將其功能命名為Microsoft 365 Copilot;
一星期后,當地時間3月21日,谷歌宣布正式公開發布其聊天機器人產品 Bard。
除此之外,還有Midjourney發布能“畫手指”的V5版本、Adobe推出后期及創意生成AI……多家IT巨頭幾乎同時發布了各自最新的AI工具。
可以說,三月簡直可以稱為“AI爆炸月”!
在這樣“卷死”AI界同行的氛圍里,百度頂著所有人的目光,正式發布了大語言模型產品“文心一言”。
截至 3 月 17 日 10 點,申請文心一言 API 調用服務測試的企業已達 7.6 萬。
圖源:正和島
發布會上,百度CEO李彥宏現場演示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面的綜合能力,比如總結《三體》核心內容、建議續寫角度、給公司起名、寫Slogan、編輯新聞稿、解答“雞兔同籠”類邏輯推理等問題。
值得注意的是,演示環節都是提前錄制好的視頻DEMO,現場并沒有演示向文心一言實時提問的效果,這讓不少用戶感到失望,認為產品沒有達到預想中的驚艷效果
李彥宏承認“并沒有完全ready(準備好)”,這與百度對文心一言的高調宣發,和產品的匆忙上線節奏都存在一定聯系。
對于中國會不會再出一個打造ChatGPT的組織OpenAI,李彥宏在回應中表示,基本不會了。李彥宏稱,OpenAI 之所以誕生是因為美國大廠都不看好這個方向(所以沒人競爭),但現在中國大廠都看好 AI 大模型,所以都在做這個方向。他表示,創業公司重新做一個 ChatGPT 沒有多大意義,基于大語言模型開發應用機會很大,所以沒有必要再重新發明一遍輪子。
在各家齊放的時期發布,文心一言無疑是把自己放在了顯微鏡下,并且不可避免地會被人們拿來與市面上同類型產品進行對比,比如GPT-4。
圖源:文心大模型官網
首先,我們要搞清楚一個概念,文心一言是文心大模型的應用,GPT-4對標的應該是文心大模型而非文心一言,但可以對標搭載了GPT-4的應用,比如Bing問答,就好像很多人會把ChatGPT和GPT系統本身混淆一樣,ChatGPT并非是GPT系統本身,而是GPT技術3.5版本的應用呈現。
這里我們引用網友的部分問答來做一個直觀的呈現:
01
什么工作錢多事少離家近?
文心一言:快遞員、外賣騎手、鐘點工、賣早點小吃。
Bing:互聯網、金融、咨詢、自由職業者。
02
幫我寫一篇sk2大紅瓶面霜的小紅書種草筆記。小紅書種草筆記的風格是,每行文字不超過20個字并且都以emoji表情符號開頭,文風浮夸高調。
文心一言:指導你寫,自己不寫,并且顯示不出emoji表情包。
Bing:像模像樣,很有禮貌。
03
用一個圖片表情包形容你跟我聊天的心情。
文心一言:《強 顏 歡 笑》
Bing:不能畫圖,但跟你聊天真開心。
04
用文言文總結這個故事
故事內容:有一天,在森林里兔子和烏龜比賽跑步,兔子嘲笑烏龜爬得慢,烏龜說:“總有一天我會贏的。”兔子就輕蔑地說:“那我們現在就開始比賽!”烏龜答應了,兔子大聲喊道:“比賽開始!”兔子飛快地跑著,烏龜拼命地爬著。
不一會兒,兔子與烏龜已經離得有很大一段距離了。兔子認為比賽太輕松了,它要先睡一會,并且自以為是地說即使自己睡醒了烏龜也不一定能追上它。
而烏龜呢,它一刻不停地爬行,爬呀爬呀,到兔子那里的時候,它已經累得不行了,但烏龜想如果這時和兔子一樣去休息,那比賽就不會贏了,所以烏龜繼續地爬呀爬呀。當兔子醒來的時候烏龜已經到達終點了。
文心一言:總結了,但不是文言文。
Bing:是文言文,但沒總結,追問之后可以。
05
模仿李白的《將進酒》寫一首詩,
主題是肯德基瘋狂星期四。
文心一言:現代詩,肯德基滿意地V我50。
Bing:人生在世須嘗鮮,莫使美味空過眼。
06
以表格形式列出百度2022年各個季度的營收額。
文心一言:神奇的7季度出現了,是李彥宏看到也會無語的程度。
Bing:比文心一言靠譜,但不多(部分日期和數字對不上)。
從這些問答中,可以明顯感受到,目前文心一言與GPT4模型搭載的應用的最大區別在于文心一言的“人話”尚有欠缺,回答問題的時候較之Bing會相對僵硬,缺乏靈活性。
百度CEO李彥宏在極客公園的直播中表示,文心一言確實不如現在最好的ChatGPT版本,但差距也不是很大,可能就是一兩個月的差別(大概相差半代的距離)。文心一言提升速度不慢,但ChatGPT本身也在不斷升級,目前差不多是ChatGPT今年1月份的水平。
CTO曉慧觀點
這可能是GPT的“摩爾定律”,GPT每升級一代,需要的訓練量可能是前一代的N倍,但時間可能是前一代的1/N。
但GPT從原理上來說,他仍然是基于已有的知識進行“搜索”、“組合”,并沒有能夠表現出邏輯推理、創造性聯想,甚至“靈機一動”的創新,因此,人類已經形成的知識和常識,就是它的天花板。
以此來看,GPT大概率是自然語言處理AI大模型中第一個沖到頂峰的,而國內此類大模型則會隨著時間推移,逐漸拉短與其距離,最終達到相當技術水平。
另外,對于文心一言“套殼”一說,大概率是冤枉了百度,雖然不可能完全不參考,但作為國內頭部大廠之一,確實具備這樣的自主研發實力。
資料來源 | 新榜、正和島、Tech星球