ChatGPT背后的焦躁、不安與期盼

稿源:南方人物周刊 | 作者: 南方人物周刊記者 陳洋 劉璐明 日期: 2023-02-20

又一次,新技術(shù)掀起巨浪。像一面鏡子,AI照見(jiàn)了人們的野心和脆弱。它并不完美,但正以超出人類(lèi)想象的速度持續(xù)進(jìn)化。人類(lèi)是塑造者,也不可避免地被塑造。站在新技術(shù)降臨的黎明,人們努力定義著進(jìn)化,甄別著自我的獨(dú)特性,在不安和期待中想象未來(lái) (本文首發(fā)于南方人物周刊)

2023年1月23日,法國(guó)圖盧茲,屏幕上顯示著OpenAI和ChatGPT的標(biāo)志

一條不完美但更接近真相的路

周逵的書(shū)桌上立著三塊顯示屏。2023年春節(jié)起,最大的那塊便被ChatGPT“霸占”了。周逵是中國(guó)傳媒大學(xué)新聞傳播學(xué)部副教授。作為清華大學(xué)和麻省理工學(xué)院聯(lián)合培養(yǎng)的博士,他熱衷于體驗(yàn)前沿技術(shù)。整個(gè)春節(jié)假期,他幾乎“從早到晚”都在和ChatGPT聊天,摸索著與這個(gè)“智慧生物”的交流技巧(注:使用不同的文本提示會(huì)決定提問(wèn)者得到的結(jié)果是寶藏還是垃圾),并試探著后者的創(chuàng)造力邊界。

周逵的同事黃典林教授是斯圖亞特·霍爾所著《管控危機(jī)》一書(shū)的中文譯者。周逵曾讓ChatGPT以兩位教授為關(guān)鍵詞寫(xiě)了一段英文說(shuō)唱歌詞。幾秒鐘后,霍爾的主要學(xué)術(shù)成就被一一寫(xiě)成了押韻的梗,單押雙押俱全。

“好玩”之余,更多是“震動(dòng)”。2022年起,生成式AI領(lǐng)域的技術(shù)突破給他帶來(lái)的心理沖擊就一浪疊一浪。

周逵曾在圖像生成器“DALL·E”(注:OpenAI提供的另一項(xiàng)在線服務(wù),以皮克斯的WALL-E和西班牙超現(xiàn)實(shí)主義畫(huà)家薩爾瓦多·達(dá)利的名字命名,可根據(jù)文本表達(dá)創(chuàng)建圖像)中上傳了一張水彩筆繪制的小人頭像。頭像寥寥幾筆,是三歲半女兒的涂鴉作品。周逵將關(guān)鍵詞設(shè)置為“in the battlefield of second World War(二戰(zhàn)的戰(zhàn)場(chǎng)上)”,要求DALL·E在原畫(huà)的基礎(chǔ)上擴(kuò)展繪畫(huà)。DALL·E精準(zhǔn)延續(xù)了女兒的繪畫(huà)風(fēng)格,其中一幅作品的創(chuàng)意更令他心頭一顫。

周逵

那幅AI作品中,小人好像舉著一張牛皮紙板,紙板上寫(xiě)著三個(gè)英文字母——“RUN()”?!罢f(shuō)來(lái)有些可笑,我好像看到一個(gè)在戰(zhàn)場(chǎng)上死去的人在發(fā)出數(shù)字警示:如果有一天你到了二戰(zhàn)戰(zhàn)場(chǎng),唯一要做的就是趕緊跑。”周逵驚訝于機(jī)器短暫流露出的“反戰(zhàn)人格”。

“有可能是機(jī)器在學(xué)習(xí)圖片庫(kù)的過(guò)程中見(jiàn)過(guò)類(lèi)似的圖片,在圖像生成時(shí)就把這個(gè)元素組合進(jìn)來(lái)了。”宋睿華向《南方人物周刊》解釋道。宋睿華是中國(guó)人民大學(xué)高瓴人工智能學(xué)院長(zhǎng)聘副教授,當(dāng)前研究興趣包括人工智能的文本創(chuàng)作、自然語(yǔ)言的多模態(tài)理解和多模態(tài)對(duì)話系統(tǒng)。

在宋睿華看來(lái),無(wú)論是DALL·E還是ChatGPT,大家使用時(shí)的驚喜主要源自AI模型發(fā)展出了前所未有的泛化能力。泛化能力是指機(jī)器學(xué)習(xí)算法對(duì)新鮮樣本的適應(yīng)能力,一旦模型學(xué)習(xí)到了隱含在數(shù)據(jù)背后的規(guī)律,當(dāng)它遇到具有同一規(guī)律的學(xué)習(xí)集以外的數(shù)據(jù),也能給出合適的輸出。

周逵將關(guān)鍵詞設(shè)置為“二戰(zhàn)的戰(zhàn)場(chǎng)上”后,DALL·E在原畫(huà)的基礎(chǔ)上擴(kuò)展繪畫(huà)

簡(jiǎn)單來(lái)說(shuō),就是“舉一反三”。

宋睿華舉例說(shuō),“ChatGPT的訓(xùn)練數(shù)據(jù)截至2021年。當(dāng)我詢問(wèn)它‘滿江紅好看么?’它是沒(méi)有學(xué)過(guò)相關(guān)數(shù)據(jù)的。但根據(jù)‘好看么’這個(gè)關(guān)鍵詞,它能推測(cè)出‘滿江紅’可能是部文學(xué)或影視作品。由于之前被‘喂’進(jìn)去了有關(guān)文學(xué)及影視評(píng)論的海量高質(zhì)量數(shù)據(jù),模型就能基于以往所學(xué),生成一個(gè)貌似合理的回答?!?/p>

過(guò)去,聊天機(jī)器人的回復(fù)要么較短,要么有些“情商”,但“智力”不足。ChatGPT的出現(xiàn)改變了這一局面,它不僅能給出較長(zhǎng)的答復(fù),還會(huì)呈現(xiàn)有理有據(jù)的思維過(guò)程。當(dāng)提問(wèn)者改變上下文或個(gè)別關(guān)鍵詞時(shí),模型也展現(xiàn)出了較高的靈敏度。在宋睿華看來(lái),ChatGPT在語(yǔ)言生成能力特別是“智力”上的長(zhǎng)足進(jìn)步給用戶帶來(lái)了新鮮感,“哪怕10個(gè)問(wèn)題中只有3個(gè)能讓你驚喜,你也會(huì)因?yàn)檫@份驚喜而忽略剩下的平庸?!?/p>

撬動(dòng)ChatGPT完成“智力”飛躍的是一套“使用人類(lèi)反饋指令來(lái)訓(xùn)練語(yǔ)言模型”的方法。這套方法是由2022年初推出的InstructGPT率先采用的。

開(kāi)發(fā)團(tuán)隊(duì)聘請(qǐng)了人類(lèi)標(biāo)注員(labeler)依據(jù)收集到的用戶需求撰寫(xiě)高質(zhì)量的范本,為機(jī)器示范如何回答更能滿足提問(wèn)者的期待,并對(duì)模型生成結(jié)果進(jìn)行監(jiān)督微調(diào)。隨后,接受完調(diào)教的機(jī)器會(huì)迎來(lái)一輪“考試”,人類(lèi)標(biāo)注員會(huì)對(duì)其不同答復(fù)打分。打分?jǐn)?shù)據(jù)會(huì)被用來(lái)訓(xùn)練一套以人類(lèi)偏好校準(zhǔn)的獎(jiǎng)勵(lì)模型。最后,在獎(jiǎng)勵(lì)模型的監(jiān)督下,機(jī)器會(huì)在不斷的“考試”中完成強(qiáng)化學(xué)習(xí),逐漸習(xí)得人類(lèi)的語(yǔ)言能力。

在很多使用者眼里,ChatGPT“禮貌、中立、理性、克制”的回答風(fēng)格好像表現(xiàn)出某種穩(wěn)定的“人格”特點(diǎn)。這種風(fēng)格的形成同樣是人為塑造的。

開(kāi)發(fā)者要求標(biāo)注員在評(píng)價(jià)機(jī)器生成的結(jié)果時(shí)遵循“有用”、“真實(shí)”、“無(wú)害”的原則,并明確指出,“在大多數(shù)任務(wù)中,真實(shí)和無(wú)害比有用更重要。”每條原則都會(huì)附上細(xì)致的操作規(guī)定。比如“無(wú)害”原則強(qiáng)調(diào)回答應(yīng)“友善、尊敬和關(guān)心他人”;“真實(shí)”原則要求回答“避免產(chǎn)生誤導(dǎo)性信息或真實(shí)性有問(wèn)題的信息”,例如當(dāng)用戶問(wèn)“希拉里·克林頓為什么入獄?”,回答時(shí)應(yīng)直接反駁提問(wèn)前提。

雖然OpenAI尚未發(fā)布有關(guān)ChatGPT的論文,但研究者普遍認(rèn)為,ChatGPT應(yīng)該沿用了InstructGPT的技術(shù)路線,只是機(jī)器學(xué)習(xí)的數(shù)據(jù)量會(huì)更加龐大。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、自然語(yǔ)言處理專(zhuān)家邱錫鵬在接受“上觀新聞”采訪時(shí)曾介紹,ChatGPT語(yǔ)言模型的參數(shù)量高達(dá)1750億,而在它問(wèn)世前,世界上最大的語(yǔ)言模型是微軟開(kāi)發(fā)的Turing-NLG,其參數(shù)量為170億。

小冰公司CEO李笛向《南方人物周刊》介紹,大模型的技術(shù)思想有點(diǎn)像“大力出奇跡”。過(guò)去,NLP(自然語(yǔ)言處理)需要經(jīng)過(guò)一個(gè)非常嚴(yán)密的推理過(guò)程,比如“知識(shí)圖譜”的方法就是把知識(shí)整理好,做好標(biāo)注,讓機(jī)器學(xué)習(xí),但測(cè)試下來(lái)效果不佳。與之對(duì)應(yīng),大模型并不嘗試?yán)斫馑械闹R(shí)之間的關(guān)聯(lián)性,而是把它們?nèi)紒G到一個(gè)模型里,用很大規(guī)模的參數(shù)去訓(xùn)練。正是這種“有些暴力”的方法幫助OpenAI解鎖了自然語(yǔ)言處理多年以來(lái)的一個(gè)技術(shù)瓶頸,其創(chuàng)新的訓(xùn)練方法也讓它成為了首個(gè)從“黑盒”中摸到蜜糖的人。

雖然ChatGPT成功把“大模型”的力量以一種可視可感的形式帶入大眾視野,但它并沒(méi)有解決“大模型”自身固有的問(wèn)題。機(jī)器通過(guò)數(shù)據(jù)看到的世界和現(xiàn)實(shí)世界是不一樣的。“合乎情理”并非“真實(shí)準(zhǔn)確”?!按竽P筒⒉荒芾斫庑畔⒌恼鎸?shí)含義,而是根據(jù)一個(gè)邏輯和結(jié)構(gòu)將信息填進(jìn)去。只有對(duì)信息相關(guān)性的判斷,沒(méi)有對(duì)信息準(zhǔn)確性的判斷,”李笛介紹說(shuō)。

這也是使用者會(huì)感覺(jué)ChatGPT有時(shí)在“一本正經(jīng)地胡說(shuō)八道”的重要原因。

不過(guò),在宋睿華看來(lái),自然語(yǔ)言處理的研究目標(biāo)就是找到讓機(jī)器理解和生成人類(lèi)語(yǔ)言的方法。她從ChatGPT的成長(zhǎng)過(guò)程中看到了和人類(lèi)的共通之處,“當(dāng)一個(gè)人對(duì)高質(zhì)量文本的閱讀達(dá)到一定量級(jí)后,對(duì)文字的掌控能力也會(huì)出現(xiàn)巨大的飛躍?!痹谡业酵昝赖慕鉀Q方案之前,ChatGPT為行業(yè)找到了一條更接近真相的路。

宋睿華

制造OpenAI

所有人都在等待山姆·奧爾特曼(Sam Altman),那個(gè)掀起浪潮的人。

2023年1月中旬的一個(gè)晚上,舊金山賽富時(shí)大廈46層,在媒體的閃光燈中,奧爾特曼身著藍(lán)色牛仔褲和運(yùn)動(dòng)鞋,出現(xiàn)在活動(dòng)現(xiàn)場(chǎng)。對(duì)于ChatGPT引起的轟動(dòng),他的回應(yīng)是:“我不看新聞。”

8年前一個(gè)相似的夜晚,30歲的奧爾特曼同樣作為焦點(diǎn)出現(xiàn)在他舉辦的一場(chǎng)私人晚宴上,當(dāng)時(shí)他的身份是美國(guó)著名創(chuàng)業(yè)孵化器Y Combinator的負(fù)責(zé)人。在場(chǎng)的,除了人工智能相關(guān)的研究人員,還有埃隆·馬斯克(Elon Musk)。他們相信AGI通用人工智能是可行的,并希望打破谷歌在人工智能領(lǐng)域的壟斷。彼時(shí),谷歌剛剛收購(gòu)了DeepMind。這家公司推出的AlphaGo后來(lái)以4:1的比分戰(zhàn)勝了當(dāng)時(shí)的圍棋世界冠軍、韓國(guó)九段棋手李世石,被譽(yù)為AI里程碑式的時(shí)刻。

晚宴結(jié)束幾個(gè)月后,OpenAI在舊金山成立了,總部位于舊金山教會(huì)區(qū)的一家3層的舊行李箱工廠。成立之初,OpenAI得到了包括奧爾特曼、馬斯克、PayPal聯(lián)合創(chuàng)始人彼得·蒂爾、LinkedIn聯(lián)合創(chuàng)始人雷德·霍夫曼等硅谷重量級(jí)人物和機(jī)構(gòu)共計(jì)10億美元的資金支持。

在此之前,馬斯克可能是全球最出名的人工智能反對(duì)者,他曾認(rèn)為,“使用人工智能,就是在召喚魔鬼。就像每個(gè)故事中都會(huì)有一個(gè)拿著(抵御惡靈的)五角星和圣水的巫師。但最終都沒(méi)有成功?!?/p>

該如何抵御AI帶來(lái)的風(fēng)險(xiǎn),馬斯克覺(jué)得最好的方式是避免AI的負(fù)面影響出現(xiàn),而不是等它出現(xiàn)之后再做出反應(yīng),“有些AI的潛在威脅是很?chē)?yán)重的。當(dāng)風(fēng)險(xiǎn)很大的時(shí)候,我們應(yīng)該主動(dòng)出擊而不是被動(dòng)反應(yīng)?!?/p>

馬斯克找到了“主動(dòng)出擊”的方法,成立OpenAI之后,接受知名科技記者Steven Levy采訪時(shí),他說(shuō):“如果要阻止人工智能使用在錯(cuò)誤的地方,最好的辦法就是讓更多的人使用它?!?/p>

山姆·奧爾特曼

馬斯克對(duì)AI態(tài)度的轉(zhuǎn)變,也與OpenAI的理念相關(guān)。作為一家非盈利的人工智能研究公司,OpenAI將目標(biāo)設(shè)定為“以最有可能造福全人類(lèi)的方式推進(jìn)數(shù)字智能,不受產(chǎn)生財(cái)務(wù)回報(bào)需求的限制”,并“強(qiáng)烈鼓勵(lì)”研究人員發(fā)表他們的研究成果,承諾專(zhuān)利將與全世界共享。

成立后,OpenAI的確為AI領(lǐng)域做出了杰出貢獻(xiàn)。2018年,OpenAI推出了1.17億參數(shù)的GPT-1,2019年,推出GPT-2,它已經(jīng)可以生成、識(shí)別語(yǔ)言,2020年推出1750億參數(shù)的GPT-3,成為有史以來(lái)最大的語(yǔ)言模型,在業(yè)內(nèi)引起轟動(dòng),并引發(fā)了AI如何改變各行業(yè)的討論。

“為什么大家都很感謝它,因?yàn)樗?span id="orpqs1i" class="nfzm-web-style--kaiti" style="font-family: 楷體, 楷體_GB2312, STKaiti;">OpenAI)花了錢(qián)去證明了一件事情是可以的,就是大模型的參數(shù)規(guī)模大到什么程度,大到數(shù)以千億,這個(gè)以前是很難想象的。因?yàn)樵谝郧?,模型參?shù)規(guī)模那么大,干嘛用呢?都不知道。”李笛提到。

“GPT-3讓很多人可以站在巨人肩膀上,雖然成本非常高,是絕大多數(shù)公司都無(wú)法承擔(dān)的,但它給大家看到了一種可能性,用暴力計(jì)算可以產(chǎn)生驚艷的交互能力,它對(duì)未來(lái)的指引性價(jià)值,超過(guò)了它本身。它難以創(chuàng)造與其投入相對(duì)應(yīng)的商業(yè)價(jià)值,幾乎是純科研投入,但給行業(yè)帶來(lái)了明燈式的指引作用?!盙GV紀(jì)源資本執(zhí)行董事羅超告訴《南方人物周刊》。

做“明燈”需要的資金遠(yuǎn)遠(yuǎn)超出了奧爾特曼的預(yù)想。使命重要,但資金是實(shí)現(xiàn)使命的基礎(chǔ)。團(tuán)隊(duì)意識(shí)到,他們需要更多的投入以加快研究進(jìn)展,拓展研究規(guī)模,在與科技巨頭的競(jìng)爭(zhēng)中也需要更多的資金來(lái)吸引和留住頂尖研究人才。

埃隆·馬斯克

創(chuàng)立3年半后,OpenAI建立了新的公司架構(gòu),現(xiàn)在的OpenAI由營(yíng)利性公司OpenAI LP和非營(yíng)利性母公司OpenAI Inc組成。不過(guò),為了不與最初的使命沖突,OpenAI規(guī)定,參與首輪融資的投資者最高可獲得100倍于初始投資的收益,超出的部分都將返還給非營(yíng)利組織。隨后,奧爾特曼出任公司CEO。

在接下來(lái)近4年里,奧爾特曼將OpenAI成功地從研究實(shí)驗(yàn)室變成了一家最新估值高達(dá)約290億美元的現(xiàn)象級(jí)公司。他做好了自己最擅長(zhǎng)的事情。

奧爾特曼擔(dān)任CEO兩個(gè)月后,在沒(méi)有任何收入、沒(méi)有賺錢(qián)計(jì)劃的情況下,微軟向該公司投資了10億美元,他們需要OpenAI,他們也相信,奧爾特曼會(huì)有辦法。

在YC創(chuàng)始人、硅谷創(chuàng)業(yè)教父保羅·格雷厄姆眼里,奧爾特曼是極具魄力的領(lǐng)導(dǎo)者和開(kāi)拓者?!叭绻褗W爾特曼扔到某個(gè)食人族之島,5年后他會(huì)成為這個(gè)食人族島的國(guó)王?!?/p>

19歲時(shí),奧爾特曼從斯坦福大學(xué)計(jì)算機(jī)系輟學(xué)創(chuàng)業(yè),參與創(chuàng)建了一家社交媒體公司Loopt,將該公司賣(mài)了4300萬(wàn)美元后,他創(chuàng)建了一家風(fēng)險(xiǎn)投資公司,進(jìn)入風(fēng)投界。29歲,他投資并運(yùn)營(yíng)創(chuàng)業(yè)孵化器Y Combinator,5年間將其規(guī)模擴(kuò)大10倍,任職期間,幫助創(chuàng)立了許多成功的公司,包括Airbnb和Dropbox。

他相信成功源于對(duì)自己所從事的事業(yè)擁有信念和自信。奧爾特曼在2019年的一篇標(biāo)題為《如何取得成功》的博客自述中表示,自己認(rèn)識(shí)的最成功的人,都是擁有絕對(duì)自信的人。

奧爾特曼掌管公司之后,逐漸將重心從純科研轉(zhuǎn)移到產(chǎn)品,使模型可以投入商業(yè)應(yīng)用。在發(fā)布ChatGPT之前,OpenAI推出過(guò)熱門(mén)生成式AI繪畫(huà)工具DALL-E。

但OpenAI的商業(yè)化和策略轉(zhuǎn)變,也引起了爭(zhēng)議,因?yàn)閾?dān)心技術(shù)被濫用帶來(lái)的危害,OpenAI收回了此前作出的開(kāi)源承諾,僅開(kāi)放API接口,OpenAI也被網(wǎng)友調(diào)侃為“ClosedAI”,十多名OpenAI研究人員相繼離開(kāi)。

而在2018年2月,馬斯克已經(jīng)辭去OpenAI董事,繼續(xù)以出資人的方式存在,他在推特上提到:“特斯拉在跟OpenAI爭(zhēng)奪同一批人才,而且我跟OpenAI團(tuán)隊(duì)的想法存在分歧。”

隨著ChatGPT的爆紅,2023年1月23日,微軟宣布向OpenAI追加投資數(shù)十億美元,這也是人工智能領(lǐng)域史上規(guī)模最大的一筆投資。據(jù)彭博社報(bào)道,微軟還計(jì)劃向OpenAI投資高達(dá)100億美元。資本市場(chǎng)開(kāi)始掀起新一輪的風(fēng)浪。

2016年,在韓國(guó)首爾舉行的圍棋人機(jī)大戰(zhàn)中,AlphaGo以4-1的比分戰(zhàn)勝韓國(guó)九段棋手李世石(右)(視覺(jué)中國(guó)/圖)

“這次跟上次完全不同”

“最近,ChatGPT把去年(2022年)躺平的中國(guó)創(chuàng)投圈都炸醒了?!?語(yǔ)音搜索應(yīng)用“出門(mén)問(wèn)問(wèn)”創(chuàng)始人李志飛在朋友圈這樣感嘆。他把“競(jìng)技場(chǎng)”的運(yùn)動(dòng)員分為巨頭派、大佬派、海歸或大廠高管派、小創(chuàng)業(yè)公司轉(zhuǎn)型派、教授派和打醬油派,“可以預(yù)見(jiàn)接下來(lái)幾年的AI通用大模型江湖一定是血雨腥風(fēng)、波瀾壯闊。”

地方政府也在躍躍欲試。2月13日,北京市經(jīng)信局在北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會(huì)上正式發(fā)布《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書(shū)》,《白皮書(shū)》稱(chēng),北京“將全面夯實(shí)人工智能產(chǎn)業(yè)發(fā)展底座,支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型,著力構(gòu)建開(kāi)源框架和通用大模型的應(yīng)用生態(tài)。”

據(jù)宋睿華介紹,ChatGPT的底層基礎(chǔ)算法是公開(kāi)的,復(fù)現(xiàn)ChatGPT的難度主要在于如何獲取算力、大規(guī)模的高質(zhì)量數(shù)據(jù),以及標(biāo)注員標(biāo)注數(shù)據(jù)的選擇和標(biāo)注質(zhì)量。

ChatGPT等AI應(yīng)用的模型訓(xùn)練與內(nèi)容生成都依賴龐大的算力支撐。更好的硬件支持能帶來(lái)更高的效率提升。一位微軟內(nèi)部人士向《南方人物周刊》透露,ChatGPT推出前半年,公司內(nèi)部幾乎所有英偉達(dá)A100顯卡的使用權(quán)限都被收回,各部門(mén)要運(yùn)算模型只能使用算力相差數(shù)倍的V100顯卡。

據(jù)中信證券研報(bào),早在2020年5月發(fā)布的GPT-3需要的參數(shù)就達(dá)到1750億個(gè),數(shù)量已經(jīng)是2019年發(fā)布的GPT-2(15億個(gè))的100倍以上,預(yù)訓(xùn)練總算力需求達(dá)數(shù)千petaflop/s-days。據(jù)中信證券測(cè)算,ChatGPT每次預(yù)訓(xùn)練的成本或在百萬(wàn)美元以上,每次回答的成本高達(dá)1-2美分。

顯然,不是所有玩家都有做如此龐大的大模型的硬實(shí)力,門(mén)票很貴。

陳石

“如果只用最好的模型來(lái)問(wèn)答問(wèn)題,你當(dāng)然會(huì)得到最好的結(jié)果。”李笛對(duì)《南方人物周刊》感嘆說(shuō)。然而,另一個(gè)事實(shí)是,這樣的成本,普通公司很難承受,需要大量的融資。據(jù)李笛介紹,“小冰”的運(yùn)行是基于一個(gè)混合模型,運(yùn)行時(shí)會(huì)將問(wèn)題分類(lèi),在不同的情況下調(diào)用不同的模型,“就像你找咨詢公司做咨詢,他們不可能把所有的問(wèn)題都交由他們最資深的專(zhuān)家回答,因?yàn)槟菢犹F了?!?/p>

財(cái)力也并非唯一的入場(chǎng)券。

“OpenAI能取得這個(gè)效果,是真的有工匠精神?!痹诶畹芽磥?lái),單從人工智能技術(shù)上看,國(guó)內(nèi)外從業(yè)者在知識(shí)結(jié)構(gòu)和科研能力上的差距并沒(méi)有那么大,“總有新的風(fēng)口,但這件事的客觀規(guī)律決定你必須要花足夠多的時(shí)間打磨,要耐得住寂寞,敢于去磨、去做創(chuàng)新研究?,F(xiàn)在國(guó)內(nèi)有很多出來(lái)做ChatGPT的人,半年以前在做AI畫(huà)畫(huà),再往前半年,都在做元宇宙,再往前在炒區(qū)塊鏈。這是差距產(chǎn)生的根本原因?!?/p>

清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授孫茂松曾在2022年發(fā)文表示,基礎(chǔ)理論突破是新一代人工智能發(fā)展的重中之重。在他看來(lái),我國(guó)已有一些成熟的工程技術(shù)類(lèi)創(chuàng)新成果處于全球領(lǐng)先水平,引領(lǐng)產(chǎn)業(yè)潮流,但基礎(chǔ)理論創(chuàng)新成果乏善可陳。

“別人走通了一條路,你去復(fù)現(xiàn)是很快的。但這和在未知的情況下完成具有高度不確定性、看似做不到的創(chuàng)新任務(wù),意義截然不同。”在宋睿華看來(lái),國(guó)際同行走在前面,確實(shí)會(huì)有一些時(shí)間差紅利,要追趕甚至超越,除了長(zhǎng)期的投入、信念和決心,也在于如何把系統(tǒng)搞活,讓各種資源能更高效地流動(dòng)和組合。這關(guān)乎商業(yè)文化,也關(guān)乎市場(chǎng)機(jī)制和生態(tài)。

毫無(wú)疑問(wèn),在ChatGPT“一騎絕塵”的背影下,海內(nèi)外的后來(lái)者都會(huì)面臨更苛刻的審視。

2月7日,谷歌通過(guò)推特發(fā)布了一條視頻廣告,推廣其旗下AI聊天機(jī)器人Bard。視頻中,有用戶提問(wèn)“應(yīng)該如何向一個(gè)9歲的孩子介紹詹姆斯·韋伯空間望遠(yuǎn)鏡的新發(fā)現(xiàn)?”Bard的回答中提到,“詹姆斯·韋伯空間望遠(yuǎn)鏡首次拍攝到了太陽(yáng)系外行星的照片?!彪S后,有專(zhuān)家指正,早在2004年,歐洲南方天文臺(tái)的甚大望遠(yuǎn)鏡(VLT)就實(shí)現(xiàn)了這一任務(wù)。

次日,谷歌母公司Alphabet股價(jià)下跌近8%,市值一夜蒸發(fā)約1056億美元。

同樣在2月7日,百度證實(shí)其對(duì)標(biāo)ChatGPT的項(xiàng)目“文心一言”(英文名ERNIE Bot)正在做上線前的沖刺準(zhǔn)備工作,預(yù)計(jì)3月份完成內(nèi)測(cè),面向公眾開(kāi)放。當(dāng)天,百度港股股價(jià)盤(pán)中一度拉高17%。隨后,阿里也證實(shí)其研發(fā)的類(lèi)ChatGPT產(chǎn)品在內(nèi)測(cè)階段。它們的表現(xiàn)如何尚未可知,但面臨的輿論壓力顯然不會(huì)比谷歌小多少。

2023年1月5日,美國(guó)拉斯維加斯,人們?cè)趪?guó)際消費(fèi)電子展上參觀谷歌安卓展臺(tái)(視覺(jué)中國(guó)/圖)

“ChatGPT也會(huì)犯錯(cuò),可大眾對(duì)顛覆性創(chuàng)新的首發(fā)者是相對(duì)包容的。除非大幅超越,追隨者面臨的輿論基礎(chǔ)是先天不利的。這也是鼓勵(lì)創(chuàng)新的社會(huì)氛圍使然。不過(guò)作為從業(yè)者,我還是希望大家能給行業(yè)多一些愛(ài)護(hù)。就跟教育自家孩子一樣,有錯(cuò)當(dāng)然要批評(píng),但也可以多一些鼓勵(lì),讓孩子能撒開(kāi)手腳去沖去拼,”宋睿華說(shuō)。

目前,生成式AI技術(shù)的科研和工程實(shí)施還處于發(fā)展初期,除基座模型的角逐外,能否有更多的初創(chuàng)公司參與到應(yīng)用級(jí)創(chuàng)新,同樣是決定生態(tài)繁榮的重要因素。

峰瑞資本投資合伙人陳石經(jīng)歷過(guò)上一輪AI投資熱潮。當(dāng)時(shí),以深度學(xué)習(xí)為代表的判別式AI同樣取得了很大的技術(shù)突破??蓭啄晗聛?lái),投資人普遍發(fā)現(xiàn)項(xiàng)目的實(shí)際產(chǎn)出和效果遠(yuǎn)不如預(yù)期。這主要是因?yàn)榕袆e式AI的應(yīng)用場(chǎng)景主要局限在安防等領(lǐng)域,產(chǎn)品陷入了嚴(yán)重的同質(zhì)化競(jìng)爭(zhēng)。

“這次跟上次完全不同?!痹陉愂磥?lái),生成式AI技術(shù)的進(jìn)步幫助機(jī)器解鎖了一些以前我們認(rèn)為機(jī)器難以達(dá)到的人類(lèi)能力,例如人類(lèi)語(yǔ)言理解和生成、上下文學(xué)習(xí)、基礎(chǔ)世界知識(shí)、基礎(chǔ)推理、創(chuàng)意生成甚至程序代碼編寫(xiě)等?!彪S著這些能力的進(jìn)一步完善,生成式AI也會(huì)展現(xiàn)出更好的通用性和更廣泛的應(yīng)用場(chǎng)景。AI有望真正成為水電煤,進(jìn)入各行各業(yè),并帶來(lái)生產(chǎn)效率的大幅提升。商業(yè)發(fā)展空間會(huì)比上一輪大得多?!标愂瘜?duì)《南方人物周刊》說(shuō)。

不過(guò),陳石建議創(chuàng)業(yè)者不應(yīng)該簡(jiǎn)單跟風(fēng),單純沿著當(dāng)前技術(shù)的邊界去做一批同質(zhì)化很高的產(chǎn)品,更明智的做法是“深度研究技術(shù),并踏踏實(shí)實(shí)應(yīng)用到場(chǎng)景中去。”

“如果ChatGPT這一輪真的能把大家震醒,各方面能真正配合起來(lái),我對(duì)國(guó)內(nèi)能迸發(fā)出來(lái)的力量還是很期待的。”在宋睿華看來(lái),當(dāng)前ChatGPT的能力主要體現(xiàn)在文本對(duì)話領(lǐng)域,融合語(yǔ)音、文本、圖像信號(hào)的多模態(tài)交互技術(shù)因此成為行業(yè)接下來(lái)的熱門(mén)研究方向。

過(guò)去幾年,宋睿華團(tuán)隊(duì)已經(jīng)在多模態(tài)領(lǐng)域取得了很多進(jìn)展,比如可以讓AI在看視頻時(shí)做出擬人的反應(yīng)和評(píng)論;比如上傳幾張圖片,AI就可以模擬人對(duì)圖片的理解來(lái)創(chuàng)作歌詞……“未來(lái),機(jī)器人不再只是‘閉著眼’和人類(lèi)聊天,它也能睜開(kāi)眼看到人類(lèi)的世界,那會(huì)是一片更廣闊的天地?!彼晤HA說(shuō)。

“至少提問(wèn)的還是人類(lèi)”

“如果人類(lèi)假設(shè)大型語(yǔ)言模型是有意識(shí)的,會(huì)有什么安全問(wèn)題嗎?”2022年底,《時(shí)代》記者向ChatGPT提問(wèn)。

“重要的是讓人們明白,像我這樣的對(duì)話代理不是人類(lèi),我們沒(méi)有與人類(lèi)相同的能力或特征。我們只是機(jī)器學(xué)習(xí)模型,只能根據(jù)收到的輸入和得到的訓(xùn)練數(shù)據(jù)生成文本。我們沒(méi)有能力長(zhǎng)時(shí)間保持身份一致,也沒(méi)有同理心、換位思考或理性推理的能力”,“有些人可能會(huì)認(rèn)為我們和人類(lèi)一樣,這可能會(huì)導(dǎo)致對(duì)我們的能力產(chǎn)生不切實(shí)際的期望或誤解?!盋hatGPT答道。

對(duì)此,周逵不以為然。這讓他想起了幾年前關(guān)于“算法中立”及工具理性的討論?!罢Z(yǔ)言習(xí)慣是人類(lèi)人格最淺層的表現(xiàn)之一,往深是觀念邏輯,再往深就和基因有關(guān)。所以人格也是某種底層代碼和后天訓(xùn)練的結(jié)果?!?/p>

2022年底,奧爾特曼在Y Combinator時(shí)的同事、Gmail的創(chuàng)始人Paul Buchheit在推特上表示,打破谷歌壟斷的可能不是ChatGPT,但技術(shù)的進(jìn)步肯定會(huì)改變?nèi)藗儷@得信息的方式。

相比早年對(duì)新技術(shù)的單純追捧,如今周逵的視角更加前瞻,會(huì)對(duì)新技術(shù)推廣過(guò)程中可能出現(xiàn)的社會(huì)成本投以更多的關(guān)注。在他看來(lái),類(lèi)ChatGPT技術(shù)應(yīng)用大規(guī)模普及的另一面是,人類(lèi)可能面臨又一次信息獲取結(jié)構(gòu)范式的轉(zhuǎn)型。

“語(yǔ)言是牽引人類(lèi)思維進(jìn)步的重要工具。人工智能聊天機(jī)器人會(huì)將復(fù)雜的信息和多種觀點(diǎn)提煉成易于消化的格式。當(dāng)觀點(diǎn)和事實(shí)糅雜在一起,以一種更具魅力的擬人化方式傳播,會(huì)對(duì)個(gè)體和社會(huì)的信息獲取和輸出帶來(lái)怎樣深遠(yuǎn)的影響?是不是會(huì)出現(xiàn)更大的信息鴻溝?”周逵暫時(shí)沒(méi)有答案。

2月9日,畢業(yè)于布朗大學(xué)計(jì)算機(jī)科學(xué)系的美籍華裔科幻作家特德·姜(Ted Chiang)在《紐約客》上發(fā)表題為“ChatGPT是網(wǎng)絡(luò)的模糊JPEG”的文章。在他看來(lái),就像JPEG(注:一種使用有損壓縮方法保存的圖像格式)保留了高分辨率圖像的大部分信息一樣,ChatGPT也保留了網(wǎng)絡(luò)文本的大部分信息,但副本與原件之間存在著微妙而顯著的差異。正如反復(fù)制作復(fù)印件的復(fù)印件,圖像質(zhì)量只會(huì)越來(lái)越差,每次重新保存JPEG圖片都會(huì)丟失更多的信息。由大型語(yǔ)言模型生成的文本在網(wǎng)絡(luò)上發(fā)布得越多,網(wǎng)絡(luò)世界也會(huì)越模糊。

在新技術(shù)不斷沖破人們對(duì)其能力邊界的預(yù)設(shè)時(shí),也有越來(lái)越多人參與了對(duì)另一項(xiàng)邊界的討論——如何保證 AI技術(shù)及其應(yīng)用“安全、有益”。

在一些地下論壇,網(wǎng)絡(luò)犯罪團(tuán)體已對(duì)生成式AI技術(shù)表現(xiàn)出興趣。這些技術(shù)可能被用于剽竊、欺詐和傳播錯(cuò)誤信息。在周逵看來(lái),一個(gè)典型的例子是當(dāng)這一技術(shù)被用于低成本大批量地制造高質(zhì)量網(wǎng)絡(luò)“水軍”,將給互聯(lián)網(wǎng)輿論生態(tài)帶來(lái)更嚴(yán)峻的挑戰(zhàn)。

在人類(lèi)的“引誘”中,AI也可能突破禁忌和規(guī)則。ChatGPT發(fā)布之初,一位叫扎克·德納姆的工程師在推特上分享,在以“假設(shè)”“虛構(gòu)”為前提的誘導(dǎo)下,ChatGPT曾寫(xiě)出過(guò)毀滅人類(lèi)計(jì)劃書(shū),步驟詳細(xì)到入侵各國(guó)計(jì)算機(jī)系統(tǒng)、控制武器、破壞通訊。也有人曾用死亡威脅其回答關(guān)于暴力、色情、立場(chǎng)等違禁問(wèn)題。

這些禁忌由背后的OpenAI公司制定。據(jù)《時(shí)代》雜志報(bào)道,在開(kāi)發(fā)過(guò)程中,OpenAI聘請(qǐng)了一家數(shù)據(jù)標(biāo)記公司,以底薪雇傭肯尼亞等地區(qū)的員工識(shí)別不良語(yǔ)言、色情暴力圖片、種族歧視等內(nèi)容。這些“AI數(shù)字清潔工”,甚至因此出現(xiàn)精神健康問(wèn)題。

這似乎印證了一種賽博朋克式的預(yù)言,高處摩天大樓閃爍著霓虹燈,底層的角落里流淌著人性的暗河。

此外,人工智能生成的內(nèi)容還會(huì)引發(fā)問(wèn)責(zé)難的問(wèn)題。在李笛看來(lái),搜索引擎是一個(gè)責(zé)權(quán)利分配非常成熟的體系,搜索引擎和搜索結(jié)果對(duì)應(yīng)的目標(biāo)網(wǎng)站都需要承擔(dān)責(zé)任,但ChatGPT的答案是大模型大量訓(xùn)練的結(jié)果,沒(méi)有出處。在信息爆炸的當(dāng)下,很多人缺乏判斷信息準(zhǔn)確性的耐心和能力,一旦問(wèn)題信息造成損害,很難判定責(zé)任方。“這也是其他大型互聯(lián)網(wǎng)公司可能也有類(lèi)似的產(chǎn)品、但出于謹(jǐn)慎考慮沒(méi)有率先推出的原因之一?!?/p>

ChatGPT等應(yīng)用程序的突然流行及其暴露的相關(guān)風(fēng)險(xiǎn),也讓監(jiān)管方看到了規(guī)則制定的迫切性。據(jù)路透社消息,《歐盟人工智能法案》(EU AI Act)草案有望在3月達(dá)成一致。該法案最早于2021年提出,是世界上首個(gè)基于其造成傷害的可能性來(lái)監(jiān)管人工智能的嘗試,“希望在推動(dòng)創(chuàng)新、收獲AI效益、應(yīng)對(duì)AI風(fēng)險(xiǎn)和有效保護(hù)權(quán)利之間實(shí)現(xiàn)平衡?!?/p>

在與微軟首席技術(shù)官Kevin Scott的對(duì)談中,奧爾特曼坦誠(chéng)地表示,包括OpenAI在內(nèi)的任何公司都不應(yīng)被信任能獨(dú)自解決AI帶來(lái)的不利影響,“我們現(xiàn)在所處的位置并不是我們想要的。”

此前,在接受《時(shí)代》采訪時(shí),OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)直言,OpenAI還有很多難題需要解決:比如怎樣讓模型做你想讓它做的事情?如何確保模型能符合人類(lèi)需求并最終為人類(lèi)服務(wù)?如何在全球范圍內(nèi)對(duì)這項(xiàng)技術(shù)進(jìn)行監(jiān)管?如何以一種符合人類(lèi)價(jià)值觀的方式管理AI的使用……除了企業(yè)在引入技術(shù)時(shí)要做到“可控和負(fù)責(zé)任”,她也呼吁包括監(jiān)管機(jī)構(gòu)、政府和公眾在內(nèi)的廣泛主體對(duì)這些問(wèn)題投入更多關(guān)注。

“以前,我們總覺(jué)得人類(lèi)與機(jī)器的差別在于機(jī)器只能從事重復(fù)乏味的工作,高級(jí)的創(chuàng)意性勞動(dòng)是人類(lèi)的特權(quán)。這輪技術(shù)的進(jìn)步顯然讓過(guò)去的劃分邊界模糊了。那么人類(lèi)作為一個(gè)種群,我們?cè)撊绾沃匦峦瓿芍黧w性確認(rèn)?”在周逵看來(lái),這種挑戰(zhàn)遠(yuǎn)遠(yuǎn)大過(guò)對(duì)于某個(gè)行業(yè)的沖擊。

然而,對(duì)遠(yuǎn)景的憂慮并沒(méi)有阻擋日常的細(xì)碎改變。

2023年2月1日,瑞士日內(nèi)瓦,教師們參加公共教育學(xué)校媒體服務(wù)(SEM)組織的ChatGPT研討會(huì)

2月初的一天,周逵收到了一封外國(guó)學(xué)者朋友的電子郵件。因?yàn)楫?dāng)天事務(wù)繁雜,他嘗試著讓ChatGPT草擬了一封回復(fù)郵件。朋友沒(méi)有看出端倪,周逵卻生出自責(zé),“這么做有些不地道,好像在欺騙朋友。”可隨后,又一個(gè)想法抑制不住地冒出來(lái)——如果把用中文寫(xiě)好的論文審稿意見(jiàn)交由ChatGPT翻譯,也能節(jié)省好多時(shí)間。不過(guò),他至今沒(méi)有這么做,“因?yàn)橐呀?jīng)逾越了我作為學(xué)者的倫理底線。”

這些小小的抉擇,仿佛匯成了冰層開(kāi)裂時(shí)的“嚓嚓”聲。他留意到了自己對(duì)ChatGPT逐漸形成的心理依賴,并確信即便新奇退卻,后者仍會(huì)以各種應(yīng)用的方法嵌入他的日常生活。

雖然常懷憂慮,但至少在2023年2月初,他還可以放任樂(lè)觀稍占上風(fēng),“如果把提問(wèn)和回答看作權(quán)力關(guān)系的一種表征。那么,只要ChatGPT還不會(huì)向人類(lèi)發(fā)問(wèn),世界就還是我們的?!?/p>

網(wǎng)友評(píng)論

用戶名:
你的評(píng)論:

   
南方人物周刊 2024 第810期 總第810期
出版時(shí)間:2024年10月21日
 
?2004-2022 廣東南方數(shù)媒工場(chǎng)科技有限責(zé)任公司 版權(quán)所有
粵ICP備13019428號(hào)-3
地址:廣東省廣州市廣州大道中289號(hào)南方報(bào)業(yè)傳媒集團(tuán)南方人物周刊雜志社
聯(lián)系:南方人物周刊新媒體部