短短幾日,OpenAI 的聊天機(jī)器人ChatGPT 席卷了互聯(lián)網(wǎng),用戶數(shù)輕而易舉突破百萬(wàn)。
答疑解惑、編寫(xiě)代碼、撰寫(xiě)論文、創(chuàng)作詩(shī)歌和鋼琴曲,當(dāng)人類絞盡腦汁設(shè)下「九九八十一難」,ChatGPT 基本問(wèn)什么答什么,就算不會(huì)也能編得像模像樣。
(資料圖片僅供參考)
到目前為止,在推向大眾的文本生成 AI 里,ChatGPT 是最好的那一個(gè),更何況還免費(fèi)使用。
當(dāng) ChatGPT 春風(fēng)得意馬蹄疾,也有人看到它光環(huán)下的失意,程序員和文字工作者的飯碗可能不保,連 Google 等傳統(tǒng)搜索引擎也可能被它革了命。
有了搜索引擎,我們依然需要花大量時(shí)間翻網(wǎng)頁(yè)找答案,如果 AI 能直接把答案遞到你眼前,還能保證正確率,那豈不是更好?
但問(wèn)題就在于「如果」。
ChatGPT:我無(wú)法與 Google 相比
12 月 1 日,開(kāi)發(fā)人員 Josh Kelly 曬出同一個(gè)代碼問(wèn)題在 Google 和 ChatGPT 的不同結(jié)果,ChatGPT的答案看起來(lái)質(zhì)量更高,讓他感嘆「Google is done」(Google 完蛋了)。
初出茅廬的 ChatGPT,真的把刀架在 Google 搜索的脖子上了嗎?
先看看兩者在定義上的區(qū)別。
搜索引擎的核心是海量信息集合,而非信息創(chuàng)造。你在搜索框輸入關(guān)鍵字,搜索引擎根據(jù)算法,抓取、索引、排序與你的查詢匹配的結(jié)果,然后你看到了大量的鏈接,再?gòu)闹袑ふ易约盒枰男畔ⅰ?/p>
而 ChatGPT 屬于 AIGC(人工智能生產(chǎn)內(nèi)容),是一種新的內(nèi)容創(chuàng)作方式。它已經(jīng)被數(shù)據(jù)集訓(xùn)練完畢,通過(guò)一對(duì)一的對(duì)話和類似人類的口吻,給出單一、即時(shí)的答案,還能結(jié)合上下文,實(shí)現(xiàn)多輪對(duì)話,幫你解決更為復(fù)雜的、連續(xù)性的問(wèn)題。
你可以一步步引導(dǎo)規(guī)則,讓它設(shè)計(jì)游戲等產(chǎn)品,或者給它一段程序,讓它檢查 bug,還可以給它演示案例,讓它舉一反三?;?dòng)越復(fù)雜,ChatGPT 的能力也會(huì)越豐富,只當(dāng)一個(gè)回合的搜索引擎用,倒有些「屈才」。
比傳統(tǒng)的聊天機(jī)器人更聰明,比人類的問(wèn)答網(wǎng)站更快捷,ChatGPT 讓查找信息的過(guò)程更加直觀和簡(jiǎn)單。
一個(gè)是生成式搜索,一個(gè)是大規(guī)模搜索,目前的 ChatGPT 還遠(yuǎn)遠(yuǎn)取代不了 Google。
在 ChatGPT 的基礎(chǔ)設(shè)定里,信息的時(shí)效性已經(jīng)落后了。ChatGPT 基于互聯(lián)網(wǎng)的數(shù)十億個(gè)文本示例訓(xùn)練,學(xué)習(xí)生涯停留在了 2021 年,它也沒(méi)有聯(lián)網(wǎng),不實(shí)時(shí)調(diào)用外部網(wǎng)絡(luò)資源,無(wú)法像 Google 地圖般根據(jù)位置為你推薦餐館,不能幫你打開(kāi) Twitter、Facebook。
相比之下,Google 既有龐大的索引網(wǎng)站數(shù)據(jù)庫(kù),也提供圖像、地圖等功能和工具,讓你快速訪問(wèn)其他網(wǎng)站更是它的「基本素養(yǎng)」。事實(shí)上,Google 最受歡迎的搜索就是「Facebook」「亞馬遜」等關(guān)鍵詞。
不過(guò),ChatGPT 被吐槽最多的還是它的準(zhǔn)確性,列對(duì)了雞兔同籠方程卻解錯(cuò),硬說(shuō)豆瓣的創(chuàng)始人不是阿北,腦洞大開(kāi)胡編亂造西游記結(jié)局,一本正經(jīng)地胡說(shuō)八道就罷了,偏偏語(yǔ)氣十分自信,也不提供資料來(lái)源。你使用搜索引擎時(shí),至少可以憑借多個(gè)信源交叉驗(yàn)證。
12 月 4 日,馬斯克透露 ChatGPT 可以訪問(wèn) Twitter 數(shù)據(jù)庫(kù),這意味著 ChatGPT 必然學(xué)習(xí)了許多缺少事實(shí)核查的數(shù)據(jù)。正因?yàn)槔鸢阜簽E,程序員問(wèn)答網(wǎng)站 Stack Overflow 從 12 月 5 日開(kāi)始,暫時(shí)禁止用戶分享 ChatGPT 生成的內(nèi)容。
另外,ChatGPT 的回答混入了不少片湯話,被調(diào)侃為「水文神器」。OpenAI 解釋,這主要是因?yàn)橛?xùn)練數(shù)據(jù)偏差(訓(xùn)練者更喜歡看起來(lái)更全面的、更長(zhǎng)的答案)和過(guò)度優(yōu)化。
種種不足擺在臺(tái)面上,ChatGPT 暫時(shí)不會(huì)威脅到搜索引擎。
《2001 太空漫游》的 AI 殺人事件.
雖然 ChatGPT 比其他 AI 更像人了,本質(zhì)上還是「隨機(jī)鸚鵡」,離不開(kāi)大模型、大數(shù)據(jù)、大算力,它的知識(shí)來(lái)自訓(xùn)練數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律,并不理解自己所說(shuō)的話。12 月 5 日,《時(shí)代》雜志「專訪」了 ChatGPT,在被問(wèn)到「大型語(yǔ)言模型有哪些限制」時(shí),ChatGPT 回答道:
大型語(yǔ)言模型的一個(gè)限制是,我們無(wú)法理解我們生成的單詞的上下文或含義。我們只能根據(jù)給定的訓(xùn)練數(shù)據(jù),根據(jù)某些單詞或單詞序列一起出現(xiàn)的概率來(lái)生成文本。這意味著我們無(wú)法為我們的回答提供解釋或推理,并且我們可能不會(huì)總是生成完全連貫或在對(duì)話上下文中有意義的回答。
但 ChatGPT 回避了一個(gè)問(wèn)題:什么是理解?「理解」是屬于人類的概念,它能否用在 ChatGPT?如果能用,它的理解是否約等于「生成有意義的回答」這個(gè)結(jié)果,論跡不論心?
至少在未來(lái)一段時(shí)間內(nèi),我們或許更需要擔(dān)心,當(dāng)越來(lái)越多的網(wǎng)絡(luò)內(nèi)容由類似的模型生成,搜索引擎給出的結(jié)果,質(zhì)量是會(huì)提高還是降低。
我還問(wèn)了問(wèn) ChatGPT 本尊,它的態(tài)度十分謙虛,不覺(jué)得應(yīng)該拿它和 Google 比較:
我是一個(gè)大型語(yǔ)言模型,無(wú)法與 Google 或任何其他搜索引擎進(jìn)行比較。我的目的是通過(guò)回答用戶的提問(wèn)來(lái)幫助用戶獲得信息,而不是提供搜索功能。與搜索引擎相比,我的優(yōu)勢(shì)在于能夠回答復(fù)雜的問(wèn)題,并且可以提供更加個(gè)性化和詳細(xì)的信息。相比之下,我的劣勢(shì)在于無(wú)法提供搜索功能,也無(wú)法提供最新的信息。
AI 可能是搜索引擎的未來(lái)
雖然 ChatGPT 仍在起步,沒(méi)有在搜索上比 Google 做得更好,但它可能改變我們?cè)诰€搜索信息的方式,讓搜索技術(shù)更上一層樓。
眼下就有一個(gè)簡(jiǎn)單的例子,現(xiàn)在已經(jīng)有大量將 ChatGPT 嵌入 Google 的插件出現(xiàn),其中有些插件將 ChatGPT 的結(jié)果顯示在網(wǎng)頁(yè)右側(cè),一次搜索兼顧兩種體驗(yàn)。
再參照 ChatGPT 和圖像生成模型 Stable Diffusion 的聯(lián)動(dòng)(可能是因?yàn)?AI 更懂 AI,ChatGPT 的描述更容易被 Stable Diffusion 提取,最終的圖片質(zhì)量更高),ChatGPT 或許也可以用于解釋、指導(dǎo)關(guān)鍵詞,幫助我們更好地用搜索引擎查找信息。
此外,ChatGPT 的時(shí)效性、準(zhǔn)確性不足,也并非是無(wú)解的。
一方面,知乎答主、自然語(yǔ)言處理專家@張俊林指出,近乎實(shí)時(shí)地將新知識(shí)融入大規(guī)模語(yǔ)言模型,非常有挑戰(zhàn)性,一種解決辦法是,把它存到傳統(tǒng)搜索引擎的索引里,ChatGPT 如果回答不了時(shí)效性的問(wèn)題,可以轉(zhuǎn)向搜索引擎抽取對(duì)應(yīng)的答案。
另一方面,彭博社報(bào)道,OpenAI 正在開(kāi)發(fā)一個(gè)名為 WebGPT 的 AI 系統(tǒng),WebGPT 將能夠更準(zhǔn)確地回答問(wèn)題,甚至還能說(shuō)明引用的來(lái)源。
以上這些還是 AI 和搜索引擎的結(jié)合體。如果我們更大膽地設(shè)想一番,不考慮技術(shù)限制,拋去搜索引擎,存在一個(gè)無(wú)所不知的 AI,以易于理解的問(wèn)答形式,提供與問(wèn)題相關(guān)且準(zhǔn)確的信息,這是未來(lái)搜索的理想模樣嗎?
不少 AI 專家認(rèn)為愿景本身就有問(wèn)題。德國(guó)魏瑪包豪斯大學(xué)研究員 Benno Stein 表示,它可能隱藏現(xiàn)實(shí)世界的復(fù)雜性:
問(wèn)題不在于現(xiàn)有技術(shù)的局限性。即使擁有完美的技術(shù),我們也無(wú)法得到完美的答案。我們不知道什么是好的答案,因?yàn)槭澜绾軓?fù)雜,但當(dāng)我們看到這些直接的答案時(shí),我們會(huì)停止思考。
那么如何讓答案顯得更「復(fù)雜」?有人覺(jué)得,簡(jiǎn)單地提供一份文件清單,會(huì)比直接給出答案更有用;有人則建議,可以解釋答案并給出不同觀點(diǎn)的利弊,讓人既知其然也知其所以然。
圖片來(lái)自:Getty Images
但是大多數(shù)時(shí)候,本不存在真正的完美的答案,準(zhǔn)確、詳細(xì)這些衡量標(biāo)準(zhǔn),也更針對(duì)事實(shí)類、知識(shí)類問(wèn)題,而非那些天馬行空的開(kāi)放式命題。
以答案的準(zhǔn)確或者詳細(xì)與否框定 AI,反而有些「著相」。不妨讓我們回到上文提到的定位問(wèn)題,ChatGPT 是生成式搜索,Google 是大規(guī)模搜索,前者是 chat,后者是 search,它們?cè)诒举|(zhì)上就是不同的。
ChatGPT 火了一段時(shí)間了,我們對(duì)它有了一個(gè)大概的共識(shí):它的錯(cuò)誤答案不少,特別在知識(shí)類和事實(shí)類問(wèn)題上,但如果把它放在創(chuàng)作的一個(gè)環(huán)節(jié),可以用來(lái)激發(fā)靈感、提高生產(chǎn)力。
它不是搜索引擎,也不像聊天機(jī)器人,更像一個(gè)隨時(shí)供你咨詢的「超級(jí)大腦」。換句話說(shuō),ChatGPT 不一定會(huì)顛覆 Google,但它從根本上改變了我們和知識(shí)的相處形式,你可以和它談星星談月亮,從詩(shī)詞歌賦說(shuō)到人生哲學(xué)。
ChatGPT 對(duì)創(chuàng)造力、開(kāi)闊思維的激發(fā),可能比事實(shí)類信息的準(zhǔn)確性更加重要,它完全可以和搜索引擎、人類勞動(dòng)互相補(bǔ)充,不必你死我活,各自完成通向未知的一塊拼圖,這也是我們對(duì)「搜索」的根本需要。
搜索引擎不僅僅是個(gè)問(wèn)答機(jī)器
自 ChatGPT 橫空出世,不乏 Google 搜索將被取代的聲音。
其實(shí) Google 并沒(méi)有掉隊(duì),它在 DeepMind 的大型語(yǔ)言模型 Chinchilla 上訓(xùn)練 AI 聊天機(jī)器人 Sparrow,也開(kāi)發(fā)了對(duì)話神經(jīng)語(yǔ)言模型 LaMDA。
去年 5 月,Google 研究人員發(fā)了一篇題為「重新思考搜索」的論文,描述了一種新型搜索引擎:大型語(yǔ)言模型借助算法提供簡(jiǎn)潔的專業(yè)答案,用戶無(wú)需在大量網(wǎng)頁(yè)列表中搜索信息,聽(tīng)起來(lái)就是 ChatGPT 的模樣。
為什么 Google 沒(méi)有像 OpenAI 一樣,直接向大眾推出類似 ChatGPT 的產(chǎn)品,或者將它集成在自己的搜索之中?Alphabet 工程師@hncel認(rèn)為,問(wèn)題主要在于成本和延遲:
像 GPT 這樣的大型語(yǔ)言模型是 Google 主要研究的領(lǐng)域之一,Google 有大量預(yù)算與人員來(lái)處理這些模型,但在最大的 Google 產(chǎn)品(例如搜索、Gmail)中實(shí)際使用這些語(yǔ)言模型的經(jīng)濟(jì)性還不完全存在。發(fā)布有趣的測(cè)試版是一回事,但將它深入集成到一個(gè)每天服務(wù)數(shù)十億個(gè)請(qǐng)求的系統(tǒng)中,考慮到服務(wù)的成本、增加的延遲,則是另一回事。將成本降低至少 10 倍,才能將這樣的模型集成到搜索等產(chǎn)品中。
與此同時(shí),大型語(yǔ)言模型也會(huì)影響 Google 搜索當(dāng)前的商業(yè)模式——Google 母公司 Alphabet 2021 年收入 2576 億美元,約有 81% 來(lái)自廣告,其中大部分是 Google 的按點(diǎn)擊付費(fèi)廣告。
像 ChatGPT 這樣的 AI 大大減少了頁(yè)面數(shù)量,阻礙了人們?yōu)g覽和點(diǎn)擊更多廣告,那么廣告收入也會(huì)隨之下降。
話說(shuō)回來(lái),ChatGPT 的爆火,也讓我們或多或少地意識(shí)到,搜索引擎「索引、檢索和排序」的固有模式已經(jīng)統(tǒng)治了 20 多年,Google 每年都會(huì)對(duì)搜索引擎進(jìn)行數(shù)千次更改,其中大多數(shù)都很微小,并沒(méi)有發(fā)生根本性的變化。
1998 年,一對(duì)斯坦福大學(xué)的研究生發(fā)表了一篇關(guān)于新型搜索引擎的論文:
在這篇論文中,我們介紹了 Google,這是一種大規(guī)模搜索引擎的原型,它大量使用了超文本中的結(jié)構(gòu)。Google 有效地抓取和索引網(wǎng)絡(luò),并產(chǎn)生比現(xiàn)有系統(tǒng)更令人滿意的搜索結(jié)果。
過(guò)去的創(chuàng)新變成了現(xiàn)在的傳統(tǒng),Google 等傳統(tǒng)搜索引擎面臨的對(duì)手不止是未來(lái)的 AI。
比如,已經(jīng)有人將 TikTok 稱作「新的 Google」,國(guó)外網(wǎng)友使用 TikTok 搜索,有點(diǎn)像我們?cè)谛〖t書(shū)查找攻略,在美食、片單等領(lǐng)域確實(shí)好用。這背后隱藏著一個(gè)趨勢(shì):在 TikTok 和抖音「稱霸」的世界里,互聯(lián)網(wǎng)比以前更直觀、更視覺(jué)化、更具交互性,搜索也不例外。
但 TikTok 不至于真的動(dòng)搖 Google。如果查找更多信息、訪問(wèn)更多網(wǎng)站,你依然要回到 Google。
既然變化已經(jīng)發(fā)生,Google 也需要通過(guò)更自然、更直觀的方式,帶來(lái)更好的搜索體驗(yàn)。
近幾年來(lái),因?yàn)槿斯ぶ悄堋C(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)等方面的進(jìn)步,Google 一直向這個(gè)方向轉(zhuǎn)變,包括引入相機(jī)和麥克風(fēng)搜索、圖片和文本的多重搜索、地圖中的沉浸式視圖等等。
簡(jiǎn)單來(lái)說(shuō),Google搜索的輸入和輸出,都變得更加「多感官」,也變得更加主動(dòng),更能猜中用戶的心思。
機(jī)器學(xué)習(xí)模型 MUM 讓 Google 搜索引擎更「聰明」.
許多 Google 與搜索有關(guān)的項(xiàng)目仍在探索和測(cè)試階段,今年 9 月的年度 Search On 活動(dòng)上,負(fù)責(zé) Google 搜索產(chǎn)品的副總裁 Liz Reid 舉了一個(gè)未來(lái)可能的例子:
如果 Google 知道你對(duì)木工感興趣,它在回答你搜索的某個(gè)問(wèn)題之外,還會(huì)向你展示你不知道的新工具、你從未聽(tīng)說(shuō)過(guò)的 YouTube 博主,以及你可以去哪里學(xué)習(xí)新技能等等。
Liz Reid 相信,Google 搜索不僅僅是一個(gè)反應(yīng)快速的問(wèn)答機(jī)器,而是一個(gè)用于探索、發(fā)現(xiàn)、學(xué)習(xí)你還沒(méi)有明確答案的事物的系統(tǒng)。
某種程度上,迭代的搜索引擎也好,進(jìn)擊的通用 AI 模型也罷,一個(gè)是固有框架的微調(diào),一個(gè)是另起爐灶的改革,它們都在讓知識(shí)更容易被獲取,讓信息篩選更加智能,降低你的學(xué)習(xí)門(mén)檻,縮短你的學(xué)習(xí)過(guò)程。
Google 高級(jí)副總裁 Prabhakar Raghavan 提出了一個(gè)很有意思的觀點(diǎn),搜索還是一個(gè)遠(yuǎn)沒(méi)有解決的問(wèn)題,「如果你把所有的機(jī)器都給我,我仍然會(huì)被人類的好奇心和認(rèn)知所束縛」。
搜索得到更好的答案之前,我們要先知道如何提出問(wèn)題。未來(lái),組織資料的能力可能不再稀缺,基于個(gè)體經(jīng)驗(yàn)和情感的提問(wèn)能力和原創(chuàng)觀點(diǎn)更為珍貴。當(dāng)你被引到知識(shí)的大門(mén)前,人之為人的思辨性和創(chuàng)造力,則以前所未有的地位被凸顯出來(lái)。
關(guān)鍵詞: 搜索引擎 語(yǔ)言模型 機(jī)器學(xué)習(xí)
- 全球看熱訊:火爆全網(wǎng)的 ChatGPT,還干不掉 Google 搜索
- 全球焦點(diǎn)!三股冷空氣先后入侵 我國(guó)中東部氣溫將一路走低
- 一家生產(chǎn)食品的公司卻來(lái)關(guān)注“土壤”?朝日唯品說(shuō)這是“一件對(duì)的事情”
- 天天信息:三伏貼貼在哪個(gè)穴位(三伏貼有啥用?哪些人能貼?看完你就知道了)
- 世界頭條:湖廣高鐵(高鐵漢陽(yáng)站命名已定,光谷站略有遺憾)
- 天天最新:超20地鼓勵(lì)農(nóng)民進(jìn)城買房 專家:需求已明顯減少
- 【全球聚看點(diǎn)】深圳機(jī)場(chǎng)恢復(fù)8條國(guó)際客運(yùn)航線
- 普京:對(duì)俄石油限價(jià)將擾亂世界能源市場(chǎng)
- 三股冷空氣先后入侵 中東部氣溫將一路走低
- 新冠陽(yáng)性如何居家治療?怎么吃藥?專家解讀
- 每日熱文:抗原檢測(cè)應(yīng)該在什么時(shí)間點(diǎn)做?為什么出現(xiàn)癥狀后還是抗原陰性?專家科普
- 全球頭條:為什么關(guān)于新冠后遺癥的表述變了?專家:奧密克戎毒株還沒(méi)有明確后遺癥報(bào)告
- 中國(guó)海軍長(zhǎng)沙艦亮相“國(guó)際閱艦式”!
- 每日速看!猴頭菇的家常做法(李孃孃愛(ài)廚房之一一猴頭菇燉排骨(雞)湯)
- 湖北恩施利川(恩施州人口分布:利川市75.07萬(wàn)人,鶴峰縣17.47萬(wàn)人)
- 莫德納在香港設(shè)立辦事處 考慮在港研發(fā)新疫苗
- 【報(bào)資訊】深圳文博會(huì)定于12月27日-31日舉辦
- 全球最資訊丨長(zhǎng)三角跨省新生兒入戶全面信息化辦理 可“跨省異地出件”
- 沙特阿美與山東能源集團(tuán)就下游項(xiàng)目機(jī)會(huì)在中國(guó)開(kāi)展合作
- 每日精選:遼東灣斑海豹陸續(xù)“洄”家
- 低碳菜單引領(lǐng)寧波餐飲消費(fèi)新風(fēng)尚 試點(diǎn)將持續(xù)至今
- 深圳坪山打造餐飲服務(wù)食品安全示范高地 嚴(yán)守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場(chǎng)活
- 第三季度全國(guó)消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對(duì)機(jī)動(dòng)車檢測(cè)機(jī)構(gòu)開(kāi)展監(jiān)督抽查 規(guī)范機(jī)動(dòng)
- 天津北辰扎實(shí)做好價(jià)格監(jiān)管工作 維護(hù)安全有序市場(chǎng)
- 北京石景山開(kāi)展冬季供暖前特種設(shè)備安全專項(xiàng)檢查
- 陜西延安:開(kāi)展兒童化妝品專項(xiàng)檢查 規(guī)范化妝品市
- 北京海淀開(kāi)展商品條碼專項(xiàng)監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進(jìn)網(wǎng)絡(luò)直播營(yíng)銷治理顯成效 培育放心消費(fèi)直
- 1 全球看熱訊:火爆全網(wǎng)的 ChatGPT,還干不掉 Google 搜索
- 2 全球焦點(diǎn)!三股冷空氣先后入侵 我國(guó)中東部氣溫將一
- 3 一家生產(chǎn)食品的公司卻來(lái)關(guān)注“土壤”?朝日唯品說(shuō)這
- 4 天天信息:三伏貼貼在哪個(gè)穴位(三伏貼有啥用?哪些人
- 5 世界頭條:湖廣高鐵(高鐵漢陽(yáng)站命名已定,光谷站略
- 6 天天最新:超20地鼓勵(lì)農(nóng)民進(jìn)城買房 專家:需求已明
- 7 【全球聚看點(diǎn)】深圳機(jī)場(chǎng)恢復(fù)8條國(guó)際客運(yùn)航線
- 8 普京:對(duì)俄石油限價(jià)將擾亂世界能源市場(chǎng)
- 9 三股冷空氣先后入侵 中東部氣溫將一路走低
- 10 新冠陽(yáng)性如何居家治療?怎么吃藥?專家解讀