近日,歐愛運營有限責任公司(OPENAI OPCO,LLC)在中國申請注冊2枚“GPT-5”商標,引發(fā)廣泛關(guān)注。
在GPT-4爆火后,GPT-5成為了萬眾期待的下一個版本。
(資料圖片僅供參考)
當?shù)貢r間8月8日,OpenAI在官網(wǎng)介紹了新產(chǎn)品GPTBot,這是一種網(wǎng)絡(luò)爬蟲,可大規(guī)模爬取網(wǎng)絡(luò)數(shù)據(jù)用于訓練AI模型,據(jù)稱可以用來改進未來的聊天機器人大模型。
OpenAI在其官網(wǎng)發(fā)布的一篇博客文章中表示:“使用GPTBot用戶代理抓取的網(wǎng)頁可能會被用來改進未來的模型。”公司還補充稱,GPTBot可以提高內(nèi)容準確性,擴展未來迭代的能力。此外,由于OpenAI近期剛向美國專利商標局申請了GPT-5商標,國外不少科技媒體認為,OpenAI所指的這個“未來迭代”就是GPT-5。
據(jù)悉,它將具備眾多GPT-4所沒有的能力,而且?guī)缀趺恳豁椂紕χ竿ㄓ萌斯ぶ悄堋?/p>
另外,值得注意的是,截至上周五美股收盤,英偉達一周累跌8.56%,接近失守1萬億美元市值關(guān)口。華爾街警告:AI概念股泡沫正在接近頂峰。
OpenAI提交GPT-5商標申請
網(wǎng)絡(luò)爬蟲是一種主要通過瀏覽網(wǎng)絡(luò)抓取數(shù)據(jù)的工具,方式包括數(shù)據(jù)挖掘,網(wǎng)頁數(shù)據(jù)復制/拍照、網(wǎng)站鏡像等方式。網(wǎng)絡(luò)爬蟲是互聯(lián)網(wǎng)和大數(shù)據(jù)時代最重要工具之一,被譽為“黃金礦工”,應用場景非常廣泛。例如,谷歌、必應等搜索引擎通過網(wǎng)絡(luò)爬蟲來收集和建立網(wǎng)頁索引,方便用戶通過關(guān)鍵字快速找到相關(guān)的網(wǎng)頁。
OpenAI表示,網(wǎng)絡(luò)爬蟲將從互聯(lián)網(wǎng)上收集公開可用的數(shù)據(jù),但會過濾掉需要付費的內(nèi)容來源或個人身份信息的消息來源,以及有違反其規(guī)定的文本來源。需要指出的是,網(wǎng)站的所有者可以通過在服務器上的標準文件中添加“disallow(禁止)”指令來拒絕網(wǎng)絡(luò)爬蟲。
《每日經(jīng)濟新聞》記者注意到,在發(fā)布GPTBot前,OpenAI還在美國申請了GPT-5的商標,這被認為是當前被廣泛使用的GPT-4的升級迭代版本。
該申請被OpenAI于當?shù)貢r間7月18日提交給美國專利商標局,涵蓋了“GPT-5”在基于人工智能的人類語音和文本、音頻到文本轉(zhuǎn)換、語音識別和語音合成中的使用。在這份新商標申請中,OpenAI 將“GPT-5”描述為一種“用于使用語言模型的可下載計算機軟件”。
在這次披露的申請書中,OpenAI提到,尚未發(fā)布的GPT-5將具備眾多GPT-4所沒有的能力,而且?guī)缀趺恳豁椂紕χ竿ㄓ萌斯ぶ悄埽ˋGI)。
OpenAI最先提到的一個變化,就是多模態(tài)功能的加強。具體來說,GPT-5的功能包括把文本或語音從一種語言翻譯成另一種語言、語音識別、生成文本和語音等。有觀點認為,文件中突出的語音識別功能,看似只是一個不起眼的改動,但從某種程度上說,這也是OpenAI對GPT-5在通往AGI的道路上鋪下的又一塊路磚。
除了上述特點外,OpenAI提交的文件中還提到:“GPT-5可能還具備學習、分析、分類和回應數(shù)據(jù)的能力”。從目前人工智能的發(fā)展趨勢來看,這很可能是指GPT-5具備了類似智能體的主動學習能力。而這樣的能力,將會使GPT-5與以往只能被動地通過人類投喂數(shù)據(jù)來學習新知識的模型相比,產(chǎn)生本質(zhì)的區(qū)別。
具體來說,主動學習的能力,是指模型可以根據(jù)自身的目標和需求,自主地選擇、獲取和處理數(shù)據(jù),而不是僅僅依賴于人類提供的數(shù)據(jù)。
這樣可以讓模型更有效地利用數(shù)據(jù)中的信息和知識,更靈活地適應不同的數(shù)據(jù)環(huán)境和任務場景,而不只是被動地接收和輸出數(shù)據(jù)。而這樣的能力,在GPT-5面臨一些比較陌生、垂直的領(lǐng)域時,就顯得尤為重要。
如果GPT-5具備了主動學習的能力,它可以自動地從網(wǎng)絡(luò)上搜集和更新這些領(lǐng)域的相關(guān)數(shù)據(jù),分析和分類這些領(lǐng)域的基本概念、重要原理和最新動態(tài),以及回應這些領(lǐng)域的常見問題、典型案例和實際應用。
《每日經(jīng)濟新聞》記者還注意到,GPT-3.5有1750億參數(shù)規(guī)模,OpenAI沒有公布過GPT-4的具體規(guī)格,但之后的分析認為其擁有16個專家模型,每個NLP(Natural language processing,自然語言處理)專家大約有1110億個參數(shù),總計1.8萬億參數(shù),是GPT-4的10倍。如果按照這個比例來提升,GPT-5將突破10萬億參數(shù),有望成為最大規(guī)模的大語言模型。
GPT-5仍可能在未來重新定義AI
雖然目前GPT-5仍然處于理論概念的階段,但它仍可能會在未來重新定義人工智能,并有可能達到通用人工智能的高度。
GPT是一種大型語言模型神經(jīng)網(wǎng)絡(luò),可以執(zhí)行并回答問題、生成代碼和總結(jié)文本等任務。通過掃描數(shù)以百萬計的網(wǎng)絡(luò)文章和數(shù)據(jù),GPT模型可以生成真實和非剽竊的內(nèi)容。目前,GPT-5已經(jīng)成為全球科技界廣泛期待和猜測的話題。盡管OpenAI沒有給出官方的GPT-5上線日期,但各路專家早已在各大論壇上分享見解。
據(jù)外媒報道,GPT-5有望顯著減少回答所包含的錯誤內(nèi)容,OpenAI可能會通過先進的訓練方法來解決這個問題。此外,GPT-5或?qū)⒕哂懈叩挠嬎阈剩瑥亩鴵碛懈斓捻憫獣r間。雖然具體的細節(jié)尚未透露,但人們相信GPT-5可能會通過突破自然語言理解、上下文推理和整體語言流暢性等領(lǐng)域的界限,為AGI做出貢獻。
一位名為 Siqi Chen 的開發(fā)者在Twitter 上發(fā)文稱,GPT-5 預計將在今年年底完成訓練,并有可能實現(xiàn)通用人工智能(AGI)。AGI旨在創(chuàng)建無需顯式編程即可執(zhí)行任何智力任務的智能系統(tǒng)。如果 GPT-5 實現(xiàn) AGI,它可以顯著提高生產(chǎn)力并自動執(zhí)行復雜的認知任務。
不幸的是,外界目前只能從OpenAI申請商標的動作來對其計劃進行推測,這也并不一定表明OpenAI何時或是否計劃推出GPT-5。就在今年6月份,OpenAI創(chuàng)始人兼CEO山姆·阿特曼表示,公司距離開始培訓GPT-5“還差的很遠”,他解釋稱,在開始(訓練GPT-5)之前還需要進行廣泛的安全審核?!霸趩覩PT-5之前,我們還有很多工作要做?!卑⑻芈?月份在一次會議上說道。
還有外媒分析認為,更有可能的結(jié)果是,OpenAI將把精力集中在改進GPT-4模型上,而不是把所有的資源都投入到下一個大語言模型的迭代中。
與此同時,OpenAI最近的數(shù)據(jù)收集策略還引起了外界的關(guān)注,尤其是圍繞版權(quán)和用于許可的問題。例如,今年4月,意大利監(jiān)管機構(gòu)還指控ChatGPT違反了多項歐盟隱私法律,隨后將ChatGPT進行了“封殺”;今年6月,日本隱私監(jiān)管機構(gòu)就未經(jīng)許可收集敏感數(shù)據(jù)向OpenAI發(fā)出了警告。6月下旬,16名原告對OpenAI提起集體訴訟,指控其從ChatGPT用戶交互中獲取私人信息。
此外,OpenAI還收到了GitHub Copilot的訴訟,原告稱代碼生成工具侵犯了開發(fā)者的權(quán)利,因為它在沒有提供適當歸屬的情況下抓取了他們的代碼。如果這些指控屬實,OpenAI以及同樣被列為被告的微軟,將違反《計算機欺詐和濫用法案》(Computer Fraud and Abuse Act),這部法律的應用在網(wǎng)絡(luò)抓取案件方面有先例。
(文章來源:每日經(jīng)濟新聞)
關(guān)鍵詞:
- GPT-5要來了?驚現(xiàn)兩大變化 參數(shù)或達10萬億級別!
- AI巨頭大消息!董事長套現(xiàn)超23億 參與定增盈利頗豐!影響多大?
- 大模型商用浪潮即將開啟 《生成式人工智能服務管理暫行辦法》今起施行
- 罕見!全球“大動脈”告急 危險風暴直擊美國 超級泡沫要破?華爾街大佬預警
- 保險業(yè)大事!上海再保險中心邁出一大步,7家公司獲批
- 國聯(lián)證券給予九洲藥業(yè)買入評級
- 民生證券給予超圖軟件推薦評級
- 高瓴旗下HHLR二季度13F披露:繼續(xù)加碼中概股 增持微軟并新進谷歌
- 一拍驚人!大中礦業(yè)溢價1317倍競得川西鋰礦,42億成交價錢從何來?
- 華金證券給予澳華內(nèi)鏡增持評級
- 阿富汗東部城市發(fā)生爆炸 致3人死亡7人受傷
- 挪威軍機接近俄領(lǐng)空 俄戰(zhàn)機緊急升空攔截
- 中央財辦等九部門印發(fā)指導意見推動農(nóng)村流通高質(zhì)量發(fā)展
- 草原門戶,西海屏風——湟源日月山,還藏著文成公主落淚的傳說
- 年紀輕輕咋就患上血山崩?病因有哪些?如何防治?
- 【守望相助一家親】團結(jié)村里話團結(jié)
- 以科技創(chuàng)新推動城市綠色低碳轉(zhuǎn)型 鄂爾多斯啟動十項“無廢城市”重點科技研發(fā)項目
- 消失近半個世紀的蒙古郁金香重現(xiàn)大興安嶺
- 內(nèi)蒙古自治區(qū)政府采購平臺線上合同融資突破5億元
- 哥倫比亞政府與“哥倫比亞民族解放軍”舉行第四輪和談