全球球精選!OpenAI擬發(fā)布新的開源語言模型,谷歌微軟相爭,開源AI得利-騰訊新聞
【資料圖】
劃重點
--OpenAI的開源替代品正在激增,性能上接近OpenAI和谷歌的專有模型。
--OpenAI準備向公眾發(fā)布一款全新的開源語言模型,但不大可能與GPT競爭。
--Meta之前發(fā)布開源機器學習模型LLaMA,讓學者們獲得訪問權限,最終或成大贏家。
騰訊科技訊 國外媒體日前撰文指出,最近幾周時間,開源大型語言模型方案激增。在人工智能領域最終能夠擊敗OpenAI和谷歌的并不是其他大型科技公司,而是免費試用、不限制使用次數的開源人工智能產品。以下為文章內容摘要:
今年2月,Facebook母公司Meta發(fā)布開源機器學習模型LLaMA,讓學者們能夠免費獲得這款能夠理解對話語言的復雜機器學習模型的訪問權限,人工智能產業(yè)由此迎來爆發(fā)式發(fā)展。幾周內,學者們把Meta提供的模型轉化為開源軟件,使它們成為ChatGPT和其他專有人工智能軟件的免費替代品。
加州大學伯克利分校計算機科學教授揚·斯托伊察(Ion Schmidt)說,免費的人工智能模型現在在性能上“相當接近”谷歌和ChatGPT的開發(fā)者OpenAI的專有模型,大多數軟件開發(fā)人員最終會選擇使用免費的模型。斯托伊察本人也使用Meta的技術幫助開發(fā)了一款重要的開源人工智能模型。
如果說斯托伊察的觀點是正確的,那么開源人工智能可能顛覆谷歌、OpenAI、微軟和其他出售專有模型訪問權的公司的商業(yè)計劃。相反,任何人都可以用很低的成本獲得強大的人工智能工具,Meta反過來也可以得到回報。
斯托伊察是利用Meta的研究開發(fā)Vicuna的學者之一。Vicuna是一款開源語言理解模型,于3月份發(fā)布。Vicuna模型是基于LLaMA的微調模型,是由加州大學伯克利分校、CMU、斯坦福大學和加州大學圣地亞哥分校的成員共同提出的。他們從shareGPT收集了大約7萬個對話,借鑒Alpaca的微調方式,將LLaMA模型進行微調。最終實現了chatGPT大約90%的質量,但是訓練成本僅300美元左右。Vicuna的質量和開源人工智能的快速發(fā)展,也讓谷歌高級工程師盧克·瑟諾(Luke Sernau)向同事們發(fā)出了警告,谷歌為了趕上OpenAI,專注于專有軟件,這可能讓谷歌在競爭中落后于開源社區(qū)。
“如果有沒有使用限制的免費、高質量的替代產品,誰會為有使用次數受限的谷歌產品付費?”瑟諾在內部備忘錄中寫道,該信息得到了證實,并由SemiAnalysis首次發(fā)布。他寫道,開源人工智能開發(fā)正在“擊敗我們”,并補充說,“谷歌應該在開源社區(qū)中確立自己的領導者地位”,并“放棄對我們模型的一些控制?!?/P>
即使瑟諾在這份備忘錄中的觀點可能夸大了開源人工智能的能力,并低估了其成本和其他風險,它仍然引起了整個行業(yè)的共鳴,包括一些谷歌員工也有同感。但大多數人工智能從業(yè)者同意備忘錄的一個結論,也就是Meta將從發(fā)布模型中獲益。Meta在內部使用人工智能模型進行內容推薦和廣告定位。隨著開發(fā)人員改進Meta發(fā)布的模型,Meta將能夠把這些改進納入其內部人工智能應用之中。
今年4月,當Meta首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)財報電話會議中被問及公司的人工智能戰(zhàn)略時,他表示:“如果行業(yè)對我們正在使用的基本工具進行標準化,那就更好了,我們可以從其他人的改進中受益。”
與斯托伊察共同開發(fā)Vicuna的伯克利大學的研究生鄭聯民(Lianmin Zheng)說,雖然Meta發(fā)布的模型LLaMA不能合法地用于商業(yè)目的,但是Meta為研究人員提供了足夠的信息來復制用于商業(yè)應用的模型。
谷歌沒有對人工智能軟件采取完全專有的辦法。2020年,早在ChatGPT出現之前,谷歌就發(fā)布了開源語言模型T5,讓開發(fā)者能夠構建可以完成翻譯和編寫摘要等任務的軟件。它隨后發(fā)布了更先進的版本Flan-T5。但是根據斯托伊察和其他從業(yè)者的說法,Meta發(fā)布的軟件允許對谷歌模型進行重大改進,這使得工程師更有可能喜歡基于Meta軟件的模型。
OpenAI的開源模型
谷歌在開源人工智能領域發(fā)揮更大作用的壓力,可能會因為另一個原因而增加。據一位了解該計劃的人士稱,谷歌在人工智能領域的主要競爭對手OpenAI準備向公眾發(fā)布一款新的開源語言模型,該計劃此前從未報道過。目前尚不清楚OpenAI是否打算讓其即將推出的開源軟件,奪回被Vicuna或其他使用Meta模型開發(fā)的軟件搶占的勢頭。不過OpenAI不大可能發(fā)布一款與其正在銷售的專利模型GPT競爭的產品。盡管GPT的前兩個版本是開源的,但OpenAI目前高達270億美元的估值取決于未來最復雜的商業(yè)人工智能不是開源的。截至目前,OpenAI的發(fā)言人對此報道未予置評。
像Vicuna這樣的開源模型只需要幾百美元的訓練費用,用戶可以選擇避免向軟件提供商支付昂貴的費用。相比之下,谷歌、OpenAI和微軟一直在出售對其專有模型的訪問權,企業(yè)可以將這些模型用于一系列目的,包括自動化客戶服務、總結醫(yī)學研究或生成營銷文案。去年,微軟開始出售OpenAI開發(fā)的模型的訪問權限,微軟為OpenAI投入了上百億美元,而谷歌和亞馬遜今年開始向外部開發(fā)者出售他們的模型。
不過最近幾周時間,開源替代方案激增。除了像Vicuna這樣基于Meta軟件的模型,工程師們還可以選擇德國非營利組織LAION以及Databricks和Stability AI等初創(chuàng)公司的其他模型。斯托伊察創(chuàng)建了一個網站,試圖衡量這些開源模型與專有模型(如OpenAI的GPT-4)的質量。
斯托伊察說,與開源軟件相比,谷歌仍然有兩個優(yōu)勢。如果谷歌利用其用戶數據庫,其模型在一些專門用途上可以表現得更好,如內容推薦,因為這些數據是外人無法獲得的。谷歌發(fā)言人對此表示,該公司沒有在現有用戶數據的基礎上訓練其“基礎”人工智能模型。他表示,谷歌在管理大規(guī)模計算機基礎設施方面的專業(yè)知識,意味著它將能夠以更低的成本運行人工智能軟件模型,包括為其云客戶。作為對ChatGPT的回應,谷歌上周宣布對Bard背后的專有模型進行一系列改進。
與此同時,OpenAI在從數百萬人與ChatGPT的互動方式中收集數據方面占據了先機,這無疑有助于它改進人工智能軟件,而且這家初創(chuàng)公司手握使用微軟計算基礎設施的優(yōu)惠協議。
不過開源人工智能軟件允許更多公司使用專有數據來自行解決問題。斯托伊察說,舉例來說,一家航空公司可以利用其數百萬客戶服務電話的日志來創(chuàng)建自動響應。媒體在今年3月份報道稱,彭博社使用其數據訓練了一個更好地理解金融信息的機器學習模型。根據開發(fā)者社區(qū)Discord中的消息,工程師們一直在試驗使用Vicuna進行創(chuàng)造性寫作和編程。
斯托伊察說,為了提高Vicuna的能力,他和同事們正努力增加其模型中的計算次數,有助于它完成涉及推理的任務,如編寫代碼。開發(fā)Vicuna的團隊是Sky Computing Lab的一個分支,該團隊位于伯克利大學,每年有數百萬美元的預算,其中大約50萬美元來自包括微軟、谷歌和亞馬遜在內的上市公司。
開源人工智能軟件以前挫敗過OpenAI的野心。OpenAI通過發(fā)布和出售Dall-E 2的訪問權抓住了互聯網的想象力,當有人鍵入他們想看的簡單文本描述時,Dall-E 2會產生原始圖像。不過隨后開源替代產品Stable Diffusion的突然崛起,讓人工智能界的很多人感到驚訝,包括OpenAI的員工。Dall-E 2并沒有成為一個受到追捧的產品?!拔铱床怀鰹槭裁创笮驼Z言模型不會遵循同樣的模式,”斯托伊察說。(無忌)
標簽: