威爾斯親王
|
2024-7-30 08:36:25
|
祖克柏預測,Meta AI助理使用率幾個月後將超越ChatGPT。
7月24日淩晨,美國科技巨頭Meta推出迄今為止性能最強大的開源大模型-Llama 3.1 405B(4050億參數),同時發布了全新升級的Llama 3.1 70B和8B模型版本。
Llama 3.1 405B支援上下文長度為128K tokens,是全球迄今為止性能最強大、參數規模最大的開源模型,在基於15萬億個t okens、超1.6萬個H100 GPU上進行訓練,這也是Meta有史以來第一個以這種規模進行訓練的Llama模型。
因效能佳、開源、多方合作,目前所有Llama模型版本的總下載量已經超過3億次。研究人員基於超150個基準測試集的評測結果顯示,Llama 3.1 405B可與GPT-4o、Claude 3.5 Sonnet和Gemini Ultra等業界頭部模型相媲美,包括亞馬遜( 183.2 , 0.70 , 0.38% ) AWS、英偉達、微軟( 426.73 , 1.46 , 0.34% ) Azure和Google( 171.13 , 2.45 , 1.45% )雲端等25家頭部公司與Meta達成合作,引進Llama 3.1。
「這對我們來說是久旱逢甘霖。」獨立分析師Jimmy告訴《中國企業家》。苦於缺乏長期高品質的訓練資料已久,全球AI領域的開發人員終於迎來了開源曙光。一般來說,較小的專家模型(參數規模在10億~100億)通常利用“蒸餾技術”,也就是利用更大的模型來增強訓練資料。但由於巨頭OpenAI的閉源,此類訓練資料的缺乏是各大模型共同的難題。
開、閉源之爭一直是AI圈的中心話題。 Meta創辦人、CEO祖克柏提到:「我相信Llama 3.1的發布將成為產業的轉捩點」;360集團創辦人周鴻禕也曾表示,開源社群聚集全球上千家公司、數十萬程式設計師和工程師,開發力量是一個閉源公司的數百倍。
祖克柏開源Llama 3.1,逼急OpenAI
Meta公佈前一天,Llama 3.1的模型和基準測試結果已經在國外的Reddit等社區上洩露,Llama 3.1的磁力鏈接也被流傳,“強大”“開源”成為評論區的高頻詞。
Llama 3.1包含8B、70B和405B三種參數規模,其中超大杯4050億版本,該系列模型上下文視窗增加到了128K,擴大16倍;增加了8種支援語言;提升了工具使用能力,支援搜尋和Wolfram Alpha的數學推理;擁有更寬鬆的許可,允許使用模型輸出改進其他LLMs。
事實上,開、閉源的大模型差距正在縮小。 Meta在官博指出最新一代的Llama將激發新的應用程式和建模範式,包括利用合成資料生成來提升和訓練更小的模型,以及模型蒸餾——這是一種在開源領域從未有過的能力。在基準測試集中的表現幾乎可以媲美目前頂尖閉源模型GPT-4o和Claude 3.5 Sonnet,並且所有版本都可以在官網下載使用。
Meta對Llama 3.1的佈局在今年4月就有跡可循。當時Meta就透露說,正在開發人工智慧產業的第一款產品:一個效能與OpenAI等公司最好的私有模型相媲美的開源模型。
相較於OpenAI對技術細節的“惜字如金”,Meta此次不僅開放小助手應用在線試玩,還發布了近100頁的詳細論文,涵蓋了創造Llama 3.1過程中的一切,比如訓練數據、過濾、退火、合成數據,並透露Llama 4已在開發中。
祖克柏親自為開源大模型Llama 3.1月台,在推特撰寫長文《Open Source AI Is the Path Forward》強調開源的意義,他表示:「今天我們正邁出下一步——使開源AI成為業界標準( 232.1 , 12.30 , 5.60% ) )的開源決定確實值得讚揚。
Meta與OpenAI分別代表開源與閉源的兩條技術路線。關於開源和閉源的鬥爭由來已久,此前在彭博社的採訪中,扎克伯格更是公開嘲諷:「阿爾特曼的領導能力值得稱讚,但有點諷刺的是公司名為OpenAl卻成為構建封閉式人工智慧模型的領導者。
面對Meta這次的大招,OpenAI以低價策略應戰。
Meta公佈Llama 3.1兩個多小時後,OpenAI發布消息:該公司推出了GPT-4o mini微調功能版,從現在到9月23日可免費使用。據了解,GPT-4o mini的輸入tokens費用比GPT-3.5 Turbo 低90%,輸出tokens 費用低80%。即使免費期限結束,GPT-4o mini的價格也比GPT-3.5 Turbo低一半。
價錢打折,但產品能力不打折。據了解,GPT-4o mini比經典版GPT-3.5 Turbo能力更強,GPT-4o mini的上下文長度為65k tokens,是GPT-3.5 Turbo的四倍,推理上下文長度為128k tokens,是GPT-3.5 Turbo的八倍。
這意味著,若使用GPT-4o mini微調版,就可以享受:以實惠的使用費用,使用更長的上下文、更聰明的頂尖大模型。阿爾特曼更是在推特發文表示,GPT-4o mini以1/20的價格在lmsys上實現了與GPT-4o接近的性能表現,他還希望大家能夠多多使用GPT-4o mini 微調版本。
這次OpenAI以發布GPT-4o mini 微調版為盾,不僅是對Meta開源大模型步步緊逼的反擊,也同時將矽谷AI價格戰的火藥味推得更濃。
用價格「圍剿」OpenAI
即使OpenAI推出可免費使用的小模型,但比起同為大模型的產品,Llama 3.1 405B的價格比GPT-4o仍然低很多。
公開數據顯示,Llama 3.1的價格在Fireworks平台上是每1百萬tokens的輸入/輸出價格是3美元,而GPT-4o每1百萬tokens的輸入價格是5美元,輸出價格是15美元。此外,Claude 3.5 sonnet的每1百萬tokens的輸入價格是3美元,輸出價格是15美元。
這不是矽谷在AI方面的第一次「價格戰」。
今年5月,OpenAI發布GPT-4o並支援免費試用,調用API的價格也比GPT-4- T urbo降低一半——打響了矽谷大模型價格戰第一槍,同時這也是2023年起OpenAI的第4次降價。 7月18日深夜,GPT-4o mini的正式亮相,與GPT-3.5相比性能更強,也更便宜,連阿爾特曼都曾建議大家不要再用GPT-3.5了。
用低價「圍剿」OpenAI已成大模型公司們的慣例。公開資訊顯示,與GPT-4o相比較,各大公司的最新發布的產品分別是:Meta的Llama 3.1,谷歌的Gemini 1.5 pro,Claude 3 Sonnet,新近的Mistral AI,這些最新大模型價格均低於GPT-4o。 |
評分
-
總評分: 名聲 + 6
金幣 + 6
查看全部評分
|
免責聲明:本文所載資料僅供參考,本人對該資料或使用該資料所導致的結果概不承擔任何責任.本人已盡告知讀者之義務!,且並無意違反兒童及少年性剝削防制條例第40條所稱『以宣傳品、出版品、廣播、電視、電信、網際網路或其他方法,散布、傳送、刊登或張貼足以引誘、媒介、暗示或其他使兒童或少年有遭受第二條第一項第一款至第三款之虞之訊息』請讀者自重!本文為網路創作,與現實之人事物無關,內容如與現實雷同,純屬巧合!以上純屬夢境,一切都是假的,假如你以為是真的,建議去檢查視力,你眼睛業障太重