從去年ChatGPT重磅發(fā)布到今年的“百模大戰(zhàn)”,大模型賽道可謂熱鬧非凡。
今年8月31日,國內首批8家大模型公司通過《生成式人工智能服務管理暫行辦法》備案,獲批面向公眾開放服務,這些大模型包括上海人工智能實驗室的書生通用大模型、商湯科技“商量”,以及百度“文心一言”等。
ChatGPT從源頭來看是自然語言理解、自然語言處理兩個技術,之所以引起關注,在于它是一個大模型,對應大數(shù)據、強計算、好算法。有人說,原理是這么個原理,就像踢足球都是盤帶、射門,但是做到梅西那么好也不容易。
今天,就讓我們來看看,趕上大模型這個風口的“張江版大模型”都有哪些?各自的優(yōu)勢又有何不同?
達觀數(shù)據:“曹植”大語言模型
3月,基于多年文本智能技術積累和垂直領域場景業(yè)務經驗,達觀數(shù)據研發(fā)團隊積極探索大語言模型(LLM)的實踐,研發(fā)國產版GPT模型——“曹植”大語言模型。
7月,在 2023 世界人工智能大會上,達觀數(shù)據正式發(fā)布了名為“曹植”的大模型。這是國內首個垂直行業(yè)專用的自主可控的國產GPT大語言模型,可準確完成多類型、復雜結構的長文本寫作,自動起草多種類型的文檔,未來將實現(xiàn)多模態(tài)內容生成,如長文檔中的表格、圖表、圖片等。
作為垂直、專用、自主可控的國產版ChatGPT模型,“曹植”是如何誕生的?
達觀數(shù)據成立于2015年,一直在NLP(自然語言處理)領域深耕,積累了大量金融、政務、制造等垂直領域的大量數(shù)據。2017年,谷歌在發(fā)表的論文中提出NLP關于“理解”和“生成”的兩個技術路線?;谶_觀數(shù)據當時的優(yōu)勢資源和未來發(fā)展,他們從一開始就選擇了“理解”這條技術路線。這一年,運用知識圖譜、文字識別等技術開發(fā)的IDP智能文檔審閱系統(tǒng)進入市場。
隨著人工智能的不斷發(fā)展,機器智能處理長文本的需求日益緊迫。隨后,達觀數(shù)據便投入到大語言模型的開發(fā)工作中,而這正是如今的“曹植”大模型誕生的起點。
“長文本”是“曹植”大模型的目標任務。區(qū)別于一問一答的簡單短文本生成,“曹植”大模型可準確完成多類型、復雜結構的長文本寫作。
以金融信貸報告為例,銀行的金融信貸報告經常以40頁起步,60多頁的報告也是家常便飯,靠員工“埋頭苦干”效率太低,而大模型就會自動起草多種類型的文檔,同時具有自動排版、智能糾錯、文本潤色、自動生成摘要等特色功能;支持中文、英文、法語、德語、日語、韓語等數(shù)十種語言的寫作,輔助人工大幅提高辦公效率;在長文檔翻譯方面,對原文的標題、段落等內容實現(xiàn)1:1版式還原,提供實時的翻譯體驗,廣泛應用于多語言文檔密集處理的場景?!拔磥韱T工需要做的就是寫提示詞、寫大綱、核實數(shù)字,剩下的都能交給大模型來完成?!边_觀數(shù)據創(chuàng)始人兼CEO陳運文表示。
這也是國內大規(guī)模語言模型中首批可落地的產業(yè)應用級模型,目前除了在金融領域應用之外,“曹植”還掌握了撰寫白皮書、技術報告以及品牌故事的智能協(xié)作本領。
與此同時,為促使“曹植”大模型在各垂直領域中可以更低成本高效能地落地與應用,達觀數(shù)據正式推出私有化大模型一體機。私有化“曹植”大模型一體機,內置達觀數(shù)據全棧自主研發(fā)的“曹植”大模型,支持三方開源模型庫,可在企業(yè)內部一鍵部署大模型應用,能同時為多種垂直大模型業(yè)務提供文檔智能審閱、智能知識管理、知識搜索與問答、文檔智能寫作、智能推薦等智能化服務,支持和具備安全便捷的AI訓練、推理、長文檔寫作、機器翻譯、語義分析審核、知識問答、text-to-sql等場景功能應用?!安苤?”的強大功能讓它甫一出世就大獲好評。
云從科技:從容大模型
5月18日,由云從科技研發(fā)的從容大模型正式亮相,展現(xiàn)了在智能問答、城市管理、智能制造、智慧金融、游戲文創(chuàng)等領域的超級本領。云從科技董事長兼總經理周曦指出,從容大模型將以問答、伴隨、托管三種遞進的形式顛覆傳統(tǒng)交互方式。其中,“問答”即類似于當前的GPT;“伴隨”指AI會像一個朋友伴隨你執(zhí)行很多事情;“托管”則意味著一件事主要交給AI來做,類似在網游中的‘掛機訓練’。能走到托管這一步,人就可以‘解放’出來,做更多有意義、有興趣的事?!薄?/p>
從算法、算力、數(shù)據這三個大模型重要維度看,云從科技的先天優(yōu)勢幫助其建立了技術門檻。
算法上,云從科技從2020年開始就已經陸續(xù)在NLP(自然語言處理)、OCR(光學字符識別)、機器視覺、語音等多個領域開展預訓練大模型的實踐,不僅進一步提升了公司各項核心算法的性能效果,同時也大幅提升了公司的算法生產效率,已經在城市治理、金融、智能制造等行業(yè)應用中體現(xiàn)價值。
算力上,云從科技擁有強大的算力資源儲備,預計未來將擴展到上萬張卡的規(guī)模,并計劃聯(lián)合各行頭部企業(yè)打造不同的行業(yè)大模型,推動行業(yè)數(shù)智化建設。
數(shù)據上,云從科技有行業(yè)專業(yè)數(shù)據的先發(fā)優(yōu)勢。行業(yè)大模型需要的是專業(yè)領域的知識,如果不是一直耕耘的行業(yè)資深選手,基本很難有相關的數(shù)據積累。云從科技恰恰擁有這方面的稀缺優(yōu)勢,其多年來在多個領域實踐“預訓練大模型+下游任務遷移”的技術范式,產出多個百億參數(shù)以內規(guī)模的模型。歷經長期與各垂直領域企業(yè)的緊密合作,云從通過大量場景數(shù)據訓練不斷優(yōu)化算法平臺,培育出針對不同行業(yè)特有的數(shù)據分析和應用能力。
8月21日,云從發(fā)布從容大模型1.5版本,該版本包含十億級、百億級、千億級多種模型規(guī)格,實測性能在全球大模型綜合性考試評測(C-Eval)中位居百億級第1,總榜單第4。為解決大模型落地難題,從容1.5版本的重點是參數(shù)量為130億的行業(yè)大模型,該模型從千億大模型中蒸餾產生,在52類測試指標中有44類超過ChatGPT、29類超過GPT-4,這距離從容大模型正式發(fā)布僅過去3個月,可謂是進步神速。
百度:文心一言
8月31日,百度生成式人工智能產品“文心一言”正式向公眾開放服務,這也意味著該應用已通過《生成式人工智能服務管理暫行辦法》備案,成為國內首個合規(guī)上線的生成式人工智能產品。
據悉,百度還將開放一批經過全新重構的AI原生應用,讓用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。
文心一言在今年3月16日上線測試,隨即引發(fā)廣泛關注,截至5月,有超過300家生態(tài)伙伴參與內測,在400多個企業(yè)內部場景取得測試成效。8月31日開放當天,百度的一系列AI原生應用也“閃電”上線,并取得不錯的戰(zhàn)績:
百度文心一言首日回答用戶3342萬問題,“文心一言App”迅速登上Apple store免費應用排行榜榜首,首日用戶量破百萬;文心一言開放首日,百度搜索就有超3億次需求由生成式智能引擎解決,百度搜索“AI伙伴”當日訪問用戶數(shù)突破400萬;百度文庫“AI做PPT”等文檔創(chuàng)作功能超200萬人次體驗。這距離5月百度萬象大會上“用AI原生思維重構百度移動生態(tài)”的表態(tài),才過去不過百余天,大模型時代的技術進展可以說是日新月異。
實際上,從多年前的“All in AI”開始,百度就開始了在AI領域的全棧布局。近十年,百度累計研發(fā)投入超1400億元,2022年百度核心研發(fā)費用214.16億元,占百度核心收入比例達到22.4%。壓強式研發(fā)投入讓百度實現(xiàn)厚積薄發(fā),成為全球為數(shù)不多的、有著應用、模型、框架、芯片四層全棧布局的AI公司,實現(xiàn)端到端優(yōu)化,并在各個層面都有行業(yè)領先的關鍵自研技術。
文心一言的基礎模型文心大模型早在2019年就在國內率先發(fā)布,近期升級的文心大模型3.5也持續(xù)在十余個國內外權威測評中位居首位。百度透露,文心大模型4.0預計將在年底推出。
編輯:黃飛
-
人工智能
+關注
關注
1807文章
49029瀏覽量
249652 -
ChatGPT
+關注
關注
29文章
1590瀏覽量
9114 -
文心一言
+關注
關注
0文章
133瀏覽量
1867 -
大模型
+關注
關注
2文章
3147瀏覽量
4079
原文標題:都有誰站在了大模型的風口上?
文章出處:【微信號:zjpark,微信公眾號:你好張江】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
蔚來世界模型NWM首個版本正式推送
FA模型訪問Stage模型DataShareExtensionAbility說明
KaihongOS操作系統(tǒng)FA模型與Stage模型介紹
摩爾線程GPU成功適配Deepseek-V3-0324大模型

利用RAKsmart服務器托管AI模型訓練的優(yōu)勢
中星微芯片+大模型賦能行業(yè)應用的獨特優(yōu)勢

評論