chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

向量數(shù)據(jù)庫這杯“啤酒”與“泡沫”

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-07-28 09:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

就像啤酒注定要有泡沫,每一場淘金熱都不缺被捧上了時代風口的人。

大模型這一波熱潮中,向量數(shù)據(jù)庫就是那個幸運兒。

一方面,技術層面并沒有太大突破。向量數(shù)據(jù)庫并不是一種特別新的數(shù)據(jù)庫技術,在AI領域已經(jīng)應用了七八年,谷歌在2015年就宣布使用RankBrain語義檢索來處理搜索任務。相比N家的卡、液冷的算、全光的網(wǎng)、升級的存,向量數(shù)據(jù)庫在技術方面并沒有特別亮眼的突破。

而另一方面,向量數(shù)據(jù)庫的投資熱潮又特別旺盛。在上半年成了創(chuàng)業(yè)公司、云計算廠商、老牌數(shù)據(jù)庫公司,以及投資人們“群起而攻之”的風口,Pinecone、Chroma 和 Weviate 等向量數(shù)據(jù)庫初創(chuàng)公司都獲得了融資,有的融資額高達上億美元。這在全球經(jīng)濟不明朗的投資形勢下,還是非常亮眼的成績。

不同于GPU卡那樣短期內需求堅挺、供不應求,加上摩爾定律的約束,即使有泡沫,也是鐵做的。也不同于存算網(wǎng)這類“新基建”,長期投入的戰(zhàn)略價值,得到了廟堂和民間的一致重視。

向量數(shù)據(jù)庫,更多是作為一種AI基礎技術和產(chǎn)品,開始為大眾所知曉。

僅憑這樣,就在投資市場上一飛沖天,多少有點讓人不安。加上最近,大訓模型的熱度開始降溫,ChatGPT訪問量下降,更多大模型已經(jīng)到地里田間礦井“干活兒”去了。

不禁讓人好奇,隨著大模型的風口下沉,向量數(shù)據(jù)庫的投資概念還能飛多久,會不會倏忽而來,倏忽而去,留下喝了“一嘴泡沫”的公司和投資人,在風中凌亂呢?

我們就來好好品一品,這一杯啤酒和泡沫。

技術的啤酒

訓大模型、用大模型,離不開一系列AI基礎設施,所以,作為基礎設施之一的向量數(shù)據(jù)庫,確實有點東西。引入向量數(shù)據(jù)庫,是能喝到真材實料的“啤酒”的。

這就有必要先說說這個技術本身。

數(shù)據(jù)庫不用多說,是必不可少的IT基礎設施,用于存儲和查詢各種數(shù)據(jù),可以看作是數(shù)據(jù)的“硬盤”。那么,向量數(shù)據(jù)庫就是更適合AI體質的“硬盤”,有幾個特質來說明這一點:

1.必要性。

向量數(shù)據(jù)庫,顧名思義就是專門用于存儲和管理向量數(shù)據(jù)。作為一種數(shù)據(jù)結構,每個向量都包含多個維度,每個維度代表不同的特征或屬性,比如圖像的顏色、文本詞匯的出現(xiàn)頻率等。而AI算法,要從圖像、音頻和文本等海量的非結構化數(shù)據(jù)中學習,提取出以向量為表示形式的“特征”,以便模型能夠理解和處理。因此,向量數(shù)據(jù)庫比傳統(tǒng)的關系型數(shù)據(jù)庫,更適合AI 應用。

wKgZomTCkyWAMJUVAAEEd2cF0SU842.jpg

2. 高效率。

每個元素都有一個索引,便于訪問或修改數(shù)值?;诖?,向量數(shù)據(jù)庫可以通過將分組和索引,快速找到與給定查詢最接近的嵌入,實現(xiàn)高效的相似性搜索,同時減少存儲和計算成本。

相比傳統(tǒng)單機插件式數(shù)據(jù)庫,向量數(shù)據(jù)庫的檢索規(guī)??梢蕴嵘?,支持百萬級每秒查詢(QPS)的峰值能力,同時延遲控制在毫秒級。

想象一下,如果沒有高效的搜索技術支持,一個大語言模型動輒數(shù)十億、上百億參數(shù),只能處理有限數(shù)量的輸入數(shù)據(jù),無法搜索更大的數(shù)據(jù)庫,那么在AIGC、搜索、廣告推薦算法等任務的性能表現(xiàn)就會受限。

一個公開數(shù)據(jù)是,通過使用云向量數(shù)據(jù)庫,QQ音樂人均聽歌時長提升3.2%;騰訊視頻有效曝光人均時長提升1.74%;QQ瀏覽器成本降低37.9%,這些數(shù)據(jù)的變化就在于檢索效率、運行穩(wěn)定性、運營效率、推薦算法等有了較大的提升。

3.需求大。

隨著產(chǎn)業(yè)智能化的加速,以及大模型和其他 AI 應用的爆發(fā),各行各業(yè)的AI用例不斷增多,由此帶來了洶涌的數(shù)據(jù)洪潮和存算任務,向量數(shù)據(jù)庫嵌入向量的長度不受限制,具有良好的擴展性,可以根據(jù)AI用例和模型而變化,更好地處理大規(guī)模數(shù)據(jù)集。

而且,向量數(shù)據(jù)庫可以拓展大模型的時間邊界和空間邊界,讓大模型在訓練完成后,也可以訪問向量數(shù)據(jù)庫的最新信息,了解最近發(fā)生的事情。

總的來說,向量數(shù)據(jù)庫就是更適合AI體質的數(shù)據(jù)庫,在AI任務上效果拔群,在機器學習領域中日益流行。

那么問題來了,一些在AI領域積淀已久的科技大廠,如谷歌、微軟、Mate以及BAT等大廠,都有向量數(shù)據(jù)庫的技術積累,也都可以向外輸出相關能力和產(chǎn)品。此外,一些基于開源技術的數(shù)據(jù)庫創(chuàng)業(yè)公司,如Pinecone、Weaviate、Odrant、Chroma近年來打開了市場知名度。

可以說,市場上并不缺乏向量數(shù)據(jù)庫的產(chǎn)品和解決方案。那么2023年,這杯技術啤酒,是怎么咕嘟咕嘟冒出泡沫的呢?

wKgaomTCkyWALetaAAG7696-E8U740.jpg

浪潮之巔的泡沫

向量數(shù)據(jù)庫的市場現(xiàn)狀,說是“從0到1”,并不為過。

首先,大眾市場的認知度才剛剛打開。

此前,向量數(shù)據(jù)庫更多是AI企業(yè)在使用,今年才開始為大眾所熟知,這離不開一些AI相關企業(yè)的推波助瀾。今年 3月的 NVIDIA GTC 大會上,黃仁勛首次提及向量數(shù)據(jù)庫,強調向量數(shù)據(jù)庫對大語言模型的重要性。

不是所有企業(yè)都有能力自建大模型所需要的基礎設施,通過MaaS(模型即服務)業(yè)務來訓練應用大模型是更靈活的選擇,這就要求云廠商提供全?;A設施。

百度、京東、騰訊、華為等,都在自家的大模型完整基礎設施中,提到了向量數(shù)據(jù)庫。目前,云廠商的MaaS業(yè)務才剛剛開始走向市場,大模型的產(chǎn)業(yè)落地不是一蹴而就的,向量數(shù)據(jù)庫的接受度和規(guī)模究竟有多大,還是個未知數(shù)。

第二,向量數(shù)據(jù)庫的技術,還沒經(jīng)歷“卷生卷死”的迭代。

Pinecone是閉源的領跑者,其他競爭者要么是開源的,比如Weviate,要么是巨頭,包括頭部云廠商和甲骨文、IBM等老牌數(shù)據(jù)庫廠商,開始構建AI數(shù)據(jù)庫的產(chǎn)品和解決方案。

大廠扎堆競技,這意味著,如果技術沒有大的突破,就會陷入高密度的同質化競爭,從藍海快速進入紅海。而如果技術有顛覆式變革,很多技術壁壘不高、客戶認知不強的新入局創(chuàng)業(yè)者,很難跟開源生態(tài)或技術巨頭PK,容易被大浪淘沙。

最后,向量數(shù)據(jù)庫的成本,還沒有降到“可規(guī)模復制”的程度。

無論是自建向量數(shù)據(jù)庫,還是通過MaaS服務接入,都還達不到“付費可用”的程度。一般來說,企業(yè)需要先將非結構化的私密數(shù)據(jù)進行向量化,產(chǎn)生一個向量的矩陣,再存儲到向量數(shù)據(jù)庫里,來供大模型學習和檢索。這個過程涉及到大量的工程化,會耗費企業(yè)許多開發(fā)人員、時間成本。

這就需要云廠商或數(shù)據(jù)庫廠商,提供全鏈路的工具,來幫助企業(yè)完成整個數(shù)據(jù)向量化、大模型接入的工作,以及減少后續(xù)運維的難度。比如Pinecone就憑借良好的開箱即用的產(chǎn)品體驗,獲得了非常大的增長,B輪估值達到7.5億美元。

谷歌云、騰訊云、京東云等也都基于內部應用的多年積累,推出了一系列面向外部的工具、框架和應用。但只是邁出了從無到有的第一步,真正成熟還需要讓各家“卷起來”。

可以看到,現(xiàn)在這個階段,熱捧向量數(shù)據(jù)庫,確實有AIGC、大模型、云服務等多方面的現(xiàn)實需求,但從“概念普及”到“真正可用”之間,還有不短的距離。這之間的地帶,就是泡沫生長的地方。

江湖路遠,風高浪急,沒有想清楚的創(chuàng)業(yè)公司或行業(yè)用戶,還是別貿然“帶資進組”了。

啜飲時代的精釀

如果你是數(shù)據(jù)庫廠商,或者是著急布局大模型和AI應用的企業(yè),希望早點將啤酒喝到嘴里,怎么辦呢?

篤定遠一點的未來,有些賽道的泡沫比例是相對少的,需求格外旺盛。

市場方面,國產(chǎn)化替代是不錯的選擇。

科技博弈背景下,加上我國數(shù)據(jù)庫產(chǎn)業(yè)的日益繁榮和技術突破,金融、電信、能源、交通等關鍵基礎行業(yè)的企業(yè),在數(shù)據(jù)庫選型時,都開始傾向于國產(chǎn),以保障數(shù)據(jù)的穩(wěn)定性和安全性。

國外廠商在向量數(shù)據(jù)庫上有著更早的探索和積累,國產(chǎn)數(shù)據(jù)庫要補齊短板是需要時間的。

目前,BATH這類實力較強的國內科技企業(yè),沉淀了向量數(shù)據(jù)庫的核心自主技術,與其合作研發(fā)和定制化開發(fā),針對某些具體場景,提供特定優(yōu)化的向量數(shù)據(jù)庫產(chǎn)品,加入國產(chǎn)化替代的賽道是成本更低、風險更可控、市場需求明確的選擇。

策略方面,加入云生態(tài)不要獨行。

鑒于向量數(shù)據(jù)庫的商業(yè)化前景還不明朗,有業(yè)內人士表示,與其投資新的向量數(shù)據(jù)庫項目,還不如關注現(xiàn)有數(shù)據(jù)庫中,有哪些加上向量引擎可以變得更加強大。

云數(shù)據(jù)庫就是其中之一,上云用數(shù)賦智是大勢所趨,很多政企客戶往往會選擇公有云或行業(yè)云來滿足其業(yè)務需求,將數(shù)據(jù)遷移到云上,對云數(shù)據(jù)庫的關注度和接受度上升。

騰訊云、華為云等大型云廠商,具有較高的品牌認知度和市場接受度,具有云原生、AI原生的技術棧和產(chǎn)品體系,經(jīng)歷了海量場景的淬煉和深度優(yōu)化,和這類云生態(tài)一起掘金向量數(shù)據(jù)庫,是更穩(wěn)妥的方式。

和AI、大模型一樣,向量數(shù)據(jù)庫要品出味道,離不開時間的窖藏和醞釀。是在大訓模型的熱度下降后,像泡沫一樣湮滅,還是作為啤酒精釀沉淀下去,等待成為下一代數(shù)字基礎設施的剛需,被行業(yè)客戶所啜飲,是留給數(shù)據(jù)庫玩家和買家的選擇題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 摩爾定律
    +關注

    關注

    4

    文章

    640

    瀏覽量

    80735
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5149

    瀏覽量

    134739
  • 數(shù)據(jù)庫

    關注

    7

    文章

    4004

    瀏覽量

    68153
  • 向量
    +關注

    關注

    0

    文章

    55

    瀏覽量

    12004
  • 云數(shù)據(jù)庫

    關注

    0

    文章

    30

    瀏覽量

    2167
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產(chǎn)數(shù)據(jù)庫的AI戰(zhàn)事

    國產(chǎn)數(shù)據(jù)庫硝煙再起,Vastbase V100構筑企業(yè)智能基座
    的頭像 發(fā)表于 10-24 20:45 ?3818次閱讀
    國產(chǎn)<b class='flag-5'>數(shù)據(jù)庫</b>的AI戰(zhàn)事

    數(shù)據(jù)庫性能優(yōu)化指南

    作為一名在大廠摸爬滾打多年的運維老兵,我見過太多因為數(shù)據(jù)庫性能問題導致的生產(chǎn)事故。今天分享一套完整的數(shù)據(jù)庫優(yōu)化方法論,從SQL層面到硬件配置,幫你徹底解決性能瓶頸!
    的頭像 發(fā)表于 08-18 11:21 ?653次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復—服務器異常斷電導致Oracle數(shù)據(jù)庫故障的數(shù)據(jù)恢復案例

    Oracle數(shù)據(jù)庫故障: 某公司一臺服務器上部署Oracle數(shù)據(jù)庫。服務器意外斷電導致數(shù)據(jù)庫報錯,報錯內容為“system01.dbf需要更多的恢復來保持一致性”。該Oracle數(shù)據(jù)庫
    的頭像 發(fā)表于 07-24 11:12 ?515次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—服務器異常斷電導致Oracle<b class='flag-5'>數(shù)據(jù)庫</b>故障的<b class='flag-5'>數(shù)據(jù)</b>恢復案例

    三款主流國產(chǎn)數(shù)據(jù)庫的技術特點

    隨著數(shù)字經(jīng)濟的快速發(fā)展和數(shù)據(jù)安全要求的提升,國產(chǎn)數(shù)據(jù)庫正迎來前所未有的發(fā)展機遇。在信創(chuàng)浪潮推動下,達夢數(shù)據(jù)庫、TiDB、華為高斯數(shù)據(jù)庫等國產(chǎn)數(shù)據(jù)庫
    的頭像 發(fā)表于 07-14 11:08 ?994次閱讀

    milvus向量數(shù)據(jù)庫的主要特性和應用場景

    Milvus 是一個開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設計。它適用于需要高效存儲、檢索和管理向量
    的頭像 發(fā)表于 07-04 11:36 ?938次閱讀
    milvus<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>的主要特性和應用場景

    數(shù)據(jù)庫數(shù)據(jù)恢復—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復案例

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復環(huán)境: 一臺操作系統(tǒng)為Windows Server的虛擬機上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 工作人員在MongoDB服務仍
    的頭像 發(fā)表于 07-01 11:13 ?537次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復案例

    數(shù)據(jù)庫數(shù)據(jù)恢復—SQL Server數(shù)據(jù)庫被加密如何恢復數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?584次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>被加密如何恢復<b class='flag-5'>數(shù)據(jù)</b>?

    達夢數(shù)據(jù)庫常用管理SQL命令詳解

    達夢數(shù)據(jù)庫常用管理SQL命令詳解
    的頭像 發(fā)表于 06-17 15:12 ?6875次閱讀
    達夢<b class='flag-5'>數(shù)據(jù)庫</b>常用管理SQL命令詳解

    oracle數(shù)據(jù)恢復—oracle數(shù)據(jù)庫誤執(zhí)行錯誤truncate命令如何恢復數(shù)據(jù)?

    oracle數(shù)據(jù)庫誤執(zhí)行truncate命令導致數(shù)據(jù)丟失是一種常見情況。通常情況下,oracle數(shù)據(jù)庫誤操作刪除數(shù)據(jù)只需要通過備份恢復數(shù)據(jù)
    的頭像 發(fā)表于 06-05 16:01 ?692次閱讀
    oracle<b class='flag-5'>數(shù)據(jù)</b>恢復—oracle<b class='flag-5'>數(shù)據(jù)庫</b>誤執(zhí)行錯誤truncate命令如何恢復<b class='flag-5'>數(shù)據(jù)</b>?

    SQLSERVER數(shù)據(jù)庫是什么

    SQL Server 是由微軟公司開發(fā)的一款 關系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS) ,用于存儲、管理和檢索結構化數(shù)據(jù)。它是企業(yè)級應用中廣泛使用的數(shù)據(jù)庫解決方案之一,尤其適用于Windows平臺,但也
    的頭像 發(fā)表于 05-26 09:19 ?1072次閱讀

    MySQL數(shù)據(jù)庫是什么

    MySQL數(shù)據(jù)庫是一種 開源的關系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS) ,由瑞典MySQL AB公司開發(fā),后被Oracle公司收購。它通過結構化查詢語言(SQL)進行數(shù)據(jù)存儲、管理和操作,廣泛應用于Web
    的頭像 發(fā)表于 05-23 09:18 ?1066次閱讀

    SEGGER emFile支持大型數(shù)據(jù)庫

    SEGGER宣布emFile對大型數(shù)據(jù)庫的支持,集成了SQLite,方便與SEGGER的BigFAT和微軟的exFAT一起使用。
    的頭像 發(fā)表于 04-23 15:51 ?667次閱讀

    分布式存儲數(shù)據(jù)恢復—虛擬機上hbase和hive數(shù)據(jù)庫數(shù)據(jù)恢復案例

    分布式存儲數(shù)據(jù)恢復環(huán)境: 16臺某品牌R730xd服務器節(jié)點,每臺服務器節(jié)點上有數(shù)臺虛擬機。 虛擬機上部署Hbase和Hive數(shù)據(jù)庫。 分布式存儲故障: 數(shù)據(jù)庫底層文件被誤刪除,數(shù)
    的頭像 發(fā)表于 04-17 11:05 ?641次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復——MongoDB數(shù)據(jù)庫文件拷貝后服務無法啟動的數(shù)據(jù)恢復

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復環(huán)境: 一臺Windows Server操作系統(tǒng)虛擬機上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 管理員在未關閉MongoDB服務的
    的頭像 發(fā)表于 04-09 11:34 ?739次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復——MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件拷貝后服務無法啟動的<b class='flag-5'>數(shù)據(jù)</b>恢復

    數(shù)據(jù)庫數(shù)據(jù)恢復—SQL Server附加數(shù)據(jù)庫提示“錯誤 823”的數(shù)據(jù)恢復案例

    SQL Server數(shù)據(jù)庫附加數(shù)據(jù)庫過程中比較常見的報錯是“錯誤 823”,附加數(shù)據(jù)庫失敗。 如果數(shù)據(jù)庫有備份則只需還原備份即可。但是如果沒有備份,備份時間太久,或者其他原因導致備份
    的頭像 發(fā)表于 02-28 11:38 ?940次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—SQL Server附加<b class='flag-5'>數(shù)據(jù)庫</b>提示“錯誤 823”的<b class='flag-5'>數(shù)據(jù)</b>恢復案例