曰本美女∴一区二区特级A级黄色大片, 国产亚洲精品美女久久久久久2025, 页岩实心砖-高密市宏伟建材有限公司, 午夜小视频在线观看欧美日韩手机在线,国产人妻奶水一区二区,国产玉足,妺妺窝人体色WWW网站孕妇,色综合天天综合网中文伊,成人在线麻豆网观看

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎么評(píng)估算法的性能

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:CS的陋室 ? 作者:CS的陋室 ? 2022-08-11 10:40 ? 次閱讀

我在很多文章里都有吐槽大規(guī)模預(yù)訓(xùn)練模型的性能差,落地成本高,這一期就和大家講講,怎么評(píng)估算法的性能的。

當(dāng)然,這篇文章應(yīng)該是比較科普的,主要是為了讓大家樹(shù)立一個(gè)性能意識(shí),在進(jìn)行方案選型和最終檢測(cè)的時(shí)候,能有關(guān)注性能的這個(gè)意識(shí)。

性能的意義

這里所謂的性能,本質(zhì)是對(duì)執(zhí)行速度、執(zhí)行資源消耗的一種評(píng)估。在現(xiàn)實(shí)的落地場(chǎng)景,一個(gè)模型最終能不能用起來(lái),除了和算法效果有關(guān),即類(lèi)似準(zhǔn)確率召回率,還和依賴(lài)的資源以及速度是相關(guān)的。

我們可以把運(yùn)行環(huán)境比作一個(gè)空間有限的房間,如果你的刀是40米長(zhǎng)的,其實(shí)很難在這個(gè)房間里使的舒服,即使他的傷害很高很強(qiáng),與之相反,一把短一些的到在有限空間內(nèi),用起來(lái)會(huì)更得心應(yīng)手。這就是性能的意義,在預(yù)訓(xùn)練模型逐步熱門(mén)之后,這個(gè)問(wèn)題會(huì)更加尖銳,預(yù)訓(xùn)練無(wú)論是計(jì)算復(fù)雜度,還是空間需求,都很大,先不說(shuō)訓(xùn)練,就是推理,單機(jī)推理還算可以,但是耗時(shí),還是高并發(fā)需求下,并非所有的組織都能支持,因此,我們需要對(duì)性能有足夠的敏感性,否則會(huì)很可能會(huì)出現(xiàn),一頓操作效果調(diào)優(yōu)一個(gè)月的預(yù)訓(xùn)練模型,最終因?yàn)樯喜涣司€(xiàn)功虧一簣的尷尬情況,當(dāng)然,這也是作為一名算法工程師,必備的一種能力。

性能評(píng)估的觀測(cè)指標(biāo)

要評(píng)估性能好壞,有哪些評(píng)估項(xiàng),又有那些評(píng)估指標(biāo),詳細(xì)介紹下。

首先是單機(jī)速度的評(píng)估。即單進(jìn)程下,每次推理所需要的時(shí)間,或者單位時(shí)間下能處理的計(jì)算次數(shù),一般評(píng)估的是rt(Reaction Time,響應(yīng)時(shí)間)或者qps/tps(query per second,transaction per second)。但是,由于很多時(shí)候,不同的輸入可能會(huì)影響這個(gè)時(shí)間,所以一般使用和在線(xiàn)分布接近的樣本或者query來(lái)批量請(qǐng)求,求平均值,而常見(jiàn)的,耗時(shí)長(zhǎng)度的分布服從二八法則,因此我們要關(guān)注的是TOP耗時(shí)的情況,因此我們還會(huì)看不同位置的分位點(diǎn)情況,例如90%、95%或者99%分位點(diǎn)。另外還有種評(píng)估的方式,用合格率之類(lèi)的方法,例如最高耗時(shí)不能超過(guò)200ms,超過(guò)的算失敗,然后計(jì)算成功率,成功率99%以上。

對(duì)于互聯(lián)網(wǎng)環(huán)境,除了單機(jī)速度,還必須考慮并發(fā)能力,并發(fā)能力是指當(dāng)同時(shí)很多請(qǐng)求同時(shí)或者接近同時(shí)請(qǐng)求的時(shí)候的性能狀態(tài),很多時(shí)候,因?yàn)闊狳c(diǎn)事件的出現(xiàn),大家會(huì)大量開(kāi)始在網(wǎng)上檢索請(qǐng)求,對(duì)計(jì)算機(jī)而言,完不成的任務(wù)就會(huì)開(kāi)始排隊(duì)(這個(gè)和銀行柜臺(tái)類(lèi)似的),排隊(duì)太長(zhǎng)系統(tǒng)自然就難堪重負(fù)崩潰了,例如微博、B站、知乎這種偶爾的崩潰就很多是因?yàn)檫@個(gè)原因。指標(biāo)上,其實(shí)更多是和單機(jī)的評(píng)估類(lèi)似,只是評(píng)估的時(shí)候,一般是用多進(jìn)程同時(shí)請(qǐng)求以模擬在線(xiàn)情況,例如4進(jìn)程、8進(jìn)程這種,然后來(lái)看速度還能不能保證在合格范圍內(nèi)。

除了速度之外,偶爾還要看看其他的問(wèn)題,例如內(nèi)存,有沒(méi)有內(nèi)存泄漏(在服務(wù)運(yùn)行期間內(nèi)存有沒(méi)有持續(xù)增加),在高峰期內(nèi)存是否在正常范圍內(nèi)(例如80%以?xún)?nèi)),都是需要關(guān)注的。

從批跑到壓測(cè)

前面有提到,評(píng)估性能最簡(jiǎn)單的方式就是批量跑case,簡(jiǎn)單的性能評(píng)估,其實(shí)就是找一批和query批量跑,然后掐時(shí)間。這里,先說(shuō)下這個(gè)query需要有什么要求:

數(shù)量得足夠,否則均值和分位點(diǎn)計(jì)算就達(dá)不到統(tǒng)計(jì)意義。

而且盡可能和現(xiàn)實(shí)場(chǎng)景匹配,這樣測(cè)得時(shí)間和在線(xiàn)實(shí)際時(shí)間比較接近(這個(gè)其實(shí)沒(méi)那么難,直接撈日志抽樣即可)

這個(gè)時(shí)間的評(píng)估其實(shí)不難,簡(jiǎn)單的用tqdm,上面就顯示平均時(shí)間(X item/s),但是如果要算分位點(diǎn)了,肯定要把每個(gè)case的時(shí)間都記錄下來(lái)再統(tǒng)計(jì),例如弄numpy里面的函數(shù)計(jì)算,寫(xiě)起來(lái)并不算困難。

但是,一旦要考慮并發(fā)能力了,那就要壓測(cè)了,即壓力測(cè)試,所謂的壓測(cè),其實(shí)就是計(jì)算機(jī)模擬N個(gè)用戶(hù),同時(shí)不斷向服務(wù)發(fā)送請(qǐng)求,當(dāng)然,要壓測(cè)的話(huà),通常需要把模型打包成服務(wù),例如grpc或者h(yuǎn)ttp的。然后和觀測(cè)上面提的指標(biāo),耗時(shí)、qps、成功率、內(nèi)存等。一般情況,我們不需要用所有服務(wù)器來(lái)實(shí)驗(yàn),一般也是對(duì)一臺(tái)機(jī)器即可,因?yàn)槎嗯_(tái)機(jī)器,如果有做負(fù)載均衡,其實(shí)性能就是多臺(tái)機(jī)器求和而已。python實(shí)現(xiàn)上,先是對(duì)模型打包成服務(wù)形成服務(wù)端,而壓測(cè)腳本這邊寫(xiě)一個(gè)客戶(hù)端來(lái)請(qǐng)求服務(wù)端,上壓測(cè)的話(huà)就弄個(gè)多進(jìn)程觸發(fā)即可,網(wǎng)上有很多樣例代碼,直接搜,當(dāng)然別指望能照搬,肯定是需要自己服務(wù)的情況來(lái)修改額,畢竟接口不盡相同。

小結(jié)

本文給大家簡(jiǎn)單介紹了算法這邊需要關(guān)注的性能,以及評(píng)估的主要方式,能讓大家對(duì)性能樹(shù)立一個(gè)基本的概念,讓大家清楚性能是什么,怎么觀測(cè)等,后續(xù)會(huì)給大家介紹一些性能調(diào)優(yōu)的手段,幫助大家更好地優(yōu)化性能,成功把自己心心念念的模型推上線(xiàn)。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    54

    文章

    11219

    瀏覽量

    105278
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4687

    瀏覽量

    94461
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3471

    瀏覽量

    49874

原文標(biāo)題:算法性能評(píng)估指南

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    主驅(qū)電機(jī)系統(tǒng)的扭矩估算方案

    主驅(qū)電機(jī)是電動(dòng)汽車(chē)核心的部件之一,主要作用是產(chǎn)生驅(qū)動(dòng)扭矩或制動(dòng)扭矩,驅(qū)動(dòng)車(chē)輛前進(jìn)并進(jìn)行動(dòng)能回收。扭矩估算算法也成為主驅(qū)電機(jī)扭矩安全的重點(diǎn)。目前常用的扭矩估算算法有三種,分別是:電流法、功率法和查表法。本文將就這三種算法進(jìn)行展開(kāi)講
    的頭像 發(fā)表于 03-17 16:26 ?575次閱讀
    主驅(qū)電機(jī)系統(tǒng)的扭矩<b class='flag-5'>估算</b>方案

    ?為什么GPU性能效率比峰值性能更關(guān)鍵

    評(píng)估GPU性能時(shí),通常首先考察三個(gè)指標(biāo):圖形工作負(fù)載的紋理率(GPixel/s)、浮點(diǎn)運(yùn)算次數(shù)(FLOPS)以及它們能處理計(jì)算和AI工作負(fù)載的每秒8-bittera運(yùn)算次數(shù)(TOPS)。這些關(guān)鍵
    的頭像 發(fā)表于 03-13 08:34 ?244次閱讀
    ?為什么GPU<b class='flag-5'>性能</b>效率比峰值<b class='flag-5'>性能</b>更關(guān)鍵

    VirtualLab Fusion應(yīng)用:F-Theta掃描透鏡的性能評(píng)估

    ,不同F(xiàn)oV模式可以通過(guò)顏色編碼來(lái)區(qū)分。此外,可以檢查場(chǎng)的軌跡,以便將探測(cè)器放置在正確的位置。 性能評(píng)估-光斑位置偏差 性能評(píng)估-光斑直徑測(cè)量 VirtualLab Fusion
    發(fā)表于 03-03 09:34

    VirtualLab Fusion應(yīng)用:F-Theta掃描透鏡的性能評(píng)估

    ,不同F(xiàn)oV模式可以通過(guò)顏色編碼來(lái)區(qū)分。此外,可以檢查場(chǎng)的軌跡,以便將探測(cè)器放置在正確的位置。 性能評(píng)估-光斑位置偏差 性能評(píng)估-光斑直徑測(cè)量 VirtualLab Fusion
    發(fā)表于 02-05 09:32

    MPU的性能評(píng)估方法

    MPU(Microprocessor Unit,微處理器單元)的性能評(píng)估是確保其在實(shí)際應(yīng)用中能夠滿(mǎn)足需求的重要環(huán)節(jié)。以下是一些常用的MPU性能評(píng)估方法: 一、基準(zhǔn)測(cè)試(Benchmar
    的頭像 發(fā)表于 01-08 09:39 ?527次閱讀

    一文解析LOPA應(yīng)用-點(diǎn)火概率估算的策略與實(shí)踐

    在化工過(guò)程安全領(lǐng)域,保護(hù)層分析(LOPA)是評(píng)估風(fēng)險(xiǎn)與確定安全措施有效性的關(guān)鍵工具。而其中點(diǎn)火概率的估算,更是直接影響風(fēng)險(xiǎn)評(píng)估結(jié)果與 SIL 定級(jí)決策的重要因素。豪鵬科技在服務(wù)軟件客戶(hù)過(guò)程中,經(jīng)常
    的頭像 發(fā)表于 12-21 14:46 ?736次閱讀
    一文解析LOPA應(yīng)用-點(diǎn)火概率<b class='flag-5'>估算</b>的策略與實(shí)踐

    光伏逆變器負(fù)載何進(jìn)行負(fù)載測(cè)試和性能評(píng)估?

    光伏逆變器是光伏發(fā)電系統(tǒng)的關(guān)鍵設(shè)備,它將太陽(yáng)能電池板產(chǎn)生的直流電轉(zhuǎn)換為交流電,供給電網(wǎng)或用戶(hù)使用。為了保證光伏逆變器的正常運(yùn)行和提高其性能,需要進(jìn)行負(fù)載測(cè)試和性能評(píng)估。以下是進(jìn)行負(fù)載測(cè)試和性能
    發(fā)表于 12-12 09:44

    如何評(píng)估adc的性能參數(shù)

    評(píng)估ADC(模數(shù)轉(zhuǎn)換器)的性能參數(shù)是一個(gè)綜合考量多個(gè)因素的過(guò)程。以下是一些關(guān)鍵的ADC性能參數(shù)及其評(píng)估方法: 一、分辨率 分辨率是衡量ADC能夠區(qū)分的最小信號(hào)變化的能力,通常以位(bi
    的頭像 發(fā)表于 11-19 17:26 ?1530次閱讀

    多通道負(fù)載測(cè)試和性能評(píng)估?

    多通道負(fù)載測(cè)試和性能評(píng)估是軟件質(zhì)量保證的重要組成部分,它們可以幫助我們發(fā)現(xiàn)和解決系統(tǒng)的性能瓶頸,提高系統(tǒng)的可用性和穩(wěn)定性。 多通道負(fù)載測(cè)試是一種模擬多個(gè)用戶(hù)同時(shí)訪問(wèn)系統(tǒng)的方法,以檢查系統(tǒng)在高并發(fā)
    發(fā)表于 11-11 16:44

    如何評(píng)估智能系統(tǒng)的性能

    評(píng)估智能系統(tǒng)的性能是一個(gè)復(fù)雜而多維的任務(wù),它涉及多個(gè)方面和指標(biāo)。以下是一些關(guān)鍵的評(píng)估方法和策略: 一、功能測(cè)試 功能測(cè)試是評(píng)估智能系統(tǒng)是否按照預(yù)期執(zhí)行任務(wù)的關(guān)鍵環(huán)節(jié)。這包括: 單元測(cè)試
    的頭像 發(fā)表于 10-29 09:49 ?837次閱讀

    基于FPA的軟件工作量綜合評(píng)估研究與實(shí)踐

    方法基于軟件系統(tǒng)工作量估算法的融合,基于FPA評(píng)估法與專(zhuān)家經(jīng)驗(yàn)估算相結(jié)合,綜合評(píng)估軟件系統(tǒng)工作量,并將該方法實(shí)踐于多個(gè)項(xiàng)目中,結(jié)果得到了用戶(hù)的認(rèn)可,表明了綜合
    發(fā)表于 10-15 10:45 ?0次下載

    評(píng)估板中TAS5558的PWM輸出性能為什么實(shí)測(cè)達(dá)不到SPEC中的性能

    基于TAS5634評(píng)估板和相應(yīng)的gui軟件操作,對(duì)PWM輸出的單端和差分性能進(jìn)行了測(cè)試,目前按寄存器的默認(rèn)配置 三種調(diào)制方式都沒(méi)有達(dá)到SPEC中的性能,AD調(diào)制模式SNR測(cè)出約為77dB, BD
    發(fā)表于 10-09 10:04

    AM263x功率估算工具

    電子發(fā)燒友網(wǎng)站提供《AM263x功率估算工具.pdf》資料免費(fèi)下載
    發(fā)表于 09-09 09:42 ?0次下載
    AM263x功率<b class='flag-5'>估算</b>工具

    如何評(píng)估美國(guó)洛杉磯高防服務(wù)器的性能

    評(píng)估美國(guó)洛杉磯高防服務(wù)器的性能對(duì)于確保網(wǎng)站或應(yīng)用程序的穩(wěn)定性和安全性至關(guān)重要。高防服務(wù)器通常被用來(lái)抵御分布式拒絕服務(wù)(DDoS)攻擊和其他網(wǎng)絡(luò)威脅。下面是一篇科普性質(zhì)的文章,介紹如何評(píng)估這些服務(wù)器的
    的頭像 發(fā)表于 07-31 09:52 ?454次閱讀

    STM32F4用來(lái)作為計(jì)算單元的時(shí)候,如何評(píng)估算法或應(yīng)用的時(shí)間性能

    STM32F4用來(lái)作為計(jì)算單元的時(shí)候,如何評(píng)估算法或應(yīng)用的時(shí)間性能?能不能通過(guò)配置使之具備計(jì)時(shí)功能?精度達(dá)到us級(jí)別就足夠了。 關(guān)于計(jì)時(shí),在debug狀態(tài)下,通過(guò)states的計(jì)數(shù)值可以計(jì)算時(shí)間性能,但必須是debug設(shè)置斷點(diǎn)
    發(fā)表于 05-16 06:37