資料介紹
0 前言
隨著智能手機(jī)和平板電腦等無輸入鍵盤電子設(shè)備的流行,聯(lián)機(jī)手寫識別的研究吸引了越來越多的關(guān)注。而手寫簽名驗(yàn)證和基于3D加速度傳感器的姿態(tài)識別、手寫識別等新應(yīng)用形式的出現(xiàn),也為聯(lián)機(jī)手寫識別的研究注入了新的活力。
支持向量機(jī)(Support Vector Machine,SVM)是在統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的新一代分類識別算法,使用核函數(shù)方法將非線性可分的特征向量映射到高維空間,計算最大化分類間隔的最優(yōu)分類超平面。在文本分類、語音識別、手寫識別、曲線擬合等領(lǐng)域,SVM已經(jīng)有比較成熟的應(yīng)用。但是,一般的核函數(shù)要求不同樣本的特征向量的維數(shù)相同,限制了SVM在語音識別和聯(lián)機(jī)手寫識別領(lǐng)域的進(jìn)一步發(fā)展。為此,Bahlmann等人使用彈性距離計算算法--DTW算法--構(gòu)造了GDTW核函數(shù),進(jìn)而提出GDTW-SVM算法。GDTW-SVM的聯(lián)機(jī)手寫識別實(shí)驗(yàn)結(jié)果表明,GDT W-SVM取得了可媲美隱馬爾科夫模型、神經(jīng)網(wǎng)絡(luò)等分類算法的識別率,并且與使用后來提出的基于其它彈性距離計算構(gòu)造的核函數(shù)的SVM相比,性能不相伯仲。
本文結(jié)合GDTW核函數(shù)和聯(lián)機(jī)手寫識別樣本的特征向量的特點(diǎn),引入新的控制參數(shù)優(yōu)化GDTW核函數(shù)的計算。實(shí)驗(yàn)結(jié)果表明,本文提出的優(yōu)化方法不僅減少了支持向量的數(shù)目,而且提高了GDTW-SVM運(yùn)行效率。
1 聯(lián)機(jī)手寫識別過程
1.1 聯(lián)機(jī)手寫識別流程介紹
聯(lián)機(jī)手寫識別的過程與通用模式識別的過程基本相同,由數(shù)據(jù)采集和預(yù)處理、特征提取、分類識別、后處理四個步驟組成。
在數(shù)據(jù)采集和預(yù)處理階段,首先使用傳感器采集原始物理信息,比較常見的是加速度、速度、位移、起筆和落筆;然后,對原始信息進(jìn)行傳感器矯正、去噪等預(yù)處理。
特征提取是手寫識別的重要步驟之一,對分類器的設(shè)計和分類結(jié)果有著重要的影響,選擇合適的特征不僅可以提高識別率,也可以節(jié)省計算存儲空間、運(yùn)算時間、特征提取費(fèi)用。聯(lián)機(jī)手寫識別中比較常見特征提取方法有加速度、位移、DCT變換等。
分類識別是手寫識別的核心階段,大多數(shù)分類器在實(shí)際分類應(yīng)用之前,需要使用訓(xùn)練樣本對分類器進(jìn)行訓(xùn)練,不斷地修正特征提取方法和方案、分類器的判決規(guī)則和參數(shù)。目前,分類識別的訓(xùn)練階段需要人工干預(yù)以達(dá)到最佳的識別率。
一些識別系統(tǒng)在分類識別之后使用后處理進(jìn)一步提高識別率。例如,數(shù)字“1”和小寫字母“1”在很多情況下難以分辨,但是在后處理階段結(jié)合上下文信息,決定當(dāng)前字符是數(shù)字“1”還是小寫字母“1”。
1.2 聯(lián)機(jī)手寫識別實(shí)驗(yàn)
本文聯(lián)機(jī)手寫識別實(shí)驗(yàn)采用了Bahlmann等人和Bothe等人使用的方法。所使用的樣本數(shù)據(jù)庫是免費(fèi)的聯(lián)機(jī)手寫數(shù)據(jù)庫UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60個書寫者的共11640個手寫樣本。這些樣本包含ASCII字符、拉丁字符和西班牙字符,而每個字符包含80個訓(xùn)練樣本和140個測試樣本。每個樣本由一劃或多劃組成,數(shù)據(jù)庫提供每個筆劃的坐標(biāo)序列。
坐標(biāo)序列由等時間間隔采集的筆尖的水平坐標(biāo)xi和垂直坐標(biāo)yi組成。而在本文實(shí)驗(yàn)中,樣本的坐標(biāo)序列不經(jīng)過任何去噪等預(yù)處理,直接對每個坐標(biāo)點(diǎn),使用字符的重心(μx,μy)和垂直坐標(biāo)的方差σy計算列向量

式(1)中,ang是求虛數(shù)相角的函數(shù)。每個字符樣本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐標(biāo)點(diǎn)數(shù)目,即特征向量的維數(shù),每個字符樣本的NT可以不相同。
本文的聯(lián)機(jī)手寫識別實(shí)驗(yàn)假設(shè)每個字符不需要分析其上下文即可完成識別,所以,特征提取之后使用本文所述的分類算法進(jìn)行分類識別,并且將其輸出結(jié)果作為最終識別結(jié)果,不經(jīng)過任何后處理。
2 GDTW-SVM算法
2.1 支持向量機(jī)
假設(shè)線性分類器對輸入的特征向量x={x1,x2,…xn}(n是樣本數(shù)目),輸出Y={y1,y2,…,yn}其中,xi,I RN,N是特征向量的維數(shù):yi∈{-1,1}, yi=-1表示樣本(xi,yi)屬于第一類,yi=1表示樣本(xi,yi)屬于另一類。該線性分類器的分類決策為
y(+b)≥1 (2)
式(2)中(w,b)確定分類超平面+b=0。
SVM以最小化結(jié)構(gòu)風(fēng)險為目標(biāo),計算使得訓(xùn)練樣本集到分類超平面的距離最大化的最優(yōu)分類超平面。其等價于對式(2)求解凸二次規(guī)劃問題。

即尋找使平均距離最小的最優(yōu)對齊路徑。DTW距離越小,T和R所代表的樣本越相似??梢允褂脛討B(tài)規(guī)劃(Dynamic Programming)算法計算最優(yōu)對齊路徑和DTW距離。
隨著智能手機(jī)和平板電腦等無輸入鍵盤電子設(shè)備的流行,聯(lián)機(jī)手寫識別的研究吸引了越來越多的關(guān)注。而手寫簽名驗(yàn)證和基于3D加速度傳感器的姿態(tài)識別、手寫識別等新應(yīng)用形式的出現(xiàn),也為聯(lián)機(jī)手寫識別的研究注入了新的活力。
支持向量機(jī)(Support Vector Machine,SVM)是在統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的新一代分類識別算法,使用核函數(shù)方法將非線性可分的特征向量映射到高維空間,計算最大化分類間隔的最優(yōu)分類超平面。在文本分類、語音識別、手寫識別、曲線擬合等領(lǐng)域,SVM已經(jīng)有比較成熟的應(yīng)用。但是,一般的核函數(shù)要求不同樣本的特征向量的維數(shù)相同,限制了SVM在語音識別和聯(lián)機(jī)手寫識別領(lǐng)域的進(jìn)一步發(fā)展。為此,Bahlmann等人使用彈性距離計算算法--DTW算法--構(gòu)造了GDTW核函數(shù),進(jìn)而提出GDTW-SVM算法。GDTW-SVM的聯(lián)機(jī)手寫識別實(shí)驗(yàn)結(jié)果表明,GDT W-SVM取得了可媲美隱馬爾科夫模型、神經(jīng)網(wǎng)絡(luò)等分類算法的識別率,并且與使用后來提出的基于其它彈性距離計算構(gòu)造的核函數(shù)的SVM相比,性能不相伯仲。
本文結(jié)合GDTW核函數(shù)和聯(lián)機(jī)手寫識別樣本的特征向量的特點(diǎn),引入新的控制參數(shù)優(yōu)化GDTW核函數(shù)的計算。實(shí)驗(yàn)結(jié)果表明,本文提出的優(yōu)化方法不僅減少了支持向量的數(shù)目,而且提高了GDTW-SVM運(yùn)行效率。
1 聯(lián)機(jī)手寫識別過程
1.1 聯(lián)機(jī)手寫識別流程介紹
聯(lián)機(jī)手寫識別的過程與通用模式識別的過程基本相同,由數(shù)據(jù)采集和預(yù)處理、特征提取、分類識別、后處理四個步驟組成。
在數(shù)據(jù)采集和預(yù)處理階段,首先使用傳感器采集原始物理信息,比較常見的是加速度、速度、位移、起筆和落筆;然后,對原始信息進(jìn)行傳感器矯正、去噪等預(yù)處理。
特征提取是手寫識別的重要步驟之一,對分類器的設(shè)計和分類結(jié)果有著重要的影響,選擇合適的特征不僅可以提高識別率,也可以節(jié)省計算存儲空間、運(yùn)算時間、特征提取費(fèi)用。聯(lián)機(jī)手寫識別中比較常見特征提取方法有加速度、位移、DCT變換等。
分類識別是手寫識別的核心階段,大多數(shù)分類器在實(shí)際分類應(yīng)用之前,需要使用訓(xùn)練樣本對分類器進(jìn)行訓(xùn)練,不斷地修正特征提取方法和方案、分類器的判決規(guī)則和參數(shù)。目前,分類識別的訓(xùn)練階段需要人工干預(yù)以達(dá)到最佳的識別率。
一些識別系統(tǒng)在分類識別之后使用后處理進(jìn)一步提高識別率。例如,數(shù)字“1”和小寫字母“1”在很多情況下難以分辨,但是在后處理階段結(jié)合上下文信息,決定當(dāng)前字符是數(shù)字“1”還是小寫字母“1”。
1.2 聯(lián)機(jī)手寫識別實(shí)驗(yàn)
本文聯(lián)機(jī)手寫識別實(shí)驗(yàn)采用了Bahlmann等人和Bothe等人使用的方法。所使用的樣本數(shù)據(jù)庫是免費(fèi)的聯(lián)機(jī)手寫數(shù)據(jù)庫UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60個書寫者的共11640個手寫樣本。這些樣本包含ASCII字符、拉丁字符和西班牙字符,而每個字符包含80個訓(xùn)練樣本和140個測試樣本。每個樣本由一劃或多劃組成,數(shù)據(jù)庫提供每個筆劃的坐標(biāo)序列。
坐標(biāo)序列由等時間間隔采集的筆尖的水平坐標(biāo)xi和垂直坐標(biāo)yi組成。而在本文實(shí)驗(yàn)中,樣本的坐標(biāo)序列不經(jīng)過任何去噪等預(yù)處理,直接對每個坐標(biāo)點(diǎn),使用字符的重心(μx,μy)和垂直坐標(biāo)的方差σy計算列向量

式(1)中,ang是求虛數(shù)相角的函數(shù)。每個字符樣本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐標(biāo)點(diǎn)數(shù)目,即特征向量的維數(shù),每個字符樣本的NT可以不相同。
本文的聯(lián)機(jī)手寫識別實(shí)驗(yàn)假設(shè)每個字符不需要分析其上下文即可完成識別,所以,特征提取之后使用本文所述的分類算法進(jìn)行分類識別,并且將其輸出結(jié)果作為最終識別結(jié)果,不經(jīng)過任何后處理。
2 GDTW-SVM算法
2.1 支持向量機(jī)
假設(shè)線性分類器對輸入的特征向量x={x1,x2,…xn}(n是樣本數(shù)目),輸出Y={y1,y2,…,yn}其中,xi,I RN,N是特征向量的維數(shù):yi∈{-1,1}, yi=-1表示樣本(xi,yi)屬于第一類,yi=1表示樣本(xi,yi)屬于另一類。該線性分類器的分類決策為
y(+b)≥1 (2)
式(2)中(w,b)確定分類超平面+b=0。
SVM以最小化結(jié)構(gòu)風(fēng)險為目標(biāo),計算使得訓(xùn)練樣本集到分類超平面的距離最大化的最優(yōu)分類超平面。其等價于對式(2)求解凸二次規(guī)劃問題。

即尋找使平均距離最小的最優(yōu)對齊路徑。DTW距離越小,T和R所代表的樣本越相似??梢允褂脛討B(tài)規(guī)劃(Dynamic Programming)算法計算最優(yōu)對齊路徑和DTW距離。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 最小內(nèi)內(nèi)方差支持向量引導(dǎo)的字典學(xué)習(xí)算法 7次下載
- 支持向量機(jī)網(wǎng)絡(luò)搜索優(yōu)化應(yīng)用程序下載 0次下載
- 支持向量機(jī)的手勢識別 1次下載
- 模糊支持向量機(jī)的改進(jìn)方法 0次下載
- 基于支持向量機(jī)的車牌字符識別_劉連忠 0次下載
- 雙目標(biāo)函數(shù)支持向量機(jī)在情感分析中的應(yīng)用 0次下載
- 支持向量機(jī)的多組分氣體實(shí)驗(yàn) 14次下載
- 基于支持向量機(jī)的數(shù)字調(diào)制識別算法 20次下載
- 支持向量機(jī)語音識別算法在OMAP5912上的移植
- 基于支持向量機(jī)的手勢識別研究
- 基于改進(jìn)支持向量機(jī)的貨幣識別研究
- 基于小波變換與支持向量機(jī)的虹膜識別新算法
- 基于ANN和HMM的聯(lián)機(jī)手寫體漢字識別系統(tǒng)
- SVM在小字符集手寫體漢字識別中的應(yīng)用研究
- 支持向量機(jī)超聲缺陷識別法的研究
- 什么是中斷向量偏移,為什么要做中斷向量偏移? 1876次閱讀
- 機(jī)器學(xué)習(xí)相關(guān)介紹:支持向量機(jī)(低維到高維的映射) 2215次閱讀
- 誤差向量分析實(shí)際的測量與應(yīng)用 3189次閱讀
- 什么是支持向量機(jī) 什么是支持向量 2.2w次閱讀
- 基于貝塞爾曲線和RNN的手寫識別新方法 4050次閱讀
- 支持向量機(jī)的分類思想 5512次閱讀
- 人臉識別閘機(jī)的功能及工作原理_視美泰的人臉識別閘機(jī)方案分析 1.9w次閱讀
- 關(guān)于支持向量機(jī)(SVMs) 4212次閱讀
- 機(jī)器學(xué)習(xí)-8. 支持向量機(jī)(SVMs)概述和計算 5250次閱讀
- 人臉識別考勤機(jī)優(yōu)缺點(diǎn)分析 2w次閱讀
- 人臉識別考勤機(jī)的工作原理詳解(安裝注意事項(xiàng)和使用方法以及優(yōu)缺點(diǎn)分析) 6.1w次閱讀
- 基于paddlepaddle的mnist手寫數(shù)字識別的詳細(xì)分析 6390次閱讀
- S Pen手寫筆淺析_S Pen手寫筆工作原理及發(fā)展前景 1.2w次閱讀
- 什么是手寫繪圖板 手寫板哪個品牌好價格怎么樣 6669次閱讀
- 劃片機(jī)視覺識別系統(tǒng)設(shè)計原理分析 3015次閱讀
下載排行
本周
- 1PC3103 低功耗電流模式PWM控制器技術(shù)手冊
- 1.23 MB | 3次下載 | 免費(fèi)
- 2L7805CV TO-220三端穩(wěn)壓IC規(guī)格書
- 0.71 MB | 1次下載 | 免費(fèi)
- 3LoRa2021 全頻段無線通訊模塊規(guī)格書
- 814.22 KB | 1次下載 | 免費(fèi)
- 4L7812CV TO-220三端穩(wěn)壓IC規(guī)格書
- 1.35 MB | 次下載 | 免費(fèi)
- 5L7815CV TO-220三端穩(wěn)壓IC規(guī)格書
- 1.48 MB | 次下載 | 免費(fèi)
- 6N-12電子傾斜儀指南
- 0.24 MB | 次下載 | 10 積分
- 7基于CP500S掃描測頭的三坐標(biāo)測量系統(tǒng):復(fù)雜曲面零件解決方案
- 0.35 MB | 次下載 | 免費(fèi)
- 8STM32H747xI/G 英文數(shù)據(jù)手冊
- 5.09 MB | 次下載 | 免費(fèi)
本月
- 1PFC電路與BOOST電路設(shè)計實(shí)例分享
- 1.83 MB | 18次下載 | 4 積分
- 2電源測試報告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
- 6.47 MB | 17次下載 | 免費(fèi)
- 3世平基于靈動微 SPIN560C 的低壓無刷電機(jī)應(yīng)用方案
- 10.93 MB | 11次下載 | 免費(fèi)
- 4900MHz全雙工無線發(fā)射器參考設(shè)計原理圖資料
- 0.40 MB | 6次下載 | 免費(fèi)
- 5PWM控制器的控制方法
- 0.39 MB | 3次下載 | 4 積分
- 6900MHz全雙工無線發(fā)射器參考設(shè)計
- 0.15 MB | 3次下載 | 1 積分
- 7美的電磁爐TM-S1-20B PN8124F+CHK S009資料圖
- 0.28 MB | 3次下載 | 10 積分
- 8FS313B USB 的 PD和QC 快充協(xié)議電壓誘騙控制器規(guī)格書
- 2.61 MB | 3次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935134次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191424次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183352次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73819次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論