資料介紹
中文抽詞在中文自然語(yǔ)言處理中是最基礎(chǔ)的工作。本文提出了一種無(wú)詞典的t-score 和二分
相結(jié)合的抽詞算法。它首先對(duì)原始文本進(jìn)行預(yù)處理,利用噪音詞的輔助信息來(lái)做初始切分,經(jīng)過(guò)處理后一部分詞被抽取出來(lái),存入結(jié)果集。接著利用本文的抽詞算法來(lái)進(jìn)行二次抽詞,本算法應(yīng)用了N-Gram 的思想,經(jīng)過(guò)實(shí)驗(yàn)證明,該算法不但抽詞速度快,而且抽取出的詞相對(duì)長(zhǎng)度大,維護(hù)了中文語(yǔ)言的完整性,為進(jìn)一步進(jìn)行語(yǔ)義分析和索引構(gòu)建打下了良好的基礎(chǔ)。
關(guān)鍵字:無(wú)詞典;t-score;二分法;快速抽詞
相結(jié)合的抽詞算法。它首先對(duì)原始文本進(jìn)行預(yù)處理,利用噪音詞的輔助信息來(lái)做初始切分,經(jīng)過(guò)處理后一部分詞被抽取出來(lái),存入結(jié)果集。接著利用本文的抽詞算法來(lái)進(jìn)行二次抽詞,本算法應(yīng)用了N-Gram 的思想,經(jīng)過(guò)實(shí)驗(yàn)證明,該算法不但抽詞速度快,而且抽取出的詞相對(duì)長(zhǎng)度大,維護(hù)了中文語(yǔ)言的完整性,為進(jìn)一步進(jìn)行語(yǔ)義分析和索引構(gòu)建打下了良好的基礎(chǔ)。
關(guān)鍵字:無(wú)詞典;t-score;二分法;快速抽詞
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 一種PLC控制步進(jìn)電機(jī)的分度算法 8次下載
- 一種側(cè)重于學(xué)習(xí)情感特征的預(yù)訓(xùn)練方法 4次下載
- 一種基于詞和文檔嵌入的關(guān)鍵詞抽取方法 4次下載
- 一種用于釋義識(shí)別的句子相似度算法 8次下載
- 一種針對(duì)DoT算法的模板攻擊方法 8次下載
- 一種針對(duì)DoT算法的模板攻擊方法 12次下載
- 一種適用于FPGA實(shí)現(xiàn)的盲均衡算法 7次下載
- 一種加權(quán)最大相關(guān)最小相似視覺(jué)詞典優(yōu)化 2次下載
- 一種低硬件資源消耗快速SVPWM算法 0次下載
- 一種新型的預(yù)測(cè)功能控制算法
- 一種求解電大平臺(tái)天線互耦的時(shí)域積分方程快速算法
- 一種無(wú)詞典快速抽詞算法的設(shè)計(jì)和實(shí)現(xiàn)
- 一種公歷到農(nóng)歷日期轉(zhuǎn)換算法的實(shí)現(xiàn)
- 一種基于SYN 漏洞的DDoS攻擊防御算法的實(shí)現(xiàn)
- 一種基于序列譯碼的快速相關(guān)攻擊算法
- 講解消息分發(fā)的一種編譯期實(shí)現(xiàn)法 575次閱讀
- 基于一種用于JumpStarter的抗離群的采樣算法 720次閱讀
- 基于一種無(wú)OS的MCU實(shí)用軟件框架 724次閱讀
- 一種實(shí)用的嵌入式無(wú) OS 軟件框架 685次閱讀
- MD5到底算不算一種加密算法? 1668次閱讀
- 基于CORDIC的高速Sobel算法實(shí)現(xiàn) 3584次閱讀
- 一種全新的無(wú)監(jiān)督機(jī)器翻譯方法,在BLUE基準(zhǔn)測(cè)試上取得了10分以上提升 6039次閱讀
- 基于接收機(jī)的應(yīng)用提出了一種混合式高動(dòng)態(tài)范圍AGC算法 6954次閱讀
- 一種基于STM32的智能采油控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 2393次閱讀
- 一種基于分布式算法的低通FIR濾波器 3282次閱讀
- 一種FFT插值正弦波快速頻率估計(jì)算法 9657次閱讀
- 一種AES密碼算法的實(shí)現(xiàn) 3174次閱讀
- 快速高效的實(shí)現(xiàn)浮點(diǎn)復(fù)數(shù)矩陣分解 1034次閱讀
- 基于圖像增強(qiáng)的去霧快速算法的FPGA實(shí)現(xiàn) 5406次閱讀
- 一種改進(jìn)的無(wú)線傳感器網(wǎng)絡(luò)非測(cè)距定位算法 1299次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費(fèi)
- 2AN158 GD32VW553 Wi-Fi開(kāi)發(fā)指南
- 1.51MB | 2次下載 | 免費(fèi)
- 3AN148 GD32VW553射頻硬件開(kāi)發(fā)指南
- 2.07MB | 1次下載 | 免費(fèi)
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費(fèi)
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費(fèi)
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費(fèi)
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費(fèi)
- 8AN-1308: 電流檢測(cè)放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費(fèi)
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費(fèi)
- 2免費(fèi)開(kāi)源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 130次下載 | 免費(fèi)
- 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 53314A函數(shù)發(fā)生器維修手冊(cè)
- 16.30 MB | 31次下載 | 免費(fèi)
- 6美的電磁爐維修手冊(cè)大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測(cè)試電源的紋波
- 0.36 MB | 17次下載 | 免費(fèi)
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論