資料介紹
針對(duì)數(shù)字城市研究手段不足,尤其在收集大量研究文獻(xiàn)的基礎(chǔ)上對(duì)數(shù)字城市進(jìn)行整體研究上的欠缺,本文基于R語(yǔ)言和Selenium框架設(shè)計(jì)了穩(wěn)定、高效的爬蟲程序,獲取了中國(guó)知網(wǎng)2018年5月前收錄的數(shù)字城市為主題的研究文獻(xiàn),并建立了數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(kù)和數(shù)字城市自動(dòng)分詞模型。通過(guò)分析數(shù)字城市研究的時(shí)序性、空間分布特征和研究熱點(diǎn),揭示了數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢(shì)和研究熱點(diǎn)。結(jié)果表明本文設(shè)計(jì)的網(wǎng)絡(luò)爬蟲程序在數(shù)字城市研究文獻(xiàn)的收集方面具有可行性和有效性。
數(shù)字城市源自“數(shù)字地球”的概念,是把城市的地理信息和其他與城市相關(guān)的信息結(jié)合并存儲(chǔ)在計(jì)算機(jī)網(wǎng)絡(luò)中,讓城市和城市外空間連接在一起的虛擬空間[1]。目前數(shù)字城市的建設(shè)在全國(guó)多個(gè)省份、城市中展開,行業(yè)應(yīng)用深入城市的各個(gè)領(lǐng)域。關(guān)于數(shù)字城市的研究,近年來(lái)雖然不乏技術(shù)和理論等方面的研究,但從獲取大量的數(shù)字城市研究文獻(xiàn)的角度對(duì)數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢(shì)、研究熱點(diǎn)的研究目前還沒(méi)有。
?
網(wǎng)絡(luò)爬蟲是依據(jù)程序,模擬訪問(wèn)網(wǎng)頁(yè)、自動(dòng)化提取網(wǎng)頁(yè)信息的腳本,是快速獲取網(wǎng)頁(yè)信息的一種方式。網(wǎng)絡(luò)爬蟲按照類型主要分為通用型爬蟲、面向主題爬蟲、分布式爬蟲三種,相比較而言面向主題爬蟲應(yīng)用廣泛,形式較為靈活,可針對(duì)特定的網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行設(shè)計(jì)高效的爬蟲程序。
本文采用面向主題的網(wǎng)絡(luò)爬蟲方法,以中國(guó)知網(wǎng)(National Knowledge Infrastructure, CNKI) 2018 年5 月前收錄的以數(shù)字城市為主題的文獻(xiàn)為研究對(duì)象,基于R 語(yǔ)言和Selenium 網(wǎng)絡(luò)框架設(shè)計(jì)出網(wǎng)絡(luò)爬蟲程序。該程序?qū)χ袊?guó)知網(wǎng)的網(wǎng)頁(yè)進(jìn)行分析,獲取網(wǎng)頁(yè)請(qǐng)求參數(shù),模擬瀏覽器請(qǐng)求和響應(yīng)服務(wù)器,最終獲取了數(shù)字城市研究文獻(xiàn)信息,將獲取到的數(shù)據(jù)同步保存到本地,構(gòu)建數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(kù)(包括:編號(hào)、題名、作者、來(lái)源、發(fā)表時(shí)間、數(shù)據(jù)庫(kù)、被引、下載次數(shù)、作者單位、摘要、關(guān)鍵詞、資助基金共12 個(gè)字段)。并以數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(kù)為數(shù)據(jù)基礎(chǔ),基于文本挖掘技術(shù)構(gòu)建了數(shù)字城市自動(dòng)分詞模型,通過(guò)分析數(shù)字城市研究的時(shí)序性、空間分布特征和研究熱點(diǎn),揭示了數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢(shì)和熱點(diǎn)。
數(shù)字城市源自“數(shù)字地球”的概念,是把城市的地理信息和其他與城市相關(guān)的信息結(jié)合并存儲(chǔ)在計(jì)算機(jī)網(wǎng)絡(luò)中,讓城市和城市外空間連接在一起的虛擬空間[1]。目前數(shù)字城市的建設(shè)在全國(guó)多個(gè)省份、城市中展開,行業(yè)應(yīng)用深入城市的各個(gè)領(lǐng)域。關(guān)于數(shù)字城市的研究,近年來(lái)雖然不乏技術(shù)和理論等方面的研究,但從獲取大量的數(shù)字城市研究文獻(xiàn)的角度對(duì)數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢(shì)、研究熱點(diǎn)的研究目前還沒(méi)有。
網(wǎng)絡(luò)爬蟲是依據(jù)程序,模擬訪問(wèn)網(wǎng)頁(yè)、自動(dòng)化提取網(wǎng)頁(yè)信息的腳本,是快速獲取網(wǎng)頁(yè)信息的一種方式。網(wǎng)絡(luò)爬蟲按照類型主要分為通用型爬蟲、面向主題爬蟲、分布式爬蟲三種,相比較而言面向主題爬蟲應(yīng)用廣泛,形式較為靈活,可針對(duì)特定的網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行設(shè)計(jì)高效的爬蟲程序。
本文采用面向主題的網(wǎng)絡(luò)爬蟲方法,以中國(guó)知網(wǎng)(National Knowledge Infrastructure, CNKI) 2018 年5 月前收錄的以數(shù)字城市為主題的文獻(xiàn)為研究對(duì)象,基于R 語(yǔ)言和Selenium 網(wǎng)絡(luò)框架設(shè)計(jì)出網(wǎng)絡(luò)爬蟲程序。該程序?qū)χ袊?guó)知網(wǎng)的網(wǎng)頁(yè)進(jìn)行分析,獲取網(wǎng)頁(yè)請(qǐng)求參數(shù),模擬瀏覽器請(qǐng)求和響應(yīng)服務(wù)器,最終獲取了數(shù)字城市研究文獻(xiàn)信息,將獲取到的數(shù)據(jù)同步保存到本地,構(gòu)建數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(kù)(包括:編號(hào)、題名、作者、來(lái)源、發(fā)表時(shí)間、數(shù)據(jù)庫(kù)、被引、下載次數(shù)、作者單位、摘要、關(guān)鍵詞、資助基金共12 個(gè)字段)。并以數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(kù)為數(shù)據(jù)基礎(chǔ),基于文本挖掘技術(shù)構(gòu)建了數(shù)字城市自動(dòng)分詞模型,通過(guò)分析數(shù)字城市研究的時(shí)序性、空間分布特征和研究熱點(diǎn),揭示了數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢(shì)和熱點(diǎn)。
- 網(wǎng)絡(luò)爬蟲,Python和數(shù)據(jù)分析 2次下載
- 用Python寫網(wǎng)絡(luò)爬蟲 21次下載
- 什么是網(wǎng)絡(luò)爬蟲使用Python寫網(wǎng)絡(luò)爬蟲的教程說(shuō)明 3次下載
- 用Python寫網(wǎng)絡(luò)爬蟲的PDF電子書免費(fèi)下載 9次下載
- 爬蟲是如何實(shí)現(xiàn)數(shù)據(jù)的獲取爬蟲程序如何實(shí)現(xiàn) 10次下載
- 如何設(shè)計(jì)一個(gè)網(wǎng)絡(luò)爬蟲程序進(jìn)行智慧城市研究的獲取與分析 9次下載
- 如何使用大數(shù)據(jù)技術(shù)進(jìn)行居民在夜間的情感變化研究資料分析 5次下載
- python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎 30次下載
- 詳細(xì)用Python寫網(wǎng)絡(luò)爬蟲 32次下載
- 應(yīng)用Verilog HDL進(jìn)行數(shù)字系統(tǒng)設(shè)計(jì)實(shí)例 88次下載
- 一種新型網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)
- 一種新的網(wǎng)絡(luò)爬蟲帶寬控制策略
- 一種維護(hù)WAP網(wǎng)站的網(wǎng)絡(luò)爬蟲的設(shè)計(jì)
- 基于HTMLParser 信息提取的網(wǎng)絡(luò)爬蟲設(shè)計(jì)Design
- “數(shù)字城市”初步研究
- Nginx限流與防爬蟲配置方案 741次閱讀
- 如何使用 Verilog 進(jìn)行數(shù)字電路設(shè)計(jì) 1.9k次閱讀
- 如何看待Python爬蟲的合法性? 1.6k次閱讀
- 網(wǎng)絡(luò)封包分析軟件——Wireshark抓包教程 2.2k次閱讀
- 爬蟲的學(xué)習(xí)方法 1.7k次閱讀
- Python-爬蟲開發(fā)01 1.3k次閱讀
- 網(wǎng)絡(luò)數(shù)據(jù)包分析軟件wireshark的基本使用 4.2k次閱讀
- 爬蟲技術(shù)為什么變成了害蟲?爬蟲技術(shù)到底犯了什么錯(cuò)? 4.7k次閱讀
- 如何解決爬蟲被封的問(wèn)題 6k次閱讀
- Python爬蟲8個(gè)常用的爬蟲技巧分析總結(jié) 5.5k次閱讀
- Python3網(wǎng)絡(luò)爬蟲入門實(shí)戰(zhàn)解析 6k次閱讀
- Python爬蟲速成指南讓你快速的學(xué)會(huì)寫一個(gè)最簡(jiǎn)單的爬蟲 7.5k次閱讀
- Python學(xué)習(xí)爬蟲掌握的庫(kù)資料大全和框架的選擇的分析 5.7k次閱讀
- 網(wǎng)絡(luò)爬蟲教程(1):音樂(lè)歌單編寫 1.4k次閱讀
- 針對(duì)中小城市GSM網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)劃和整治流程及方案分析 920次閱讀
下載排行
本周
- 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 1次下載 | 免費(fèi)
- 2MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
- 2.33 MB | 次下載 | 免費(fèi)
- 3MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
- 2.62 MB | 次下載 | 免費(fèi)
- 4聯(lián)想flex2-14D/15D說(shuō)明書
- 4.92 MB | 次下載 | 免費(fèi)
- 5收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
- 2.50 MB | 次下載 | 免費(fèi)
- 624Pin Type-C連接器設(shè)計(jì)報(bào)告
- 1.06 MB | 次下載 | 免費(fèi)
- 7MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
- 0.60 MB | 次下載 | 免費(fèi)
- 8MS1022高精度時(shí)間測(cè)量(TDC)電路數(shù)據(jù)手冊(cè)
- 1.81 MB | 次下載 | 免費(fèi)
本月
- 1愛(ài)華AIWA HS-J202維修手冊(cè)
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說(shuō)明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費(fèi)
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8100W準(zhǔn)諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問(wèn)
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論