如上所示,就是常見的詞云圖。
所謂詞云圖,又稱文字云,是通過對(duì)一個(gè)或多個(gè)關(guān)鍵詞進(jìn)行重復(fù)的、字體大小顏色不一的、不規(guī)則的排列,使其看上去類似于某種形狀的圖片,是對(duì)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺化的展現(xiàn)。
詞云圖能過濾掉大量的低頻低質(zhì)的文本信息,使得瀏覽者只要一眼掃過文本就可領(lǐng)略文本的主旨。
關(guān)鍵詞云圖生成器作為生成云圖的一種工具,簡(jiǎn)化了制作過程。目前國(guó)內(nèi)外有很多關(guān)鍵詞云圖在線生成器,普遍按月或按年收費(fèi),在付費(fèi)時(shí)候盡量選擇可靠性強(qiáng)的。小編之前就遇到過付費(fèi)后,沒多久網(wǎng)站就消失不見了。
那么如何才能自己來(lái)做詞云圖呢?有幾種常見方法
1、使用WordArtWordArt是國(guó)外網(wǎng)站,支持自定義字體、詞云形狀、顏色等,做出來(lái)的詞云圖酷炫、精美,但訪問時(shí)響應(yīng)會(huì)比較緩慢。1.1 登錄網(wǎng)站W(wǎng)ordArt.com1.2 點(diǎn)擊Words-Import words導(dǎo)入事先準(zhǔn)備好的關(guān)鍵詞與其對(duì)應(yīng)詞頻,或是直接在對(duì)話框中輸入相應(yīng)關(guān)鍵詞。同時(shí)在頻數(shù),顏色,角度,字體中進(jìn)行設(shè)計(jì),以實(shí)現(xiàn)預(yù)設(shè)效果。
說明:
- Fonts:字體設(shè)置。該工具默認(rèn)字體為英文,如果詞云內(nèi)容為英文可以使用素材提供的字體,而涉及到中文內(nèi)容時(shí)我們需要選擇自行添加字體或是選擇素材庫(kù)中的Noto Sans S Chinese(可以識(shí)別部分中文)。
- Shapes:設(shè)計(jì)詞云的形狀??梢赃x擇提供的素材庫(kù)中的形狀也可以選擇Add Image/Add Text來(lái)自定義形狀。這里選擇輸入數(shù)字“2020”并在選項(xiàng)卡中設(shè)計(jì)斜體、輪廓、字體、背景以及字體顏色,設(shè)計(jì)完成后單擊Add將形狀添加進(jìn)來(lái)。
- Layout:內(nèi)容布局。在該選項(xiàng)卡中,可以更改設(shè)計(jì)文字方向和布局排列方式,該工具提供了許多現(xiàn)成的組合方案,只需按需加以勾選即可。同時(shí),在Words amount ,Density中也可以對(duì)填充內(nèi)容進(jìn)行設(shè)計(jì)。
- Style:詞云設(shè)計(jì),主要涉及關(guān)鍵詞具體內(nèi)容的編輯設(shè)計(jì)。通過參數(shù)調(diào)整,對(duì)背景以及底色進(jìn)行編輯修改。
1.3 生成詞云:?jiǎn)螕鬡isualize,即可生成詞云圖并預(yù)覽效果。1.4 導(dǎo)出圖片:點(diǎn)擊DOWNLOAD (選擇圖片格式)即可下載詞云圖。
2、借助開源軟件word-cloud是一款為 java 設(shè)計(jì)的云圖生成工具。目前該項(xiàng)目開源,地址在https://github.com/houbb/word-cloud
特性
極簡(jiǎn) api,一行代碼搞定一切
支持自定義云圖背景
支持中英文分詞,默認(rèn)對(duì)用戶透明
支持停頓詞過濾,默認(rèn)對(duì)用戶透明
支持各種用戶自定義配置
Maven引入
com.github.houbbword-cloud1.2.2使用
WordCloudHelper.wordCloud("該作講述的是一個(gè)名為德特茅斯的衰落小鎮(zhèn)下掩埋著一個(gè)古老的廢棄王國(guó),名叫圣巢。這個(gè)王國(guó)被瘟疫所侵蝕而廢棄,廢棄的原因則是因?yàn)槊麨檩椆獾墓庵派?,她可以通過思想來(lái)傳播瘟疫,被瘟疫侵蝕的蟲子都會(huì)被本能所支配,失去心智。\n" +"這個(gè)王國(guó)的主人——蒼白之王,自然不會(huì)坐視不管,他在圣巢范圍之下的深淵,利用另一種遠(yuǎn)古力量“虛空”可以壓制光明的特性,制造了容器一族。其中一位被選中的容器用來(lái)封印瘟疫,并被命名為空洞騎士。為了封印的穩(wěn)固,白王尋找了三個(gè)守夢(mèng)人來(lái)進(jìn)一步鞏固封印,三位守夢(mèng)人的名稱分別為守望者 - 盧瑞恩,導(dǎo)師 - 莫諾蒙,野獸 - 赫拉。但之后蒼白之王不知去向,不完美的容器的力量的也變得逐漸虛弱,最終被輻光控制。主角就要穿過圣巢的各地,在安息之地中,我們受到曾經(jīng)輻光的信徒和眷族——飛蛾族唯一留下的族人的幫助,獲得了和輻光力量同源的夢(mèng)之武器——夢(mèng)之釘。夢(mèng)之釘可以讀取生物內(nèi)心的想法,并可以打破守夢(mèng)人的保護(hù),進(jìn)入到其夢(mèng)境之中殺死守夢(mèng)人。殺死了三位守夢(mèng)人并解開封印后,可選的結(jié)局有到達(dá)十字路里的黑卵神殿打敗空洞騎士或去到在“尋神者”更新中新加入的地點(diǎn)“神居”并挑戰(zhàn)圣巢萬(wàn)神殿。");添加背景
//以鯨魚的背景,可以讓文字以圖像的形式展現(xiàn):String imagePath = "backgrounds\\whale_small.png";WordCloudHelper.wordCloud(text,"out_bg.png",imagePath);效果如下
3、使用python工具使用Python庫(kù)jieba,jieba是一個(gè)非常好用的中文工具,是以分詞起家的,但是功能比分詞要強(qiáng)大很多。
jieba分詞有三種模式:
jieba.cut返回的結(jié)構(gòu)都是一個(gè)可迭代的 generator,可以使用 for 循環(huán)來(lái)獲得分詞后得到的每一個(gè)詞語(yǔ)(unicode)。
jieba.cut方法接受三個(gè)輸入?yún)?shù):
需要分詞的字符串
cut_all 參數(shù)用來(lái)控制是否采用全模式,一般情況下,cut_all為False
HMM 參數(shù)用來(lái)控制是否使用 HMM 模型
示例:使用“Star.jpg”作為模板圖片和“myword.txt”文本制作詞云圖
Star.jpg

myword.txt
略
詳細(xì)代碼
###導(dǎo)入庫(kù)#導(dǎo)入wordcloud詞云制作第三方庫(kù),并導(dǎo)入WordCloud.ImageColorGenerator兩個(gè)模塊 from wordcloud import WordCloud.imageColorGenerator
#導(dǎo)入imageio庫(kù)importimageio
# 導(dǎo)入jieba庫(kù)importjieba
### 圖片處理# 用imageio庫(kù)中的imread函數(shù)讀取本地圖片testmg=imageio.imread("Star.jpg")
# 調(diào)用wordcloud庫(kù)中的ImageColorGenerator函數(shù)image_color=ImageColorGenerator(testimg)
# 給WordCloud函數(shù)傳入?yún)?shù)設(shè)置圖片相關(guān)屬性test=WordCloud(mask=testimg,#將testng的值賦值給mask用作遮罩圖width=500,#輸出圖片寬度為500pxheight=500,#輸出圖片高度為500pxbackground_color="white",#輸出圖片背景顏色為白色font-path="msyh.ttc"#字體路徑為微軟雅黑scale=15)#畫布放大比例為15
###文本處理# 引用外部文件,并用utf-8的編碼方式txt=open("myword.txt",encoding="utf-8").read()
# 調(diào)用詞云對(duì)象test的generate方法,導(dǎo)入文本# 使用jieba分詞的精確模式為文本進(jìn)行分詞test=test.recolor(color_func=image_color)
###輸出處理#將生成的詞云保存為result.png圖片文件,保存到當(dāng)前文件夾中test.to_file("result.png")效果圖

詞云圖不僅能用來(lái)突出關(guān)鍵詞,減少信息冗余,還能用于用戶圖像分析,快來(lái)試試吧。
-
云圖
+關(guān)注
關(guān)注
3文章
7瀏覽量
4635
發(fā)布評(píng)論請(qǐng)先 登錄
三種SPWM波形生成算法的分析與實(shí)現(xiàn)
MEMS中的三種測(cè)溫方式
開關(guān)電源三種控制模式:PWM/PFM/PSM
介紹三種常見的MySQL高可用方案
精選好文!噪聲系數(shù)測(cè)量的三種方法
信號(hào)隔離器三種供電方式的區(qū)別
一種永磁電機(jī)用轉(zhuǎn)子組件制作方法
CMOS,Bipolar,F(xiàn)ET這三種工藝的優(yōu)缺點(diǎn)是什么?
GaN、超級(jí)SI、SiC這三種MOS器件的用途區(qū)別
三種太赫茲波的產(chǎn)生方式
光伏系統(tǒng)的三種類型及其應(yīng)用分析
FPGA頻率測(cè)量的三種方法
示波器的三種觸發(fā)模式

三種制作詞云圖的方法,你覺得用哪一種更方便?
評(píng)論