python云圖制作(python詞云圖實例)
前言
詞云圖顧名思義就是把文本中的單詞制作成圖片的形式,其中單詞出現的頻率越高,那么相應的在圖片中所占的面積就大,如何制作詞云圖呢,首先獲取文本的內容,通過分詞解析單詞出現的頻率,然后生成對應的詞云圖
pyecharts環境以及相關模塊的安裝
詞云圖的繪制
關于詞云圖的一些看法
pyecharts環境的安裝
作者的python版本是2.7,由于pyecharts的1.0版本以上不再支持python2.7,所以我們使用的pyecharts是0.5.11這個版本,通過pip命令進行pyecharts的下載安裝
pip install pyecharts==0.5.11
安裝好pyecharts之后,我們還需要進行jieba的安裝,通過jieba這個模塊進行分詞
pip install jieba
注:pyecharts自帶的WordCloud可以制作網頁版的詞云圖
詞云圖的繪制
pyecharts中的WordCloud這個類主要用于詞云圖的生成
首先獲取制作詞云圖的文本文檔,作者采用之前寫過的一篇文章《使用python繪制中國地圖》作為數據源,通過jieba進行分詞和頻率統計,通過open函數將文章內容放到comment變量中,jieba進行分詞,然后將統計的詞頻存放到wordCount這個字典中,將字典中的k,v值分別提取出來放到name和value這兩個list中作為參數傳給詞云圖
wordcloud的add方法中的name和value分別是兩個list,表示屬性名稱和屬性對應的值。其中shape表示的是詞云圖的形狀,word_gap表示單詞間隔,默認為 20,word_size_range表示單詞字體大小范圍,默認為 [12, 60],rotate_step表示旋轉單詞的角度,默認為 45
注:詞云圖輪廓,有'circle', 'cardioid', 'diamond', 'triangle-forward', 'triangle', 'pentagon', 'star'可選,當且僅當 shape 為默認的'circle'時 rotate_step 參數才生效
關于詞云圖的一些看法
詞云圖通過對單詞權重不同的表示,其實權重就是單詞在文本中出現的頻率,來繪制單詞不同面積占比的圖片,可以達到良好的視覺效果,無效的信息由于出現的頻率可能比較低,所以可以有效的過濾。而重點的信息由于出現頻率高,可以非常直觀的從詞云圖中看出來。詞云圖可以從不同的維度,比如單詞的內容,單詞的頻率以及單詞的顏色等方面來展示數據,當做一些營銷熱點信息或者新聞類的內容等領域展示的時候,用詞云圖來做數據信息的分析還是很高效方便的
歡迎關注桓藝恒,一起探討交流有關python的技術領域
免責聲明:一、71愛課網旨在免費為用戶傳遞信息,不代表本站的觀點和立場;
二、71愛課網僅提供信息發布平臺,對于本文版權歸屬問題本站無法判斷和調查;
三、本文整理于會員新聞,如果侵犯您的版權,請聯系管理員刪除或增加版權信息(QQ:981561103)。