随笔

wordcloud库的简介及使用

wordcloud库简介

wordcloud是优秀的词云展示第三方库
  • 词云以词语为基本单位,更加直观和艺术的展示文本

    例如:

02.png

wordcloud库安装

(用cmd命令行)输入pip install wordcloud命令即可安装

03.png

wordcloud库的使用

wordcloud库把词云当作一个WordCloud对象
  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词云出现的频率等参数绘制词云
  • 绘制词云的形状、尺寸和颜色都可以设定

wordcloud库常规方法

w = wordcloud.WordCloud()
  • WordCloud对象为基础
  • 配置参数、加载文本、输出文件
方法说明
w.generate(txt)WordCloud对象w中加载文本txt
>>> w.generate("Python and WordCloud")
w.to_file(filename)将词云输出为图像文件,.png.jpg格式
>>> w.to_file("outfile.png")

配置对象参数

w = wordcloud.WordCloud(<参数>)
参数说明
width指定词云对象生成图片的宽度,默认400px
>>> w = wordcloud.WordCloud(with = 600)
height指定词云对象生成图片的高度,默认200px
>>> w = wordcloud.WordCloud(height = 400)
min_font_size指定词云中的最小字号,默认4号
>>> w = wordcloud.WordCloud(min_font_size = 10)
max_font_size指定词云中字体的最大字号,根据高度自动调节
w = wordcloud.WordCloud(max_font_size)
font_step指定词云中字体字号的步进间隔,默认为1
>>> w = wordcloud.WordCloud(font_step = 2)
font_path指定字体文件的路径,默认为None
>>> w = wordcloud.WordCloud(font_path = "msyh.ttc")
max_words指定词云显示的最大单词数量,默认200
>>> w = wordcloud.WordCloud(max_words = 20)
stop_words指定词云的排除词列表,即不显示的单词列表
>>> w = wordcloud.WordCloud(stop_words = {"python"})
mask指定词云形状,默认为长方形,需要引用imread()函数
>>> from scipy.misc import imread
>>> mk = imread("picture.png")
>>> w = wordcloud.WordCloud(mask = mk)
background_color指定词云图片的背景颜色,默认黑色
>>> w = wordcloud.WordCloud(background_color = "white")

评论

This is just a placeholder img.