百度热搜词词云图-python

百度热搜词词云图-python

import time
import imageio
import requests
from wordcloud import WordCloud

url = 'http://top.baidu.com/region/singlelist'

'''
省份热搜词
'''
# 城市列表
list = [928, 934, 911, 904, 909, 913, 925, 912, 902, 920, 921, 927, 908, 906, 930, 922, 916, 903, 907, 905, 919, 918,
        910, 914, 901, 929, 924, 923, 931, 932, 933, 926, 915, 917, ]
result = {}
# 循环获取信息
for i in list:
    data = {
        'boardid': '2',
        'divids[]': i,
    }
    html = requests.post(url=url, data=data).json()
    x = str(i)
    data = html['topWords'][x]
    lists = {i['keyword']: i['searches'] for i in data}
    result.update(lists)
# pic为背景形状
Pic = imageio.imread('chinamap.png')
# 实例化词云
w = WordCloud(width=1000, height=700, font_path='simhei.ttf', background_color='white', mask=Pic, scale=15)
# 将爬取的数据给词云
w.fit_words(result)
# 将结果根据时间写到图片
now = time.strftime('%Y-%m-%d', time.localtime())
w.to_file(f'{now}resou.png')


本文地址: https://www.lanol.cn/post/141.html
版权声明:本文为原创文章,版权归  Lan 所有,欢迎分享本文,转载请保留出处!
点赞
赞赏 打赏二维码
PREVIOUS:4月最新稳定蓝光直播源
NEXT:提问的艺术:如何让别人喜欢回答你的提问

文章导航

Vastsa
关注 关注
  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
python网络爬虫:用selenium+BeautifulSoup库实现百度搜榜数据的爬取
weixin_38262238的博客
06-24 4983
上图就是百度实时点的界面,本次的任务就是爬取到排行榜上的前50排名的关键词以及它的搜索指数。用到的库:1、selenium              2、BeautifulSoup              3、xlwt(一):分析:爬取一个网页的首要工作是分析网页的源代码:可以看到tr标签里面就有我们想要的东西,排名,关键词,搜索指数tr标签里面的三个class属性为:first,keywor...
搜集百度关键词的相关网站、生成词云
技术菜鸟博客
10-31 4103
百度“AI”这个关键词为例子,搜集搜索结果相关网站中的网页内容,用Python+matplotlib+wordcloud生成词云图
词云(附带操作实例)
xixixi7777的博客
12-20 1292
学会词云图的制作方法,要求熟悉jieba分词库的使用,会使用word cloud绘图,以及了解.generate()和.fit_words()方法的区别。
词云图的几种制作方法评测,你pick哪款
早起Python
04-11 2832
更多Python数据可视化案例请关注我的公众号:早起Python ======== 前言 大家好,不知道大家会在什么场合使用词云图,对我来说词云图的优点除了它可以展示大量文本数据。从而让读者快速抓住重点,更重要的是词云图好看啊,所以今天给大家分享几种词云图的制作方法。首先我们来思考一下词云图是怎样生成的,简单来说不就是读取文本—>分词—>计算词频—>词云,下面将以我们制作词...
爬虫 | 【实践】百度搜索链接爬取,生成标题词云 | 以“AI换脸”为例
因为健忘,所以记点有的没的〒▽〒
11-01 1193
“AI换脸 法律 案件”的百度搜索链接爬取及标题词云生成
用js实现百度搜榜的动态的效果
h_el_lo的博客
12-09 1702
实现效果 html代码如下 <div class="box"> <ul> <li> <div class="imgbox"> <img src="https://fyb-1.cdn.bcebos.com/hotboard_img/704d02b8f97781861dce050a22f8f970?x-bce-process=i..
Python 可视化近 90 天的百度搜索指数 + 词云图
AI科技大本营
02-10 2802
作者 | 叶庭云来源 |AI庭云君一、简介 在实际业务中我们可能会使用爬虫根据关键词获取百度搜索指数历史数据,然后进行对应的数据分析。百度指数,体验大数据之美。但要获取百度指数相关的数据...
基于百度LAC2.0的词云图生成——各大分词工具实战比较
RadiumTang的博客
06-27 2017
1.前言 2.百度LAC2.0介绍 根据百度官方消息,LAC全称Lexical Analysis of Chinese,是百度NLP(自然语言处理部)研发的一款词法分析工具,可实现中文分词、词性标注、专名识别等功能。 百度方面宣称,LAC在分词、词性、专名识别的整体准确率超过90%,以专名识别为例,其效果要比同类词法分析工具提升10%以上。 目前,百度已经发布了LAC2.0版本,之前的1.0版本我也写过一篇博文加以探讨,彼时的1.0版本还是融合在paddlehub中的一个模型,详见利用百度超大规模预训练模型
数据分析和图标-Python制作酷炫词云图-Python源码示例.zip
12-13
数据分析和图标-Python制作酷炫词云图-Python源码示例.zip
数据分析和图标-按图片轮廓绘制词云图-Python源码示例.zip
12-13
数据分析和图标-按图片轮廓绘制词云图-Python源码示例.zip
数据图标分析-电商关键词分析并生成词云图-Python实例源码.zip
12-13
数据图标分析-电商关键词分析并生成词云图-Python实例源码.zip
豆瓣映影评分析词云图生成 python代码
06-08
系统环境:python...词云图 暗恋·橘生淮南 (2022) https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/luJwZo.png 豆瓣映 https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/SBRvJn.png
Python 实例 - 生成词云图 Python源码
10-20
Python 实例 - 生成词云图 Python源码Python 实例 - 生成词云图 Python源码Python 实例 - 生成词云图 Python源码Python 实例 - 生成词云图 Python源码Python 实例 - 生成词云图 Python源码Python 实例 - 生成词云图 ...
node-v10.22.0-darwin-x64.tar.xz
最新发布
05-03
Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。
基于JAVA的物流管理系统的源码设计与实现.zip
05-03
毕业设计-->物流管理系统的设计与实现(Java版本) 采用Struts2+hibernate+Oracle10g+Tomcat 涉及车辆管理,配送点管理,运输方式管理,订单管理,员工管理,用户管理,部门管理,权限管理,角色管理等基础管理功能。
基于VB+access实现的成绩分析统计系统(论文+源代码).zip
05-03
基于VB+access实现的成绩分析统计系统(论文+源代码) 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。
node-v10.14.2-linux-x64.tar.xz
05-03
Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。
ASP+ACCESS网上购物系统设计(源代码+设计说明书+调研报告).zip
05-03
ASP+ACCESS网上购物系统设计(源代码+设计说明书+调研报告).zip
AO工艺设计计算(全).xls
05-03
污水处理计算书
爬取百度搜制作词云图
06-09
好的,下面是具体步骤: 首先,我们需要导入所需的库,包括 requests、BeautifulSoup、jieba 和 wordcloud。 ```python import requests from bs4 import BeautifulSoup import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt ``` 接下来,我们需要爬取百度搜的页面内容,并使用 BeautifulSoup 进行解析,提取出搜的关键词列表。 ```python url = 'http://top.baidu.com/buzz?b=1&fr=topindex' html = requests.get(url).text soup = BeautifulSoup(html, 'html.parser') hot_list = [] for item in soup.select('.list-table tr'): try: hot_list.append(item.select('.keyword a')[0].text) except: pass ``` 接下来,我们需要将关键词列表进行分词,并使用 jieba 库来进行分词操作。 ```python text = ' '.join(jieba.cut(''.join(hot_list))) ``` 接下来,我们就可以利用 WordCloud 库生成词云图了。首先,我们需要先设置一下词云图的参数,包括背景颜色、字体、图片尺寸等。然后,我们可以使用 `generate()` 函数来生成词云图。 ```python wordcloud = WordCloud(background_color='white', font_path='msyh.ttc', width=800, height=600).generate(text) ``` 最后,我们可以使用 matplotlib.pyplot 库中的 `imshow()` 函数来显示词云图。 ```python plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() ``` 完整代码如下: ```python import requests from bs4 import BeautifulSoup import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt url = 'http://top.baidu.com/buzz?b=1&fr=topindex' html = requests.get(url).text soup = BeautifulSoup(html, 'html.parser') hot_list = [] for item in soup.select('.list-table tr'): try: hot_list.append(item.select('.keyword a')[0].text) except: pass text = ' '.join(jieba.cut(''.join(hot_list))) wordcloud = WordCloud(background_color='white', font_path='msyh.ttc', width=800, height=600).generate(text) plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() ``` 执行完上述代码后,就可以得到一张基于百度搜关键词的词云图了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • QQ提示当前网页非官方页面,请勿输入QQ账号和密码,如需访问,请复制后使用浏览器访问... 17706
  • MSDN I TELL YOU 新站点NEXT I TELL YOU 开放邀请码注册!今日限额5000个! 11965
  • 如果使用ssms连接SQLserver的时候出现无法连接到服务器。 10870
  • 自动更新QQ昵称为当前时间 8791
  • Burp抓取安卓模拟器包教程 5853

分类专栏

  • JS逆向 1篇
  • 日常博文 3篇

最新评论

  • Burp抓取安卓模拟器包教程

    Shaddock_peel: 亲测有用,谢谢佬

  • JS解密之有道词典

    CSDN-Ada助手: 能否谈谈前端项目的静态资源CDN化呢?

  • 渣男手册,安卓恋爱话术库API

    Vastsa: 时隔太久,估计变了

  • 渣男手册,安卓恋爱话术库API

    优雅的马: 接口返回空 {"count":0,"pageNumber":1,"list":[],"totalPage":0}

  • 获取Github Copilot的Token

    CSDN-Ada助手: 恭喜你写了第9篇博客!获取Github Copilot的Token这个话题很有深度,希望你可以继续分享关于Github Copilot更多的实用技巧和经验,也可以尝试探讨一些与之相关的编程工具或者技术趋势。期待你的下一篇作品!

最新文章

  • 推荐一个开源的监控程序-Uptime
  • 获取Github Copilot的Token
  • 绕过某博客查看文章验证码,关注公众号得验证码
2023年3篇
2022年1篇
2020年180篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

聚圣源昆虫记思维导图凌 女孩名起名周易免费起姓名在远方电视剧农副产品公司起名称猪宝宝起名忌用农历十月鼠宝宝起名传奇加速器免费版个性空间说明魔兽澄海3c下载付姓起名霸气移动积分年底清零吗秋景作文邓姓男孩宝宝起名用中草药起名字南方专业起名程序杜姓男宝宝起名大全商贸起名米哈云游起名为什么不能带一校园奴隶契约拘束的意思网上免费给宝宝起名大全登月探险家黄姓男孩起个名字大全霸气一点的analacrobats佛山起名赵姓宝宝起名大全顾育起名馆纸品公司起名淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化