大家好,我是爱分享的永恒君!
之前分享过如何来快速搜集百度搜索的结果,文章在这里:
不写代码玩转爬虫实例(8) – 快速抓取百度搜索结果
最近刚好也需要对百度知道进行数据搜集,今天的文章就来分享一下关于快速搜集百度知道的数据。
还是老规...
2年前 (2022-06-14) 825℃ 0评论
4喜欢
大家好,我是爱分享的永恒君!
最新因为数据分析的原因,需要采集一些关键词在百度的搜索结果。
如下图,比方说我要提取搜索结果的标题、URL地址、摘要等一系列的信息。
这个需求还是比较简单的,用web scraper就可以很快实现。
基本思路...
3年前 (2022-03-31) 979℃ 0评论
11喜欢
Web Scraper是一款快速获取大量网页数据的利器,让你轻松快捷获取想要的海量数据。
实例
实例(1) – 抓取猫眼电影信息
实例(2) – 抓取天眼查企业基本信息
实例(3) – 抓取携程酒店信息
实例(4) – 抓取东方财富股票信息...
3年前 (2021-10-13) 2547℃ 0评论
2喜欢
新浪微博评论的数据一直是不少做数据分析朋友感兴趣的内容之一,但是获取数据本身可能就难到了不少人。
其实这个用之前介绍的web scraper可以非常容易的实现一个简单、快速的抓取功能,今天永恒君就来分享一下这个过程。
这里抓取的是网页版的新...
3年前 (2021-10-10) 1374℃ 0评论
3喜欢
最近,Netflix的新剧《鱿鱼游戏》简直热爆了,该剧由《熔炉》导演黄东赫执导,由李政宰、朴海秀合作主演,目前已经达到了Netflix TV Show世界榜第2名,韩剧排行榜第1名。
该剧是讲述一群走投无路并急需金钱的人收到神秘邀请,邀请他...
3年前 (2021-10-07) 1026℃ 0评论
1喜欢
今天一位学校老师提了这么一个需求:想知道当前初中学生都喜欢什么样的老师,并可以用词云的方式直观展示出来。要制作词云呢,需要有一定数量的关键词,以及权重值(或者出现频率)。而要得到这些关键词、权重值,必须要有一定量的内容信息,总不能我们自己瞎...
3年前 (2021-07-08) 1269℃ 0评论
6喜欢
不知道大家平时是否会使用知乎?永恒君经常会在知乎上查看别人分享的知识内容,也会根据自身的情况回答网友的一些问题。有时候针对一个知识点,希望能很快的搜索到最近的一些高质量文章,或者是一些回答数相对少的问答,这个时候有一个类似目录的列表会非常方...
4年前 (2021-04-13) 1271℃ 0评论
4喜欢
今天是元宵节,先祝各位元宵快乐!!微博一直是社会热门事件的传播渠道之一,对微博热门事件的数据进行分析能获得很多内在的一些价值,比如爬取正文是可以做情感分析或者切词做词频分析(云图),用户名可以用来统计什么官方报社或者官网对这个关注最高,可以...
4年前 (2021-02-26) 1647℃ 0评论
4喜欢
背景需求
永恒君经常会在东方财富网站上面搜集查询一些行业股票信息,如下图:
这些就是网站给我们分类好的证券行业的信息。假如需要跟踪这些行业的公司的话,势必需要搜集这些公司的基本信息(牛市里跟踪券商谁都知道吧~~)
今天这篇文章来分享一下...
4年前 (2021-01-11) 1575℃ 0评论
7喜欢
背景需求
有不少朋友问永恒君携程网站的酒店信息怎么抓取,今天这篇文章来分享一下使用web scraper来快速实现抓取携程酒店信息。
例如,在携程官网搜索北京 密云水库的酒店信息,
可以搜索到非常多的酒店信息。需要注意的是,搜索出来显示...
4年前 (2020-12-29) 1738℃ 0评论
4喜欢