微信公众号:yhjbox(永恒君的百宝箱),获取最新文章、资源。

 分类:webscraper

百度知道问题搜集,简单快捷,一个也跑不了!

百度知道问题搜集,简单快捷,一个也跑不了!
大家好,我是爱分享的永恒君! 之前分享过如何来快速搜集百度搜索的结果,文章在这里: 不写代码玩转爬虫实例(8) – 快速抓取百度搜索结果 最近刚好也需要对百度知道进行数据搜集,今天的文章就来分享一下关于快速搜集百度知道的数据。 还是老规...

4个月前 (06-14) 170℃ 0评论 4喜欢

不写代码玩转爬虫实例(8) – 快速抓取百度搜索结果

不写代码玩转爬虫实例(8) – 快速抓取百度搜索结果
大家好,我是爱分享的永恒君! 最新因为数据分析的原因,需要采集一些关键词在百度的搜索结果。 如下图,比方说我要提取搜索结果的标题、URL地址、摘要等一系列的信息。 这个需求还是比较简单的,用web scraper就可以很快实现。 基本思路...

6个月前 (03-31) 423℃ 0评论 11喜欢

爬虫利器Web Scraper系列教程及7个实例

爬虫利器Web Scraper系列教程及7个实例
Web Scraper是一款快速获取大量网页数据的利器,让你轻松快捷获取想要的海量数据。 实例 实例(1) – 抓取猫眼电影信息 实例(2) – 抓取天眼查企业基本信息 实例(3) – 抓取携程酒店信息 实例(4) – 抓取东方财富股票信息...

12个月前 (10-13) 1087℃ 0评论 2喜欢

爬取《鱿鱼游戏》豆瓣热门评论后,我发现了这些…

爬取《鱿鱼游戏》豆瓣热门评论后,我发现了这些…
最近,Netflix的新剧《鱿鱼游戏》简直热爆了,该剧由《熔炉》导演黄东赫执导,由李政宰、朴海秀合作主演,目前已经达到了Netflix TV Show世界榜第2名,韩剧排行榜第1名。 该剧是讲述一群走投无路并急需金钱的人收到神秘邀请,邀请他...

1年前 (2021-10-07) 544℃ 0评论 1喜欢

中学生都喜欢什么样的老师?抓取知乎高赞回答告诉你

中学生都喜欢什么样的老师?抓取知乎高赞回答告诉你
今天一位学校老师提了这么一个需求:想知道当前初中学生都喜欢什么样的老师,并可以用词云的方式直观展示出来。要制作词云呢,需要有一定数量的关键词,以及权重值(或者出现频率)。而要得到这些关键词、权重值,必须要有一定量的内容信息,总不能我们自己瞎...

1年前 (2021-07-08) 791℃ 0评论 6喜欢

不写代码玩转爬虫实例(6) – 抓取知乎搜索的数据

不写代码玩转爬虫实例(6) – 抓取知乎搜索的数据
不知道大家平时是否会使用知乎?永恒君经常会在知乎上查看别人分享的知识内容,也会根据自身的情况回答网友的一些问题。有时候针对一个知识点,希望能很快的搜索到最近的一些高质量文章,或者是一些回答数相对少的问答,这个时候有一个类似目录的列表会非常方...

1年前 (2021-04-13) 788℃ 0评论 4喜欢

不写代码玩转爬虫实例(5) – 抓取热门微博的数据(附视频)

不写代码玩转爬虫实例(5) – 抓取热门微博的数据(附视频)
今天是元宵节,先祝各位元宵快乐!!微博一直是社会热门事件的传播渠道之一,对微博热门事件的数据进行分析能获得很多内在的一些价值,比如爬取正文是可以做情感分析或者切词做词频分析(云图),用户名可以用来统计什么官方报社或者官网对这个关注最高,可以...

2年前 (2021-02-26) 1042℃ 0评论 4喜欢

不写代码玩转爬虫实例(4) – 抓取东方财富股票信息

不写代码玩转爬虫实例(4) – 抓取东方财富股票信息
背景需求 永恒君经常会在东方财富网站上面搜集查询一些行业股票信息,如下图: 这些就是网站给我们分类好的证券行业的信息。假如需要跟踪这些行业的公司的话,势必需要搜集这些公司的基本信息(牛市里跟踪券商谁都知道吧~~) 今天这篇文章来分享一下...

2年前 (2021-01-11) 1026℃ 0评论 7喜欢

不写代码玩转爬虫实例(3) – 抓取携程酒店信息

不写代码玩转爬虫实例(3) – 抓取携程酒店信息
背景需求 有不少朋友问永恒君携程网站的酒店信息怎么抓取,今天这篇文章来分享一下使用web scraper来快速实现抓取携程酒店信息。 例如,在携程官网搜索北京 密云水库的酒店信息, 可以搜索到非常多的酒店信息。需要注意的是,搜索出来显示...

2年前 (2020-12-29) 1110℃ 0评论 4喜欢