在之前的一篇文章中,我讲到如何爬取必胜客官网中全国各大城市餐厅的信息。虽然餐厅数据信息被抓取下来,但是数据一直在硬盘中“躺尸”。不曾记得,自己已经第 n 次这么做了。说到这里,要追溯到自己的大学时光。
自己从大学开始就接触 Python,当时是自己的好奇心很强烈。好奇为什么 Python 不需要浏览器就能抓取网站数据。内心感叹到,这简直是太妙了。自己为了体验……继续阅读 »
猴哥
4年前 (2018-11-27) 361浏览 0评论
1个赞
在《论语》中,孔子提倡“学而不思则罔,思而不学则殆”的学习方法。我们再往深层面挖掘,“思”究竟是在思考什么?个人理解是思考并总结出一些共性的东西,即“套路”。有套路了,我们学习或工作会更加有效率。
当我们爬取不同的网站是,每个网站页面的实现方式各不相同,我们需要对每个网站都进行分析。那是否有一些通用的分析方法?我分享下自己爬取分析的“套路”。在某个网站上,分……继续阅读 »
猴哥
4年前 (2018-11-25) 389浏览 0评论
1个赞
说到数据分析,我们会很容易联想到 Python。因为我们可以拿 Python 对已有的数据做数据分析。那什么是数据分析?数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有价值的信息。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
“啤酒与尿布”的故事就是最典型的数据分析案例。“啤酒”和“尿布”这两个商品看上去没有关联性。而沃尔玛将其摆……继续阅读 »
猴哥
4年前 (2018-11-20) 266浏览 0评论
0个赞
当我刚接触 Python 时,我已经被 Python 深深所吸引。Python 吸引我的地方不仅仅能用其编写网络爬虫,而且能用于数据分析。我能将大量的数据中以图形化方式呈现出来,更加直观的解读数据。
数据分析的前提是有数据可分析。如果没有数据怎么办?一是可以去一些数据网站下载相关的数据,不过数据内容可能不是自己想要的。二是自己爬取一些网站数据。
今天,我就爬……继续阅读 »
猴哥
4年前 (2018-11-13) 336浏览 0评论
1个赞
无论在 Windows 系统中还是 Linux 系统中,都存在着隐藏文件以及隐藏文件夹。隐藏文件夹一般是系统关键性目录,例如 Windows 系统中的 C 盘中的 Boot 文件夹、Windows 文件夹等。在 Linux 系统中,一些系统配置文件或软件配置文件会被隐藏起来,如:系统环境变量配置文件 .profile。有些时候,我们必须通过文件路径来遍历整个……继续阅读 »
猴哥
4年前 (2018-11-05) 354浏览 0评论
0个赞
对于英雄联盟(俗称 LOL 或撸阿撸)游戏玩家来说,今天无疑是值得庆祝的一天。IG (全称是 Invictus Gaming)零封对手 FNC,豪取我们盼望了 8 年的世界冠军。
看完比赛,我内心一直激动不已,只想说一句。
这只队伍确确实实是牛逼! 因为一开始它不被看好,队员都是东拼西凑的。上单是一个没人要的上单,打野是借过来的打野,中单是付赠品,直播出道……继续阅读 »
猴哥
4年前 (2018-11-03) 256浏览 0评论
0个赞