2020 年的春节是不平凡的。

新型冠状病毒(2019-nCoV)突然降临武汉,随着春运大潮,逐渐扩散到全国各省份。

这让原本应该是热热闹闹的春节,一下子气氛冷到冰点,感觉空气中都带着恐怖的气息。我们国家在疫情面前表现出强大一面,采取封城措施,举国禁足,共同对抗疫情。经过一个月多的努力,目前疫情在国内算是得到控制。

但海外情况却不容乐观,欧洲发达国家,英国、瑞典宣布放弃抵抗新冠病毒。
容许我大声喊一句:中国牛逼!我为自己身为中国人而感到骄傲!

我自己是学技术出身,想利用优势来获取全球疫情的第一手数据。几经寻觅之后,我发现 GitHub 有个开源项目 COVID-19。这是美国约翰·霍普金斯大学系统科学与工程中心(JHU CSSE)收集各国卫生机构公开 2019 年新型冠状病毒的数据存储项目。项目是处于教育和学术研究目的而开源,还提供了可视仪表板 Web 界面。不得不说是一个很良心的项目。

阅读全文

3 月 8 号是国际劳动妇女节,漫威在这天“搞事”了。上映《惊奇队长》,这部是漫威电影宇宙的第一部女性超级英雄电影,也算是给妇女节献礼。身为漫威粉丝的我,当时不会错过这部电影,趁着周末去观影。

现如今,漫威电影成为一种潮流文化,各系列电影基本是很卖座,导演的作用是功不可没。本文主要通过数据来分析,哪位导演是漫威电影的票房收割机。

阅读全文

2019 年已悄然过去一个星期,不知你是否有新的收获?

而自己在新年的头一周,一方面忙于工作,试着挑战一些更高难度的工作;另一方面在积极“充电”。自然而然公众号就拖更了。不过值得庆幸的是,今天更新了。今天给大家分享的内容是如何准确选择图表类型。

虽然文字能很生动形象地描述出一件事或一个人,但是它在数据面前则显得有点吃力。因为文字描述一些数据时,需要人们去理解,在大脑中做对比。而图表具有集中、概括、便于分析和比较的特点,能给人一种直观、清晰的感觉;因此,在数据表示方面,
图表比文字更适合。

阅读全文

在之前的一篇文章中,我讲到如何爬取必胜客官网中全国各大城市餐厅的信息。虽然餐厅数据信息被抓取下来,但是数据一直在硬盘中“躺尸”。不曾记得,自己已经第 n 次这么做了。说到这里,要追溯到自己的大学时光。

自己从大学开始就接触 Python,当时是自己的好奇心很强烈。好奇为什么 Python 不需要浏览器就能抓取网站数据。内心感叹到,这简直是太妙了。自己为了体验这种抓取数据的乐趣,所以写了很多的爬虫程序。

阅读全文

说到数据分析,我们会很容易联想到 Python。因为我们可以拿 Python 对已有的数据做数据分析。那什么是数据分析?数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有价值的信息。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

“啤酒与尿布”的故事就是最典型的数据分析案例。

阅读全文

当我们的爬虫程序已经完成使命,帮我们抓取大量的数据。你内心也许会空落落的。或许你会疑惑,自己抓取这些数据有啥用?如果要拿去分析,那要怎么分析呢?

说到数据分析,Python 完全能够胜任这方面的工作。Python 究竟如何在数据分析领域做到游刃有余?因为它有“四板斧”,分别是Matplotlib、NumPy、SciPy/Pandas。Matplotlib 是画图工具,NumPy 是矩阵运算库,SciPy 是数学运算工具,Pandas 是数据处理的工具。

阅读全文