Python爬虫爬取Tiobe编程语言top20写入excel

excel表格的应用频率在工作生活中都很高,碰到大量手工录入的情景就会让人非常厌烦,这时就可以通过一些脚本来自动化这些过程。我这里爬取Tiobe上的top20做一个小demo,熟悉一下库的基本用法

背景

excel表格的应用频率在工作生活中都很高,碰到大量手工录入的情景就会让人非常厌烦,这时就可以通过一些脚本来自动化这些过程。我这里爬取Tiobe上的top20做一个小demo,熟悉一下库的基本用法。

第三方库

python爬虫的部分是很简单的,不涉及抓包也不需要正则,就利用requests和beautifulsoup就可以轻松解析出信息。 重点在于操作excel,python有xlrd和xlwt,看名字就知道xlrd是读取表格,xlwt是写入表格。

实现思路

爬取网页中表格,用dict存每种编程语言的信息(感觉自己深受js对象的影响),然后list存20个dict。

具体实现

首先是爬虫部分,比较简单就不解释了

写入excel部分用的是xlwt库,介绍几个基本方法:

完整代码

写入前后


发表评论

电子邮件地址不会被公开。 必填项已用*标注