pandas爬虫心得 | 吴起的个人网站

新手使用爬虫最好从pandas表格爬虫开始，这个是最简单最易学的。

环境依赖

pip freeze > requirements.txt

这个命令不好，因为会把所有项目的依赖生成。如果只是单纯生成本地的依赖，应该使用pipreqs。

#通过以下命令安装：

pip install pipreqs
#运行：

pipreqs ./

1
2
3
4
5
6
7

pip install -r requirements.txt

import datetime
end_time = datetime.datetime.now()
x_time = end_time - start_time
print(f"全部爬取完毕，总耗时{x_time.seconds}秒")

1
2
3
4

参数secondes表示秒。还有其他用法