用Python写网络爬虫
【作 者】(澳)理查德劳森(RichardLawson)著
【形态项】 157
【出版项】 北京:人民邮电出版社 , 2016.08
【ISBN号】978-7-115-43179-0
【中图法分类号】TP311.56
【主题词】软件工程-程序设计
【参考文献格式】 (澳)理查德劳森(RichardLawson)著. 用Python写网络爬虫. 北京:人民邮电出版社, 2016.08.
内容提要:
《用Python写网络爬虫》讲解了如何使用Python来编写网络爬虫程序,内容包括网络爬虫简介,从页面中抓取数据的三种方法,提取缓存中的数据,使用多个线程和进程来进行并发抓取,如何抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia来进行数据抓取,使用本书介绍的数据抓取技术对几个真实的网站进行了抓取,旨在帮助读者活学活用书中介绍的技术。《用Python写网络爬虫》适合有一定Python编程经验,而且对爬虫技术感兴趣的读者阅读。
下载地址
用Python写网络爬虫.rar