Python网络数据采集
内容简介
本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。
作者简介
Ryan Mitchell
数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。
目录
文章试读
“美味的汤,绿色的浓汤, 在热气腾腾的盖碗里装! 谁不愿意尝一尝,这样的好汤? 晚餐用的汤,美味的汤!” BeautifulSoup 库的名字取自刘易斯 •卡罗尔在《爱丽丝梦游仙境》里的同名诗歌。在故事中,这首诗是素甲鱼1 唱的。 就像它在仙境中的说法一样,BeautifulSoup 尝试化平淡为神奇。它通过定位HTML 标签来格式化和组织复杂的网络信息,用简单易用的Python...
该书热门标签
- 最新
- 热门
-
0 Raynor 2016-05-10
挺不错的,市面上爬虫的书籍不多,这门当入门很合适。
-
0 Elliot 2016-05-28
bs介绍的很详细
-
0 马猴烧酒扎坦娜 2016-07-28
爬虫入门作,BeautifulSoup护佑着你,不包含进阶知识
-
1 大H 2016-08-15
编程还是很多年前的事了,嵌入式,汇编,C是当年我的长项,没有复杂晦涩的语法和长名词需要学习,之前从来没有学过Python,但这本书我看了两遍,一方面为Python的极简魅力所折服,另一方面为本书之内容深深地吸引了,他不但带领你从头到尾的学习了一遍如何使用Python访问网络,又如何使用Python和数据库、语义处理所连接,内容全面简单易懂,更重要的是他像其他工具书那样只讲一堆第三方库怎么用,而是把很多重要的功能点带你用极简的方式重新实现了一遍,哪怕你是从头开始研究如何实现中文分词,这样的领路人都是足够了呢。 强力推荐极客入门阅读。
-
0 NikoBelic 2016-10-10
很薄,入门中的入门,适合非计算机专业 的数据分析师 学习。
-
1 代蔚 2016-10-22
难得用python3讲解如何爬虫,对使用python3的人来说是一大福音。网上大部分的教程使用python2进行爬虫,和python3用的库有较大不同。 但是python就是这样,年轻又有活力,意味着不仅仅是python本身,包括第三方库更新的也特别快。尽管这是一本2016年出版的书,但是书中的代码并不能完全复用,因为有些用到的库已经更新了:或者是接口,或者是输出,和书中的不尽相同。
-
0 GodKiller 2016-10-24
非常好,适合初学者入门。
-
0 Beamouser 2017-05-10
这可能是最近看的几本书翻译得最好的了...强赞翻译 作者代码风格有些坑爹,包括变量名覆盖内置函数等等.... 但这本书居然带来了一些乐趣...并不枯燥,很值得新手学习
-
0 无聊人士 2016-09-20
很简单
-
0 等待上传 2017-04-17
很不错的爬虫入门书籍
-
3 sennhvi 2016-04-24
无力吐槽,错误太多了,虽然说优美的代码就跟散文似的,但是作者你写个代码能不能直接就上散文? 随便调用一个不存在的函数看起来很有道理诶? 参数不指定缺省值也不赋值是几个意思? 都说全书python3,这么新的版本,bs4不指定解析器是闹哪样? 译者该尊重原文的代码不要翻译成中文行不行?代码缩进错误,中文词组顺序错误。 全书这里推荐oreilly media,那里推荐sql cookbook,跪了 第一版就是来骗钱的,我是小白鼠,呵呵。
-
3 Elf 2016-11-08
终于有本针对3.X的爬虫书了~
-
2 freetstar 2016-07-05
入门 每个知识点点到为止 全面浅层了解python爬虫的一本书 翻译的还行 只是长句断句让人揪心啊
-
1 大H 2016-08-15
编程还是很多年前的事了,嵌入式,汇编,C是当年我的长项,没有复杂晦涩的语法和长名词需要学习,之前从来没有学过Python,但这本书我看了两遍,一方面为Python的极简魅力所折服,另一方面为本书之内容深深地吸引了,他不但带领你从头到尾的学习了一遍如何使用Python访问网络,又如何使用Python和数据库、语义处理所连接,内容全面简单易懂,更重要的是他像其他工具书那样只讲一堆第三方库怎么用,而是把很多重要的功能点带你用极简的方式重新实现了一遍,哪怕你是从头开始研究如何实现中文分词,这样的领路人都是足够了呢。 强力推荐极客入门阅读。
-
1 代蔚 2016-10-22
难得用python3讲解如何爬虫,对使用python3的人来说是一大福音。网上大部分的教程使用python2进行爬虫,和python3用的库有较大不同。 但是python就是这样,年轻又有活力,意味着不仅仅是python本身,包括第三方库更新的也特别快。尽管这是一本2016年出版的书,但是书中的代码并不能完全复用,因为有些用到的库已经更新了:或者是接口,或者是输出,和书中的不尽相同。
-
1 吴梦圆 2016-05-30
第一本爬虫书,扫清恐惧~
-
1 驢子 2016-11-15
基础入门
-
1 深呼吸 2017-03-10
自己抓数据有段时间了,这本书讲了爬虫的用途、思路和常用的工具(很多我都用过),如果我早一点发现这本书就好了(自己躺坑还是太累了
-
1 Joard Spike 2016-07-27
适合入门的书籍,如果你对HTTP,HTML,Python这些都不了解的话
-
1 遇上alison 2016-08-08
适合入门,感觉是各种爬虫库文档的精简版
- 最新
- 热门
-
真的很合适入门的同学
1有用 WP花园 2016-12-12
诚然,这本书里面提到的一些python库不一定是最好的,但是整个爬虫的思路,还是非常值得大家借鉴。其实python的语法,以及爬虫的代码段,都不难,就是写爬虫的过程中,需要注意的事项和有可能踩到的坑,... 查看全部>>
-
用python3讲一个完整的数据爬取和清洗的过程
2有用 说书人 2016-04-23
最近刚学了python3,看了一些讲语法的书籍和练手的题目,感觉这本书是一个比较好的系统的利用python完成从数据爬取到数据清洗整个流程的实践过程。觉得自己很有必要实践一下。刚刚看了下试读章节,15... 查看全部>>
-
很好的一本书
4有用 陌上嫣然 2016-04-25
作者显然是此行达人,踩坑踩多了都是直接上经验。书里的代码很优美、正规并且很简洁,运用了大量的递归算法和正则表达式。但是有些地方译者翻译的有误,比如第31页,倒数第六行冒号翻译成了分号,显然运行了源码并... 查看全部>>
-
似乎所有的“分号”都应该是“冒号”
5有用 Brucie 2016-06-05
第三章有好几个地方出现“分号”,但又实在不明白哪里有分号,只好查了原文。原文是colons,也就是冒号。写在这里,给其他同学提个醒。:这是冒号;这是分号公平地说,原书中也有一些低级错误,比如第七章开始... 查看全部>>
-
人生苦短,快用Python
16有用 水冰玲 2016-03-04
开学没到2周,这本书已经读完,写的非常细致,也很基础,只有英文版本的,但是写的很口语化,其中还有很多joke,如果你想入门爬虫,推荐这本书。略去安装的细节,此书使用的是Py3.第一,二章直接推荐大家使... 查看全部>>
-
人生苦短,快用Python
16有用 水冰玲 2016-03-04
开学没到2周,这本书已经读完,写的非常细致,也很基础,只有英文版本的,但是写的很口语化,其中还有很多joke,如果你想入门爬虫,推荐这本书。略去安装的细节,此书使用的是Py3.第一,二章直接推荐大家使... 查看全部>>
-
似乎所有的“分号”都应该是“冒号”
5有用 Brucie 2016-06-05
第三章有好几个地方出现“分号”,但又实在不明白哪里有分号,只好查了原文。原文是colons,也就是冒号。写在这里,给其他同学提个醒。:这是冒号;这是分号公平地说,原书中也有一些低级错误,比如第七章开始... 查看全部>>
-
很好的一本书
4有用 陌上嫣然 2016-04-25
作者显然是此行达人,踩坑踩多了都是直接上经验。书里的代码很优美、正规并且很简洁,运用了大量的递归算法和正则表达式。但是有些地方译者翻译的有误,比如第31页,倒数第六行冒号翻译成了分号,显然运行了源码并... 查看全部>>
-
用python3讲一个完整的数据爬取和清洗的过程
2有用 说书人 2016-04-23
最近刚学了python3,看了一些讲语法的书籍和练手的题目,感觉这本书是一个比较好的系统的利用python完成从数据爬取到数据清洗整个流程的实践过程。觉得自己很有必要实践一下。刚刚看了下试读章节,15... 查看全部>>
-
真的很合适入门的同学
1有用 WP花园 2016-12-12
诚然,这本书里面提到的一些python库不一定是最好的,但是整个爬虫的思路,还是非常值得大家借鉴。其实python的语法,以及爬虫的代码段,都不难,就是写爬虫的过程中,需要注意的事项和有可能踩到的坑,... 查看全部>>
评价“Python网络数据采集”