一、书籍进度:已看完
二、书籍评价: 对淘宝的技术发展有一个粗略的了解,第一部分、第二部分以及第三部分值得推荐下,后面可以略看
三、随手记
(1)进入淘宝的流程以及相关技术概括
流程概括:
用户点击进入淘宝域名,域名需要转换成ip,通过负载均衡技术,可以根据入口速度进行入口ip的选择,这时候用户能获取比较快的服务器进行访问,访问的时候,通过将不同资源放置在不同域名来绕过浏览器的资源并发限制。
当用户进行搜索,此时淘宝的搜索服务器会对用户的搜索信息进行分词,并针对用户的购买意图进行分析,从而选取匹配的结果。
当用户完成操作,淘宝需要记录下用户的一些行为并针对用户行为进行分析,同时也需要对网站流量进行一个统计。网站流量比较重要的数据有PV、UV,用户行为信息采集主要通过日志的记录以及数据挖掘。这一份会涉及到日志的实时传输以及同步的技术。
卖家会不时地发布商店的信息以及图片,这时候由于淘宝是采用CDN,需要确保全国各地都能同步到这部分图片,此时会采用分布式文件系统。
分以下几个部分:
(i)用户请求资源部分
-----输入域名,域名DNS解析,并通过负载均衡,分配访问速度快的入口。
相关技术:负载均衡、LVS(负载均衡系统)
----- 请求资源,浏览器对资源有并发限制,通过将不同资源放置在不同的域名,绕过浏览器限制
相关技术: CDN(Content Delivery Network,内容分发网络)【注1】
(ii)淘宝搜索部分
-----搜索
相关技术:分词、购买意图分析(浏览型、查询型、对比型、确定型)
(iii)交叉业务:日志记录以及数据挖掘部分
-----用户请求资源过程中,记录PV(Page View,页面访问量)、UV(Unique Vistor,用户访问)
-----用户浏览行为记录
相关技术:TimeTunnel、云梯、ODPS数据挖掘
(iv)淘宝数据更新
-----卖家上传图片,数据分发以及存储。
相关技术:分布式文件系统TFS(TaoBao File System)
----快照保存
相关技术:Tair(分布式KV存储方案)
【摘抄】淘宝技术这十年
《淘宝技术这十年》热门书评
-
这是一本好玩的书
47有用 0无用 子排牛柳 2013-04-26
这是一本好玩的书,从前面两章看,主要是讲故事;从后面两章看,主要是讲人物;从中间几章看,主要是讲技术。我在写作的过程中,把部分章节贴到了博客上,有人看了说励志,有人看了说对技术有帮助,有人看了说对产品有帮助,有人看了说对创业有帮助,有人看了说里面的段子特别逗,现在我也不知道这是人文读物还是技术书了。...
-
一些有用的链接
44有用 0无用 xiaohanyu 2013-06-02
两天的时间读完此书,总体评价是“轻松幽默、通俗易懂”,特别适合像我这种刚刚走出校门的互联网从业者。技术上属于科普的写法,不过这已经足够,真要写技术细节,恐怕很多人读不到第三章就要睡着了,再说技术上的东西更多的是靠实践而非看书,对于一个初学者,此书可以看作是大型网站技术登堂入室的引言书,展现了大的场景...
-
看到那么多“呵呵”,我真想撕了这本书
15有用 3无用 rem1x 2013-06-22
看到标题别见怪,真心受不了后半部分出现的那一个个“呵呵”。很薄的一本书,却标价¥45,挺贵的。如果把这本书分成前中后三个部分,我最喜欢的是前,其次是后,中间部分就比较次了,不少内容与前部分是重叠的,看到的一刹那就对作者的评价低了一星。...
-
一口气看完了
4有用 0无用 LOONG 2013-05-22
第一时间拿到了这本书,一口气读完。想起了不久前马云在卸任演讲中说到的那句话:很多人讨厌变化,但是正因为我们把握住了所有的变化,我们才看到了未来。技术也如此,驱使我们从模仿,到改造再到创新的就是变化,把握住了变化就把握住了未来。人生何常不是如此呢。...
-
淘宝值得敬佩
3有用 0无用 billlangjun 2014-02-16
淘宝技术这十年,完整最终确认版2014年2月7日--2014年2月16日在Kindle上阅读此书读书笔记写于2014年2月16日晚于新加坡“所有的进步都是不稳定的,一个问题解决了,我们不得不面对又一个新问题。”——马丁·路德·金个人注释:全书各章都引用这个相同的名言,不断凸显了它的重要性。事实也确实...