打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
贝索斯致股东信(2010)

随机树算法(Random forests)贝叶斯估计方法(naïve Bayesianestimators)RESTful servicesGossip协议(Gossip protocols)最终一致性(EventualConsistency)数据分片(Data Sharding)反熵(Anti-Entropy)拜占庭容错机制(Byzantine quorum)抹除码(Erasure coding)vector clock算法(vector clock)

ock)...走进亚马逊的某个会议室您可能一瞬间会以为闯进了一个计算机科学讲座

 

翻一翻目前有关软件架构的教科书您会发现几乎没有什么架构模式未被亚马逊所应用我们使用高性能交易系统复杂渲染与对象缓存工作流与队列系统商业智能与数据分析机器学习与模式识别神经网络和概率决策以及其他各种技术虽然我们的很多系统来自最新的计算机科学研究成果但这常常还不能满足需要我们的架构师和工程师不得不深入到学术研究尚未触及的领域展开研究我们面对的问题很多在教科书上无法找到现存的解决方法因而我们自己发明了新的解决办法

 

我们的技术几乎无一例外地都作为服务services来实现应用程序的几个不同的业务逻辑将其运行的数据封装起来向外提供硬件接口作为访问其功能的唯一方式这种方法降低了不良影响允许服务以自己的步伐进行演化而不会影响系统中的其他构件面向服务的架构service-oriented architectureSOA是Amazon技术的基本构造方法由于我们有一个深思熟虑和富有远见的工程师和架构师团队这种方法在SOA成为业界的一个热门词汇之前就已在亚马逊得到广泛应用我们的电子商务平台由数以百计的软件服务组成它们协同工作向外提供从商品推荐到订单配送到库存跟踪的各种功能例如为了展示给访问亚马逊的客户一个内容详细的产品页面我们的软件需要调用200-300个服务以实现现高度个性化的用户体验

 

对于任何一个需要增长至超大规模的系统来说状态管理State management是核心很多年前亚马逊对系统的要求就达到了一个很高的水平我们很多的系统问题已无法由现有的商业解决方案来解决我们的关键数据服务器存储了数个PB的数据每秒要处理数以百万个的请求为了满足这些苛刻的和不同寻常的请求我们开发了若干个可供选择专用的持久化解决方案包括我们自己的key-value存储系统和单表存储系统为了实现这一目标我们从分布式系统和数据库研究领域认真学习了很多核心原理并在此基础上有所创新我们所开发的这种存储系统显示了极高的可扩展性同时保持了很高的性能和可用性以及对成本等方面进行严格控制

 

为了实现超大规模的特性这些系统在数据更新管理方面采用了一种创新的方式数据的更新需要发送大量副本通过放宽对数据更新的同步要求这些系统能够满足最苛刻的性能和可用性要求这些系统都是建立在最终一致性eventual consistency概念的基础之上亚马逊工程师在数据管理方面所取得的进展成为Amazon Web Services(AWS)所提供的云存储与数据管理服务的架构的基础例如我们的简单存储服务S3弹性数据块存储(Elastic Block Store)和在线数据库服务SimpleDB 的基本架构都源自亚马逊独有技术

 

亚马逊其他业务领域同样面临着复杂的数据处理与决策方面的问题例如商品数据录入分类需求预测库存分配以及欺诈检测等根据规则建立的系统在应用上很方便但难以维护而且随着使用时间的增加会变得脆弱在很多情况下先进的机器学习技术提供了更准确的分类并且能够通过自我修复来适应环境的变化例如我们的搜索引擎采用了数据挖掘技术(Data Mining)和机器学习算法machine learningalgorithms这些算法在后台运行以建立主题模型然后我们应用信息提取算法从非结构化描述中识别属性提取目标物从而使客户缩小查询范围并快速找到所需的商品我们考虑了大量的搜索相关性方面的因素以预测客户可能的兴趣并优化搜索结果的排名

 

商品的多样性要求我们采用现代回归技术(modernregression techniques)技术例如决策树模型组合的随机森林算法(randomforests)以在排名时灵活合并数以千计的产品属性所有这些后台软件最终带来的是快速准确的搜索结果从而帮助客户找到所需的商品如果我们仅仅让技术停留在某些研发部门我们在技术上的所有投入都会变得毫无意义但我们不会这么做我们将技术应用到我们所有的团队流程决策以及每项业务创新它深深地渗透到我们所做的每件事中

 

Whispersync技术是一个很好的例子这款Kindle应用旨在确保不管用户身在何处使用什么设备都可以访问我们的网上图书馆还可以在多款设备之间同步书签笔记和标记这项技术面临的挑战是其分布在世界100多个国家的数百万Kindle用户数以亿万种图书数以百计种的设备而要使其成为现实并在任何时候都能实现这些技术要求Whispersync技术的核心是一个建立在最终一致性基础上的冗余数据库以及被定义为冲突消解conflict resolution的应用后者能应对长达数周或更长时间的设备分离

 

当然对于Kindle设备的用户这些技术都是隐藏在背后的所以当一个用户打开他的Kindle设备时它总是保持同步并正好呈现用户想要的页面这诠释了英国科幻作家阿瑟·克拉克(Arthur C. Clarke)的名言任何足够先进的科技都和魔法难辨差异

 

如果一些正在努力阅读这封信的股东读到此处时感到昏昏欲睡下面的事实可能使您的精神为之一振我认为我们并非无益地去追求这些技术相反它们将直接带来自由现金流

 

我们生活在一个可用带宽磁盘空间和处理器能力都获得非凡增长而成本持续快速下降的时代我们的团队拥有一些世界上经验最丰富的技术专家帮助解决可能是当今最前沿的技术挑战正如我之前多次提到的那样我们坚定不移地认为股东的长期利益与客户的利益是完全一致的我们喜欢这样的工作方式创新是我们的内在本质技术则是我们用于持续改进和提高用户体验的基本工具我们还有很多东西要学习我期待并希望我们将继续拥有这样的学习乐趣我为自己身为这个团队的一员而深感自豪

 

依照惯例随信附上亚马逊1997年致股东的信我们秉持同样的经营之道视每天为新的起点

 

杰夫. 贝索斯

亚马逊创始人首席执行官

========我是财富自由的分割线========

最后的话:

安利一下我的知识星球。

最大的优势是,帮你节省选择学习材料的时间,这里的有国外的交易员培训课程和大量精选的书籍文章(包括曾经发过的800篇文章合集),这里还有平时所见所思所想的记录,这一切定会让你有所收获。

在这个信息爆炸的年代帮你快速脱颖而出,省去上百小时甚至更多学习的时间,而这些,都是你应得的。方向比努力更重要。

如果你喜欢这些推送的文章,说明咱们品味相同,那就更不该错过这个机会,赶紧扫码加入吧!


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
亚马逊:被调控的创新节奏
亚马逊 CEO 杰夫·贝索斯的 21 个经营哲学
连载 | 技术是基础工具(2010年亚马逊致股东的信)
亚马逊人工智能的发展之路
论大数据、谷歌和自由意志的终结
人工智能、算法、大数据——人类技术的终点
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服