打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
亚马逊发布Redshift
  【天极网消息】据了解,近日AWS(亚马逊网络服务)发布了一项云端的数据仓库服务——Redshift,并宣称此服务将会带来比传统本地数据存储更好的性能和扩展性,价格却比后者低很多。
  “根据市价计算后我们发现,如果想要自己组建一个大型数据仓库,每TB的存储空间通常每年会让你花掉19000到25000美元,”AWS的战略师Jeff Barr在博客中表示,“亚马逊的Redshift包括一切你所需要的功能,价格却低于每TB每年1000美元。”
  除了成本优势,亚马逊还宣称该业务的管理服务功能还会让数据仓库管理员免受监控、调试、备份、升级软件及错误恢复的困扰。用户只需登录和管理AWS管理控制台(Management Console)的Redshift节点和集群,即可轻松处理海量数据。该业务的存储空间小至几百GB,大至超过1PB,完全覆盖各类企业的需求。
  Redshift采用关系数据库技术,使用SQL作为其查询语言,并与现存的BI工具相兼容。毫无疑问上述数据库就是ParAccel,因为亚马逊是该公司的一个投资方,且关于Redshift的声明中承认其关键技术来自于ParAccel。
  ParAccel的数据库有许多先进的特性,比如柱状数据存储及先进的压缩技术。但这些技术同时也提供给像EMC Greenplum, HP Vertica和Teradata这样的竞争者,甚至会在下一版本的Oracle数据库中出现。尽管亚马逊声称“比传统快十倍”,但存储性能最终还是取决于负载的大小及“传统数据库”间的比较。
  Redshift与先前的RDS(Amazon Relational Database Service,亚马逊关系数据库服务)的区别在于,前者专门用于仓库存储及分析(与事务型数据库相对)且能够适应大数据的规模。“RDS采用的是微软的SQL Server、Oracle或是MySQL数据库,但这些数据库并不能胜任PB级别的数据仓库处理,”Jaspersoft的产品及联盟副总裁Karl Van den Bergh说。Jaspersoft同MicroStrategy公司是Redshift在智能商务方面的合作伙伴,但亚马逊表示其他BI合作伙伴将会接踵而至。
  尽管大数据分析是一个非常有潜力的方向,但亚马逊似乎更想向中小型公司强调其数据仓库业务的廉价性。客户能够同时运行2个节点类型,其中每个节点能够容纳2TB或16TB(两节点无需相同)的压缩数据。据亚马逊官方公布,一个2TB的数据仓库每小时仅花费0.85美元,预留实例(Reserved-instance)更是低至每小时0.228美元,或每TB每年1000美元。
  “亚马逊的行事方式就是打乱市场原有格局,并提供史无前例的高性价比服务,”Van den Bergh说,“数据仓库有很大的市场,就看能将它开拓多少了。”
  亚马逊并没有在Redshift网站上详细说明各大小公司上传及同步其在Redshift中数据的方式。从单一数据源上传数据不复杂,但随着数据源的增加,数据传输的延迟和复杂度将会成倍增长。也许BI系统也须运行在云端以避免企业在本地和云端间来回转移数据而浪费大量时间。


亚马逊推出云数据仓库新产品Redshift2012年12月17日 09:18 来源:TechTarget中国 作者:茶一峰 译 编辑:王玉圆
        【IT168 资讯】亚马逊在早年突破了实体书店的传统营销模式,成为电子商务和云计算领域先驱;今天,它又把目光抛向了数据仓库的云部署。

  我们看到,在亚马逊过去的产品中,非常注重成本控制。然而,对于数据仓库部署来讲,巨大的成本投入是不可避免的。

  在上周举行的“亚马逊re:Invent 2012大会”上,该公司为观众简短展示了新的AWS产品Redshift,并谈到了新的数据仓库服务技术。Amazon Redshift作为一个大规模并行数据仓库,包含一个或多个Redshift集群节点,可通过AWS应用程序界面(API)和其他的标准数据界面进行获取。


▲图片来源(GigaOM)

  亚马逊高级副总裁Andy Jassy称:“Redshift能够让你简单快捷地分析上PB的数据,成本只要传统数据仓库解决方案的十分之一。”事实上,亚马逊每年在每TB数据的分析上大概花费不到1000美元,1.6 PB的配置就封顶了。对于数据仓库来讲,这确实很便宜。

  亚马逊近年来开发了不少云数据服务,Redshift与早期的弹性缓存服务相比,添加了关系型数据库、NoSQL数据库、内容发布和数据分析;这些服务都以现收现付制(pay-as-you-go)进行购买。

  目前,Redshift AWS数据仓库服务只推出了一个限制级的测试版,仅针对Flipboard和NASA/JPL Netflix等一小部分客户提供,预计2013年测试版会扩展为通用版。

  据称,Redshift其中包含来自分析设备制造商ParAccel的技术部件授权。众所周知,ParAccel的产品非常高端,这意味着相较于低成本,亚马逊开始追求高性能,并成立了基于云计算的数据仓库厂商。

  Redshift是否预示着更多的数据迁移?

  TechTarget BI领导力研究主管Wayne Eckerson说:“亚马逊的产品发布是BI和数据仓库大量迁移到公共云的开端。”

  数据的云迁移进程一直以来都比较缓慢,人们都在纠结于安全问题和数据传载的瓶颈,还有定制开发和可靠性的问题。“尽管如此,公共云的优势明显,人们不可能长期观望下去。”

  Jassy强调了潜在的成本节约,尤其是管理数据仓库的费用大大减少。他说:“任何使用过传统数据仓库的人都应该清楚,它真的很昂贵,管理起来也极为复杂。”

  Gartner的研究报告指出,企业必须针对每一个数据仓库雇佣三到四名数据管理员才够用。Jassy说:“管理工作让人想要发疯。”

  这一购置成本问题长期阻碍着数据仓库的发展。然而,云计算能够提供经济的可扩展性,尽管定制需求会有所影响。Eckerson认为,总有一天,云数据仓库一定会成为主流。

  “如果你能够优化DBA和数据中心的配置,还能以更低的成本获得更好的性能,那么BI走向云端只是时间的问题。不过也没那么快,毕竟云计算还需要取代嵌入式传统,扎根于企业计算环境。”

  数据仓库的定制难题

  CapTech Consulting是美国一家将数据仓库视为关键业务的公司,其CEO Sandy Williamson指出,依照企业规模、类型以及数据定制化特性的不同, 数据仓库迁移到云计算的步伐将因人而异。Williamson对于亚马逊Redshift在大型企业中的前景并不看好。

  他说:“大型企业一般都会建立自己的私有云,因此他们不会把公司的数据迁移到公共云上。他们对客户有着自己的理解。”

  说到自己的公司,Williamson说CapTech已经使用了一些云工具去构建数据库,但规模还不一定做的很大。他说:“我们正在使用一些亚马逊的云开发平台进行移动开发和原型设计。”Williamson和其他用户一样,认为新的应用应该会在亚马逊或其他云计算平台中的性能更好。

  Eckerson说:“构建云计算数据仓库和BI平台的真正问题在于定制,大多数SaaS云产品的功能都比较整合,便于采购和安装。”

  对于BI来讲,你需要基于企业独特的架构、需求和数据源创建一个定制数据模型,在所有架构元素当中数定制报告最为重要。云计算的敏捷和速度优势在BI领域会没那么凸显,数据传输又成为另一个问题。

  CapTech高管Ben Harden认为,Redshift的理念很好,亚马逊在以指数级提升CPUs处理数据集。一旦数据到位,你就可以随意进行交叉分析。如果你的数据已经在你想要的位置,那就容易多了。

  数据传输问题在云计算实施中仍然亟待解决,包括亚马逊在内。据几名与会者称,亚马逊的新品更多地倾向于它的自身用户,也就是那些数据已经在亚马逊云端的企业。

  Harden说:“你怎样才能将几PB的数据上传到云端?这可不是用FTP在一小时之内就能搞定的事。Redshift的市场定位显然是那些已经在亚马逊云端运营的公司或者电子商务网站。”

  虽然亚马逊主推的是管理效率和成本节约,但公司也对Redshift的速度加以宣传,评估主要基于自身体验。

  Jassy说到,Redshift的私有测试版中包含了内部亚马逊企业数据仓库——该数据仓库由亚马逊花费了数百万美元建成。

  公司数据经理人称,原本花费好几个小时的查询在一小时以内就完成了,部分查询在现有数据仓库中通常花费五到十分钟,但在Redshift中只需要几秒钟。这很有可能是高性能的ParAccel部件产生的效果;这一次,亚马逊很明显瞄准了更为广泛的用户群体。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
40 岁他们没被裁员,还做了一家 700 亿美元公司
应“云”而生,“智能湖仓”如何成为构建数据能力的最优解?
采访亚马逊云科技顾凡:我们的智能湖仓是架构,而非产品,更非湖仓一体
云计算领域将如何重新洗牌
生成式AI的价值与机遇,这家云服务商给出了详细解答
【小兵原创】云计算行业研究报告之企业篇:亚马逊
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服