扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNet至顶网软件频道 初创公司Qubole由Facebook前工程师Ashish Thusoo和Joydeep Sen Sarma联合创立,他们俩在2007年同时进入Facebook,也是Facebook团队中开发Hadoop查询语言Hive的两位关键人物,期间Thusoo还是Apache软件基金会兼任Hive项目的主管。
Qubole的创业团队阵容豪华,他们都有很强的数据分析背景,除了两位创始人之外,Oracle Exalytics平台和并行数据库技术的架构师Shrikanth Shankar也是该团队的成员。近日,Qubole宣布获得了700万美元的A轮融资,该轮融资由Charles River Ventures和Lightspeed Ventures引导,不过该轮融资包含了2011年的种子投资。 众所周知,Hive是基于Hadoop的一个数据仓库工具,可以将SQL语句转换为MapReduce任务进行运行。而Qubole服务托管在亚马逊AWS云计算平台之上,用户可以在其上运行各种Hadoop Jobs,包括Hive、MapReduce以及Pig。
该公司在2012年6月份推出了Qubole服务,并在12月份面向大众开放。Thusoo告诉GigaOM的记者Derrick Harris,Qubole从开始就处理PB级的用户数据。到目前为止,该平台的大客户涉及了广告技术、电子商务和应用程序开发等领域。还有一些很常见用户案例就是创建新的数据管道(细节见博客),在非结构化的数据推送到关系型数据库像MySQL、Vertica或者Infobright之前,会先使用Hadoop来处理这些数据。
然而,Thusoo补充道,Qubole也能够连接若干种其他的数据库存储,比如MongoDB。与此同时,Qubole也可以连接其他服务的API来导入用户的数据,像Omniture,Google analytics等服务。 Qubole服务托管在AWS平台,这样用户在分析存储在亚马逊S3云中的数据集时,就无需了解Hadoop系统管理,Qubole提供的Hadoop服务能够根据用户的工作负载动态调整服务器资源配置,实现随需计算,对于用户来说,这大大简化了大数据应用的复杂性,而且成本更低。
Qubole目前面临的问题
Qubole目前面临最大的问题,就是市场上有太多的竞争产品,在《 在Hadoop上运行SQL:程序员需知晓的13种数据工具》一文,笔者就列举了13种基于Hadoop的SQL查询工具。虽然在过去几年里,Hive一直是Hadoop生态系统中的重要组成部分,但是基于MapReduce的查询速度一直让人“不敢恭维”,很多数据库初创公司在意识到这一点之后,纷纷推出了基于Hadoop的SQL分析工具。
虽然Thusoo也意识到该领域激烈的竞争,但是他依然认为Qubole处在一个有利的位置。Thusoo表示,目前公司正在寻找新的数据分析项目像Impala和Shark等,并把它们整合到Qubole平台,而同样是Hadoop的初创公司Hortonworks领导的Stinger项目,就大大提升了Hive自身的速度。(详见《 Stinger Initiative:让Hive提速100倍》一文的报道)
不过需要强调一点,Qubole虽然也已经优化了自家的平台,不过比单独运行在Amazon Elastic MapReduce的速度仅仅只快了5倍,未来还有很长的一段路要走。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者