- 再论Hadoop已凉凉
- 来源:高端存储知识
最近一段时间,关于Hadoop有很多坏消息。在2018年10月,最大的两个Hadoop发行版厂商Cloudera和Hortonworks宣布合并,抱团取暖,最近由于财报不太好,高层也离职了。还有第三大Hadoop发行版厂商MapR差点破产,幸亏最后被HPE收购。
因此,在自媒体上充满了各种说Hadoop凉凉的文章,铺天盖地。
其实,大家不要恐慌,这个只是Hadoop发展中的正常调整,主要是原来Hadoop太🔥了,跌落神坛而已。
其实,Hadoop的收入一直保持增长。Gartner说,领先的Hadoop供应商(亚马逊,Cloudera,Hortonworks和MapRTechnologies)的2017年收入增长了54%,达到12亿美元,占DBMS市场总量的3.2%。越来越多的客户每年在Hadoop软件上花费超过10万美元 - 甚至超过100万美元。这证实了Gartner的观察,即成功部署已经完成,并表明历史上低的整体增长率开始发生变化。
其实,从Gartner的统计数据看,Cloudera、Hortonworks和MapR去年的收入都在增长,只是增长不太高。大家可以看到,增长最高的基本都是公有云玩家,还有华为(也有公有云,但规模较小),MongoDB。
尽管如此,正如“2017年数据管理炒作周期”所述,竞争正在增加,就像Hadoop堆栈正在分解一样。客户正在挑选和选择他们想要的作品。事实上,ApacheSpark(在Databricks拥有自己的商业化版本)在不包含其他Hadoop元素的场景中表现出越来越多的采用,而Apache Kafka在涉及动态数据的情况下蓬勃发展(并且它在Confluent中也有自己的商业化版本)。其他Apache项目越来越多地被使用,有或没有通常不包含它们的商业发行版。
最大的变革载体仍然是向云平台迁移,以及来自云平台提供商的竞争。自2016年增加以来,对基于云的Hadoop部署在Gartner的调查里一直在稳步增长。在今年的市场指南中包含的供应商中,只有富士通仅在本地提供。降低成本和应对复杂性仍然是基于云的部署的主要推动因素。
Hadoop的存储正在转型:Amazon S3,Azure ADLS和其他产品越来越成为新数据湖的目标。亚马逊于2016年底宣布Athena进行本地S3查询,并且看到采用率迅速增长,突出了原生云平台软件为所有其他供应商所代表的竞争挑战的一个方面。这种对原生云对象存储的采用继续增加势头,取代了HDFS在许多云驻留部署中的使用。内部产品,EMC的ECS,Minio和Red Hat的Ceph存储,与S3兼容,并且引起了人们的兴趣。此外,Hortonworks已将其ApacheHadoop Ozone对象存储发布为alpha,这表明在公共对象存储上的混合部署可能是本地玩家用于竞争的未来战场。
专业供应商的地理扩张使他们遇到了一些令人惊讶的新进入者,特别是在中国,Transwarp Technology(上海),华为等公司已经在他们去年报告的数百名客户的基础上进行了建设。Gartner名单里面的中国公司还有东方金信。
尽管供应商和部署环境各种各样,以及地理扩展,但基于Hadoop的项目超出试验阶段仍然具有挑战性。虽然供应商数据显示六位数和七位数的交易增长,但如果Hadoop仍然是不愿意在设计,部署,产品成熟度和技能挑战上挣扎的组织的相关选择,那么还有很多工作要做。
其实,Hadoop狭义来说,是Apache的一个开源项目,包含大家熟知的HDFS、MapReduce和YARN等。
现在对象热起来,因此又多了一个Ozone的开源对象存储。以后Hadoop估计对对象存储支持得得越来越好。不过,现在这个Ozone还没有GA,不太成熟。用户最好还是选择成熟的对象存储产品。其实,开源的对象存储很多,Ceph和Minio等都是,不知道为啥Hadoop非要搞一套自己的。估计针对流式数据有优化,像HDFS一样,虽然都是分布式文件系统,但是还是针对分析流进行了优化的。
HDFS可以理解为一个分布式文件系统的简化版,它放宽了一些POSIX要求,也加了一些限制,如不能在任意点更新,以实现对文件的流式访问。
不过,由于HDFS采用集中式的元数据节点,因此其扩展性和可靠性一直被外界所诟病。再加上存储不能独立扩展(其实HDFS也可以独立部署data node,我们叫Remote HDFS,这样扩展性略好一些),不是数据湖的理想底座。
因此,出现很多代替HDFS的共享存储,主要是各种分布式文件和对象存储。
这样的存储解决了HDFS的扩展性和不能独立扩展的问题,但是性能一般来说比HDFS要差些。
由于Hadoop应用在公有云上很热,因此,越来越多的企业采用对象存储来作为Hadoop的后端存储。企业对象存储的事实标准是S3,因此基本都采用一种叫S3A的Connector来取代HDFS。但S3A的性能一般,而且不支持追加写。
也有一些公司推出专用的对象存储Hadoop HDFS客户端取代S3A,这样可以取得更高性能,并且支持追加写。
国外公司,以Dell EMC ECS的HDFS Client最为大家熟知。
国内的号称对象存储第一的XSKY,也推出了XSKY HDFS Client高性能客户端,杀入Hadoop后端存储市场。
还有其他IBM、NetApp、Pure Strong、MinIO、Redhat厂商,他们怎么做,性能如何,我将在闪存峰会上和大家一一分享。
既然是闪存峰会,我必然也会分享一下Intel最新的全闪存S3A的测试结果,看看作为Hadoop后端存储,全闪是否还有优势,大家不要错过哦。
总的来说,从目前来看,Hadoop还是数据湖的最佳选择。
而且,最近的Gartner研究数据表明,Hadoop的部署和需求仍然很大并且正在增长。在最近的一项调查中,有235名受访者表示,34%的受访者目前正在使用Hadoop进行数据和分析工作,另有55%的受访者计划在未来24个月内进行调查,总计达到89%。这是Gartner2016年研究以来的需求大幅增加。
还有,现在很多现代的大数据/AI应用,如TensorFlow,其实也保留了对HDFS的支持。
因此,如果对象存储对Hadoop的对接分析性能和本地HDFS相当的话,将为成为企业数据湖的理想底座。
要获得更多西瓜哥的独家解读,请来参加本周四22日在杭州举办的全球闪存峰会,我会在ABC分论坛最后一场压轴演讲等待大家。
而且,有些话不能公开讲,我将在演讲结束后移步杭州某茶馆搞一个小型聚会,都是存储圈里人士,现在已经有30多人报名参加。如果你也想过来切🍉砍(侃)存储,欢迎本公众号菜单找“高端存储知识”杭州微信群主Vivi或者西瓜哥本人微信号报名。
对了,现场我也希望大家来捧个场,毕竟我是最后一个演讲,别冷场了,体现你们热情的时候到了,^_^。怎么了,忘了注册了,抓紧了。
社会
-
-
- 原创丨特朗普想“硬抢”丹麦领土,意欲何为?
- 特朗普想“硬抢”丹麦领土! - 来自占豪 - / 09:19 特朗普说:我们要买格陵兰岛!丹麦急了。8月18日,丹麦首相弗雷泽里克森表示,格陵兰岛属于格陵兰岛人民,不会出售,把它卖给美国的想法更是荒谬
- 占豪
-
-
-
- 爷爷我,不是你想的那种太监!
- 拜影视化和刻板印象所赐,瓜众们心中的太监,大概要么是捏着兰花指的公鸭嗓娘娘腔,要么是阴狠毒辣,杀人不眨眼的死变态。 尤其是汉末唐末这种宦官专权集散地流出的事迹,让其他很多时候的宦官都一同被染上了不可
- 毒舌来啦
-
-
-
- 从烦恼到开心,我的心理建设
- Hubert Robert,The Grande Galerie 人的一大挑战是,必须由悲观主义者变成乐观主义者。我不例外,也有这个转变过程。 可以说,人天生是悲观主义者,人必然有死亡,我们的生
- 连岳
-
-
-
- 【量化历史研究】大英博物馆在倒塌?媒体传播与维多利亚时代的生育革命
- 本文为“量化历史研究”第 349篇推送 (图片来源网络) 现有的研究广泛地认为生育率的下降和家庭规模的减小是现代化的重要标志,并且主要将其归功于经济激励的作用。尽管不少学者提供了许多令人信服的证据(
- 量化历史研究
-
-
-
- 当代中年男人的隐私,都在车里
- 8月27日,《魔兽世界》语音包将随着《魔兽世界》怀旧服一同上线高德地图。 打开高德地图,搜索 魔兽世界 即可下载,还能参与“魔兽阵营战”获得限定版《魔兽世界》荣耀徽章。 一起提前试听下夏一可为你配的魔
- 文案摇滚帮
-
-
-
- 谁说运维不值得终身奋斗:一位30年运维老兵的自述
- 科技发展之迅速,一代又一代的年轻人站在浪潮之巅,求新求快求发展。 然而,仍然有这样的一群人,他们是最早一批投入运维工作的开路者,是一直坚守在这个行业的镇守者,是与世界接轨,发展中国科技的实践者,是这
- 高效运维
-
-
-
- 建立有效的人脉圈,你做到了吗?
- 我在23年前曾在大学进行了一项有关建立人脉的研究。我当时访问过的许多人对“建立人脉”这个名词并不熟悉。我就把建立人脉解释成“多人指导”。这样的形容让人想起“师徒”这个具有数千年历史的概念,也让大家非常
- 译言
-
-
-
- 他们是生活在河西走廊的游牧民族
- 黄金牧场,夏日塔拉。早在2015年的时候,因为《家在水草丰茂的地方》这部电影,我便对这片位于西北深处的草原充满了好奇和想象。这是影片中的裕固族两兄弟巴特尔和阿迪尔克,在照顾自己的爷爷去世后,寻父途中路
- 三联生活周刊
-
-
-
- 再论Hadoop已凉凉
- 最近一段时间,关于Hadoop有很多坏消息。在2018年10月,最大的两个Hadoop发行版厂商Cloudera和Hortonworks宣布合并,抱团取暖,最近由于财报不太好,高层也离职了。还有第三大
- 高端存储知识
-
-
-
- 周鸿祎:他不是一个人在战斗
- 撰稿 | 蓝河 编辑 | 图图 8月19日,第七届互联网安全大会(ISC2019)如约而至,宣扬着“应对网络战,共建大生态,同筑大安全”的主题和精神,我们早已知晓,周鸿祎要讲些什么。 比如什么
- 安在
-
-
-
- 70秒视频,10万人崩溃:“为什么连孩子都不爱你?”
- 你做我的朗读者 我做你的摆渡人 戳蓝字一键关注 摆渡人 ☾ 每晚21:39 无论你在哪里,请记得打开手机。 70秒视频,10万人崩溃 - 来自摆渡人 - / 12:24 ♪ 点上方绿标即可收听主播
- 摆渡人
-
-
-
- 广电总局副局长高建民:提高政治站位,将主题主线宣传作为首要任务来抓!
- 庆祝新中国成立70周年是贯穿全年工作的主线,做好新中国成立70周年宣传是我们当前的头等大事。 8月20日,国家广播电视总局在京举办“庆祝新中国成立70周年精品网络视听节目上线仪式”,同时启动“庆祝新
- 广电独家
-
-
-
- 一个生病的小孩,一个被渐渐拖垮的中国家庭|大家
- 第一次看见夏芬,她站在一家小工厂门外,身上散发出刺鼻的气味,胸前工装上有一大方黄亮亮的油漆,面容憔悴。季节是初夏,她的神情却带来骨子里的寒意,似乎每刻都在煎熬,没有明天。 老板不在,我们跟着她进入工
- 大家
-
-
-
- 十年时间,再造一个苏宁
- 十年前,2009年全国两会期间,身在北京参会的苏宁创始人兼董事长张近东,抽空跟集团高管开了一个视频会,从下午一直开到次日天亮。讨论的是苏宁继续走粗放式发展的道路,还是利用新技进行精细化运营和服务?是继
- 科技观察
-
朋友会在“发现-看一看”看到你“在看”的内容