Cloudera,数据云时代的沧海明珠
2020-03-13
来源:与非网
在大数据时代,海量数据不断产生。企业数据量预计每 18 到 24 个月就会翻一番,且增速未见放缓。同时,企业数据的范围越来越广,从客户信息、财务交易、边缘计算到 IT 运营服务日志,各路数据汇聚成了“数据海洋”。
云计算架构的快速发展带来了更多数据处理方案。边缘、内部部署、公有云和私有云产品层出不穷,按需随选和一切即服务(as a service)解决方案也在迅速扩张。毋庸置疑,我们处在一个多云世界,数据几乎可以被存储在任何地方。从中挖掘数据价值对于企业至关重要,却也绝非易事。
在琳琅满目的云解决方案中,Cloudera 的与众不同之处就在于帮助企业有效处理和管理存储在任何地方的任何数据。Cloudera 所提出的企业数据云理念正是这个全面云化时代中的沧海明珠。
企业数据云 - 聚焦多云及混合云
在云计算发展早期,公有云似乎可以满足 IT 部门的所有需求。公有云所提供的简单模型,能够节省企业数据中心扩张带来的成本。然而其弊端也很快暴露出来,数据可能会被供应商锁定,导致企业无法随需应用,但转移出来成本又很高。面对这些问题,IT 部门从实际经验中总结了一条真理——更多选择,绝不设限。数据和工作负载应该被放在最便于应用且能够创造价值的地方。企业的多样化部署,造就了今天的混合和多云世界,也带来了管理多个环境中数据的诸多挑战。
Cloudera 的愿景是建立现代数据架构,帮助企业从数据中快速获得价值。数据管理应该从边缘处的数据创建开始,直至最终的数据处理,无论是在公有云、私有云,还是本地数据中心。这种贯穿数据整个生命周期的管理方式,支持 Cloudera 平台能够打通企业内部的数据孤岛,让相关业务部门能够获得其所需数据。毕竟,数据只有在对整个企业都实时可见、且被应用时,才真正能够释放价值。
业界普遍认为,非结构化数据是企业数据的主要组成部分。在下一个十年里,非结构化数据在所有数据中的占比预计将达到 80%。为了管理这些数据,首先需要了解它们。企业需要对元数据进行规范化和分类,并且从经济和运营角度考虑,将数据存放在最能产生价值的地方。任务虽然艰巨,但 Cloudera 在这一领域独具优势。Cloudera 的产品在全球范围内管理着超过 40 万台服务器,从 5EB 数据中为企业不断挖掘有价值的数据洞察。
企业数据云的落地 – Cloudera Data Platform (CDP)
Cloudera 在借助 AI 和机器学习管理数据领域已经深耕多年。Cloudera 认为,任何企业的数据战略都必须跨越边缘到云,数据管理必须自始至终。2019 年 1 月 Cloudera 宣布与 Hortonworks 合并。这两家企业的强强联手,使 Cloudera 一跃成为全球数据管理市场的佼佼者。Cloudera 的传统 AI 驱动数据管理与 Hortonworks 端到端数据管理方式相结合,创建了全球领先的下一代数据平台 Cloudera Data Platform。Cloudera 希望为企业提供一个本身即是多云且多功能的平台,用于管理企业数据云。通过统一的平台界面,对数据进行整个生命周期管理,并提供一致的安全和治理服务。
两家企业的合并十分顺利,短短 9 个月,Cloudera 就推出了公有云版本的 Cloudera Data Platform,其中包括 Cloudera Data Warehouse 和 Cloudera Machine Learning 服务,目前已在 AWS 和 Microsoft Azure 上商用。除了将边缘和云中数据管理整合在现有解决方案中,Cloudera 目前的重点在于为 CDP 提供私有云功能。上述功能的测试版将于今年夏天正式推出。
Cloudera 面对的是一个 260 亿美元的巨大市场。未来三年内,市场规模预计将会翻倍至 520 亿美元,这无疑是一个巨大的发展机遇。尽管市面上有很多企业数据管理产品,但是能够纵观全局、提供从边缘到云的一致性体验和全套功能的产品却很少。Cloudera 将借此机会定义未来 15 至 20 年后的数据管理方式,并对新一代 IT 技术产生深远影响。