据估计,大约在2005年左右,Hadoop的诞生,标志着人类正式进入大数据时代。事实上,“大数据”这一概念最早出现于1998年,一位来自美国高性能计算公司的科学家,在一次国际会议的报告中使用了“大数据”来描述不断增长的数据量所带来的挑战。
到2013年,越来越多的企业开始看到大数据的价值,发现大数据可以赋予企业业务权力。透过对海量数据的有效储存、管理和分析,他们能够获得更多的实时市场信息。而且,我们也发现,大数据并非一项技术,而是一系列数据管理技术的集合,它给整个社会和人类带来的影响,将与以往任何技术上的变化不同。
那么,十几年过去了,今天的大数据发展到什么状态呢?为了使大数据应用更成熟,我们需要做些什么?
通过多种应用分析和调查,发现尽管企业的数据量呈爆炸式增长趋势,也更加注重信息的来源和使用价值,但对实际商业价值的推动力并未产生显著效果。尽管大数据概念风靡全球,但是它的应用仍然停留在如何把正确的信息在适当的时候发送给合适的人。
数据仓库vs数据湖vs数据管理架构
为了收集和获取大量的数据,各种数据存储和管理系统如雨后春笋般涌现,包括数据仓库、数据湖和数据管理架构,并开始加企业应用场景的发展。
然而,当企业的大数据解决方案和平台架构开始增加时,业务的复杂性也增加了。企业需要一个标准的数据管理架构来整合所有数据和各种应用工具,包括跨环境和混合应用管理。过去,集中架构已不能满足企业的业务需求。或者说,企业需要更强的数据分析能力来访问不同的数据源。这也是以DataFabric为核心的数据管理架构越来越受欢迎的最根本原因。
从理论上讲,企业需要一个能够保证所有数据都是最新、易于管理、且干净的;但是在以前的数据架构模式无法实现,DataFabric可以帮助企业管理不同的数据,同时,也可以将不同类型数据间的关系联系在一起,而不必将所有数据都倒进数据湖。
因此,所有相关应用程序都必须贯穿于数据的管理过程。例如:我们可以通过数据仓库实现高性能、可重复性分析;数据湖可以存储数据以供开发和测试使用;DataMesh这种基于领域驱动和自服务的数据架构设计模式,可以用于管理分布式数据,由于服务本身采用了微服务的概念,并采用ServiceMesh分布式架构。说到DataMesh,可能有人会问DataMesh和DataFabric有什么关系?实际上,DataMesh和DataFabric是一个新的数据管理架构,它们都致力于使数据相互连接。
一站式大数据平台构建
当企业业务上升到一定量,构建大数据平台成为必须品。问题是,大数据平台如何构建?不同企业有不同选择!
有专家建议,最好采用两种策略构建企业大数据平台,即一个用于生产,另一个用于分析。但笔者认为,基于一个标准的数据架构构建大数据平台,更有利于数据管理。如果每个业务部门都建自己的平台,需要支持多个数据库,还得需要一个ETL平台完成数据之间的转换。这时,数据的真实性、实时性都会出现挑战。构建大数据平台,最终的目标是为了整合数据,让所有的数据实现可视化管理,并且无论数据在企业内部还是云端,都能实现统一管理。多一个数据平台,就意味着企业在进行数据整合时,会增加额外的成本,并且容易出现数据安全隐患。
当然,构建一个能覆盖所有环境的大数据平台,也不是一件容易的事。大多数时候,一个供应商的解决方案也没那么全面,比如:有的提供了查询功能,但治理方面差了一些;有的虽然解决了大数据的规模化处理,但后期的数据迁移成为一大挑战。所以,企业拥有多个企业提供的数据管理解决方案,可能是一种常态。
如果企业选型选对,基于标准的数据架构来打造打造大数据平台,那意味企业拥有了先天的一站式大数据平台管理能力,后期可以通过各种工具和手段进行数据的标准化管理。
比如:基于DataFabric,企业从设计之初开始,就拥有了一个可灵活扩展、多次复用和持续优化的数据管道,技术开发人员可以根据服务和语义,支持复杂环境部署,通过资源的灵活调度,交付各种应用。
以上内容就是大数据未来发展前景,希望对大家有所帮助,如需了解更多网络工程方案的,可在线客服或者来电咨询,广州庄闲和游戏为您提供一站式弱电工程/安防监控/综合布线/网络工程解决方案,包括,计算机网络工程、弱电机房、无线网络、云平台工程方案、人工智能化方案等,期待与您的合作!