优秀的云计算数据仓库体现了近年来云计算数据仓库市场发展的特点,因为许多企业采用云计算,减少了物理数据中心的足迹。
图片来源:千库网
云计算数据仓库是一种服务,用于收集、组织和存储组织用于各种活动的数据,包括数据分析和监视。
企业使用云计算数据仓库时,物理硬件方面全部由云计算提供商负责。 对于只看到能够等待和处理大量数据的大型仓库或数据仓库的最终用户来说,这很抽象。 近年来,随着越来越多的企业开始利用云计算的优势并减少物理数据中心,云计算数据仓库的市场不断扩大。
云计算数据仓库通常包含一个或多个指向收集生产数据的数据库集合的指针。 云计算数据仓库的第二个核心元素是集成查询引擎,它使用户能够搜索和分析数据。 这有助于数据挖掘。
如何选择云计算数据仓库服务
在选择云计算数据仓库服务时,企业必须考虑许多标准。
现有云部署。 每个主要的公共云提供商都有自己的数据仓库。 该数据仓库提供了与现有资源的集成,便于云计算数据仓库用户的部署和使用。
迁移数据的能力。 考虑到组织拥有的各种类型的数据及其存储位置,有效地将数据迁移到新数据仓库的能力至关重要。
存储选项。 数据仓库解决方案可用于存储数据,但如果能够访问商业化的云存储服务,则可以提供更低成本的选择。
行业媒体Datamation上的卓越企业名单重点介绍了能够提供卓越云计算数据仓库服务的供应商。
)1)亚马逊修改
潜在客户的价值主张。 随着亚马逊进入云计算数据仓库市场,Redshift将成为投资于AWS工具和部署的组织的理想解决方案。
重要价值/差异:
Redshift的主要区别在于,Spe ctrum的功能允许组织直接连接到AWS S3云数据存储服务器中的数据存储,从而减少了启动所需的时间和成本。
用户强调的一个优点是Redshift的性能,它受益于AWS基础架构和大规模并行数据仓库体系结构的分布式查询和数据分析。
对于S3或现有数据湖以外的数据,Redshift可以与AWS Glue集成,该工具是用于将数据导入数据仓库的提取、转换和加载( ETL )工具。
数据仓库的存储和操作受包括虚拟私有云( VPC )在内的AWS网络隔离策略和工具的保护。
)2)谷歌big query
潜在客户的价值主张。 对于希望使用标准SQL查询分析云中大型数据集的用户来说,BigQuery是一个合理的选择。
重要价值/差异:
作为完全托管的云计算服务,数据仓库设置和资源供应由谷歌公司使用无服务器技术处理。
BigQuery的重要价值在于可以方便地使用SQL或开放数据库连接( odbc )查询数据。 这样,用户就可以使用现有的工具和技能。
BigQuery的逻辑数据仓库功能允许用户连接到数据库和电子表格等其他数据源以分析数据。
与BigQuery ML的集成是一个重要的优势,它融合了数据仓库和机器学习( ML )的世界。 使用BigQuery ML,可以通过数据仓库中的数据来训练机器学习工作负载。
)3) IBM DB2仓库
潜在客户的价值主张。 对于处理分析工作负载的组织来说,IBM Db2 Warehouse是一个不错的选择,可以从平台的统一内存数据库引擎和Apache Spark分析引擎中获益。
重要价值/差异:
对于寻求包含高性能数据库的数据仓库的组织来说,集成Db2内存中基于列的数据库引擎可能会有很大的好处。
Apache Spark引擎也与Db2集成。 这意味着用户可以对数据仓库使用SQL和Spark查询获得知识。
Db2 Warehouse受益于IBM的Netezza技术和高级数据搜索功能。
您可以在IBM云平台或AWS云平台上完成云部署。 此外,还有Db2 Warehouse的本地版本。 这对有混合云部署需求的组织很有帮助。
)4) Microsoft azure SQL数据仓库
潜在客户的价值主张。 Microsoft Azure SQL数据仓库非常适合希望通过与Microsoft SQL Server的集成轻松部署基于云计算的数据仓库技术的任何规模的组织。
重要价值/差异:
微软于2019年7月发布了主要的Azure SQL数据仓库更新,包括Gen2更新,提供了更多的SQL Server功能和高级安全选项。
动态数据管理( DDM )提供了非常精细的安全控制级别,允许在查询过程中即时隐藏敏感数据。
现有的微软用户可能会从Azure SQL数据仓库中最大限度地受益,因为他们在Microsoft Azure公共云和更重要的是,在用于数据库的SQL Server上有多个集成。
与仅在本地运行SQL Server相比,微软构建在大型并行处理架构上,用户可以同时执行100多个并发查询。
)5) Oracle Autonomous Data Warehouse
潜在客户的价值主张。 对于Oracle数据库的现有用户来说,Oracle独特的数据仓库是最简单的选择,并提供了通向云的入口。
重要价值/差异:
Oracle的主要区别在于它在优化的云计算服务上运行自主数据仓库,该服务运行专门为Oracle数据库构建的Oracle exa data硬件系统。
该服务集成了基于Web的笔记本电脑和报告服务,共享数据分析,实现轻松协作。
它支持Oracle自己的同名数据库,但用户也可以从包括Amazon Redshift在内的其他数据库、云平台和本地对象数据库迁移数据。
Oracle的SQL Developer功能是将数据加载向导与数据库开发环境集成的另一个重要功能。
(6) sap数据仓库云
潜在客户的价值主张。 SAP Data Warehouse Cloud可能非常适合于希望使用预构建的模板提供更多传递密钥方法以充分利用数据仓库的组织。
重要价值/差异:
SAP Data Warehouse Cloud是该领域相对较新的参与者,首次在5月的2019 SAPPHIRE NOW会议上发布。
SAP的HANA云服务和数据库是数据仓库云的核心,通过良好的数据治理功能解决了特定行业和业务线的通用数据仓库和分析用例。
对现有的SAP用户来说,与其他sap APP应用程序的集成意味着更容易访问本地和云计算数据集。
(7) Snowflake
对潜在客户的价值主张。 对于需要为数据仓库功能选择不同的公共云提供商的任何行业组织来说,Snowflake都是一个不错的选择。
重要价值/差异:
重要的区别在于Snowflake的基于列的数据库引擎功能。 此功能处理结构化和半结构化数据,如JSON和XML。
解耦的Snowflake体系结构允许您单独扩展计算和存储,并为用户选择的云提供商提供数据存储。
系统创建Snowflake,即虚拟数据仓库,不同的工作负载共享相同的数据,但可以独立运行。
用标准SQL执行查询和分析,并与r和Python编程语言集成。
优秀云计算数据仓库七大对比图