和数据网格有什么区别? 特征 数据网格 数据湖 速度 由于访问分散,通常速度非常快 取决于具体的架构和系统配置 可扩展性 由于分布式特性,具有高度可扩展性 可以扩展,但取决于架构 交易由拥有自己域名的各个团队维护 集中式模型,数据完整性集中处理 内存使用情况 可以根据各个团队的需。
求进行优化 由于数据量大且种类繁多,可能需要大量内存 索引 新西兰电报放映索引取决于每个单独的微服务 集中索引;对于大型数据集来说可能很复杂 高可用性 分布式架构带来高可用性 高可用性是可能的,但取决于具体实施 查询语言 取决于网格内的单个数据源 通常使用类似 SQL 的查询语言,但取决于系统 持久存储 取决于每个域的要求 通常使用 HDFS、云存储或其他大数据存储解决方案 数据聚合 由于去中心化,可能会很复杂,但针对特定领域的用例进行了优化 由于集中存储,因此更简单,但对于大。
型数据集来说可能会很慢 成本 由于分散化和特定领域优化而具有成本效益 由于庞大数据集的存储和处理成本,成本可能很高 易于使用 由于分布式所有权和技术堆栈多样性,可能会很复杂 由于集中管理,通常更易于使用,但需要专家进行设置和管理 安全功能 分布式安全,取决于每个域的实现 集中式安全通常很强大,但存在单点漏洞 要理解两者的区别,我们必须首先定义数据湖,即以最原始形式存储数据的数据存储库,没有统一的架构。