Azure Data Lake Storage Gen2 简介,azurestorage系列-ESG跨境

Azure Data Lake Storage Gen2 简介,azurestorage系列

来源网络
来源网络
2022-07-05
点赞icon 0
查看icon 697

Azure Data Lake Storage Gen2 简介,azurestorage系列Azure数据湖存储第二代简介Azure Data Lake Storage Gen2是一组专用于大数据分析的功能,以Azure Blob storage as 基础构建。专为企业大数据分析而设计数据湖存储Gen2使Azure ......

Azure Data Lake Storage Gen2 简介,azurestorage系列





Azure数据湖存储第二代简介

Azure Data Lake Storage Gen2是一组专用于大数据分析的功能,以Azure Blob storage as 基础构建。

专为企业大数据分析而设计

数据湖存储Gen2使Azure storage成为在Azure上构建企业数据湖的基础。Data Lake Storage Gen2从一开始就被设计为存储数百亿字节的信息,同时保持数百亿字节的吞吐量,使您可以轻松管理大量数据。

Data Lake Storage Gen2的一个基本部分是向Blob存储添加一个分层的名称空间。分层命名空间将对象/文件组织到目录层次结构中,以实现有效的数据访问。常见的对象存储命名约定在名称中使用斜杠来模拟分层目录结构。这种结构是在数据湖存储Gen2中真正实现的。重命名或删除目录等操作将成为对目录的单个原子元数据操作。没有必要枚举和处理共享目录名前缀的所有对象。

Data Lake Storage Gen2构建于基础Blob存储之上,其性能、管理和安全性通过以下方式得到增强:

优化的性能,因为您不需要将复制或转换数据作为分析的先决条件。与Blob存储上的平面命名空间相比,分层命名空间大大提高了目录管理操作的性能,从而提高了整体作业性能。

管理更容易,因为您可以通过目录和子目录来组织和操作文件。

因为POSIX权限可以在目录或单个文件上定义,所以可以加强安全性。

此外,Data Lake Storage Gen2非常具有成本是多少,因为它建立在低成本的Azure Blob存储之上。这些新功能进一步降低了在Azure上运行大数据分析的总拥有成本。

第二代数据湖存储的主要功能

Hadoop兼容访问:借助Data Lake Storage Gen2,您可以像Hadoop分布式文件系统(HDFS)一样管理和访问数据。用于访问数据的新ABFS驱动程序在所有Apache Hadoop环境中都可用。这些环境包括Azure HDInsight、Azure Databricks和Azure Synapse Analytics。

POSIX权限的超集:Data Lake Gen2的安全模型支持ACL和POSIX权限,以及一些特定于Data Lake Storage Gen2的额外粒度。可以通过storage explorer或Hive和Spark等框架来配置设置。

经济高效:Data Lake Storage Gen2提供低成本的存储容量和交易。Azure Blob存储生命周期等功能可以在数据在其生命周期中进行转换时优化成本。

优化的驱动程序:ABFS驱动程序已经专门针对大数据分析进行了优化。相应的REST API通过端点dfs.core.chinacloudapi.cn显示。

可伸缩性

根据设计,无论是通过数据湖存储Gen2还是Blob存储接口访问,Azure存储都可以自由伸缩。它可以存储和处理数十亿字节的数据。此存储量可用于在每秒高级输入/输出操作(IOPS)下以每秒千兆位(Gbps)测量的吞吐量。它将根据在服务、帐户和文件级别测量的近乎恒定的延迟进行处理。

成本是多少

因为数据湖存储Gen2是建立在Azure Blob storage 基础之上的,所以存储容量和交易成本较低。与其他云存储服务不同,在分析数据之前,不需要移动或转换数据。有关定价的更多信息,请参见Azure存储定价。

此外,分层命名空间等功能可以显著提高许多分析作业的整体性能。这种性能上的提高意味着处理相同数量的数据需要更少的计算能力,从而降低了端到端分析作业的总拥有成本(TCO)。

一种服务,多种概念

因为Data Lake Storage Gen2构建在Azure Blob storage 基础之上,所以可以使用多个概念来描述相同的共享内容。

以下是由不同概念描述的等效实体。除非另有说明,否则这些实体是同义的:

一种服务,多种概念

支持的Blob存储函数

您的帐户现在可以使用Blob存储功能,如诊断日志记录、访问层和Blob存储生命周期管理策略。

有关受支持的Blob存储函数的列表,请参考Azure Data Lake storage Gen2中提供的Blob存储函数。

支持Azure服务集成

数据湖存储gen2支持多种Azure服务。您可以使用它们来引入数据、执行分析和创建可视化表示。有关受支持的Azure服务的列表,请参见支持Azure数据湖存储Gen2的Azure服务。

支持的开源平台

多个开源平台支持数据湖存储Gen2。有关完整的列表,请参见支持Azure数据湖存储Gen2的开源平台。


文章推荐
Google Play开发者注意事项,googleplay开发者注意事项
FB广告受众定位全面解析,fb受众定位
App界面优化之搜索栏,安卓手机微信界面没有搜索栏
从意大利至深圳进口旧工程机器设备门到门清关代理


特别声明:以上文章内容仅代表作者本人观点,不代表ESG跨境电商观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与ESG跨境电商联系。

搜索 放大镜
韩国平台交流群
加入
韩国平台交流群
扫码进群
欧洲多平台交流群
加入
欧洲多平台交流群
扫码进群
官网询盘
加入
官网询盘
扫码进群
美国卖家交流群
加入
美国卖家交流群
扫码进群
ESG跨境专属福利分享群
加入
ESG跨境专属福利分享群
扫码进群
拉美电商交流群
加入
拉美电商交流群
扫码进群
亚马逊跨境增长交流群
加入
亚马逊跨境增长交流群
扫码进群
亚马逊跨境增长交流群
加入
亚马逊跨境增长交流群
扫码进群
拉美电商交流群
加入
拉美电商交流群
扫码进群
《TikTok综合运营手册》
《TikTok短视频运营手册》
《TikTok直播运营手册》
《TikTok全球趋势报告》
《韩国节日营销指南》
《开店大全-全球合集》
《开店大全-主流平台篇》
《开店大全-东南亚篇》
《CD平台自注册指南》
《开店大全-俄罗斯篇》
通过ESG入驻平台,您将解锁
绿色通道,更高的入驻成功率
专业1v1客户经理服务
运营实操指导
运营提效资源福利
平台官方专属优惠

立即登记,定期获得更多资讯

订阅
联系顾问

平台顾问

平台顾问 平台顾问

微信扫一扫
马上联系在线顾问

icon icon

小程序

微信小程序

ESG跨境小程序
手机入驻更便捷

icon icon

返回顶部