

AWS 宣布全面推出 Amazon EC2 DL1 实例
西雅图--今天,Amazon.com, Inc. (NASDAQ: AMZN) 旗下公司 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon Elastic Compute Cloud (Amazon EC2) DL1 实例,这是一种新的为训练机器学习模型而设计的实例类型。 DL1 实例由 Habana Labs(一家英特尔公司)的 Gaudi 加速器提供支持,与最新的 GPU 驱动的 Amazon EC2 实例相比,它为训练机器学习模型提供了高达 40% 的性价比。借助 DL1 实例,客户可以针对自然语言处理、对象检测和分类、欺诈检测、推荐和个性化引擎、智能文档处理、业务预测等用例更快、更经济地训练其机器学习模型。 DL1 实例可通过低成本的即用即付使用模式按需提供,无需预先承诺。要开始使用 DL1 实例,请访问 。
“随着 Habana Labs 不断发展并使运营商覆盖范围更广,有可能扩展到更多的企业用例,从而节省额外的成本。”
机器学习已成为主流,因为客户已经意识到在云中大规模部署机器学习模型会产生切实的业务影响。为了在他们的业务应用程序中使用机器学习,客户首先构建和训练模型以通过从样本数据中学习来识别模式,然后将模型应用于新数据以进行预测。例如,在大量联络中心成绩单上训练的机器学习模型可以做出预测,通过对话聊天机器人为客户提供实时个性化帮助。为了提高模型的预测准确性,数据科学家和机器学习工程师正在构建越来越大、越来越复杂的模型。为了保持模型的预测准确性和高质量,这些工程师需要经常调整和重新训练他们的模型。这需要大量的高性能计算资源,从而导致基础设施成本增加。这些成本可能会让客户无法以维持高精度预测所需的频率重新训练他们的模型,同时也对想要开始尝试机器学习的客户构成障碍。
与通用 GPU 相比,新的 DL1 实例使用专为加速机器学习模型训练而构建的 Gaudi 加速器,通过以更低的成本提供更高的计算效率。 DL1 实例具有多达 8 个 Gaudi 加速器、256 GB 高带宽内存、768 GB 系统内存、第二代 Amazon 自定义 Intel Xeon Scalable (Cascade Lake) 处理器、400 Gbps 网络吞吐量和高达 4 TB 本地 NVMe贮存。与用于训练常见机器学习模型的最新 GPU 驱动的 Amazon EC2 实例相比,这些创新共同转化为最高 40% 的性价比。客户可以使用随附的 Habana SynapseAI SDK 快速轻松地开始使用 DL1 实例,该 SDK 与领先的机器学习框架(例如 TensorFlow 和 PyTorch)集成,帮助客户无缝迁移当前在基于 GPU 或 CPU 上运行的现有机器学习模型基于实例的 DL1 实例,代码更改最少。开发人员和数据科学家还可以从 Habana 的 GitHub 存储库中针对 Gaudi 加速器优化的参考模型开始,其中包括适用于各种应用程序的流行模型,包括图像分类、对象检测、自然语言处理和推荐系统。
“机器学习的使用猛增。然而,训练机器学习模型的挑战之一是计算密集型,并且随着客户改进和重新训练他们的模型而变得昂贵,”AWS 的 Amazon EC2 副总裁 David Brown 说。 “AWS 已经为任何机器学习项目或应用程序提供了最广泛的强大计算选择。添加具有 Gaudi 加速器的 DL1 实例为云中基于 GPU 的实例提供了迄今为止最具成本效益的替代方案。它们的价格和性能的最佳组合使客户能够降低训练成本、训练更多模型并更快地进行创新。”
客户可以使用 AWS Deep Learning AMI 或使用 Amazon Elastic Kubernetes Service (Amazon EKS) 或 Amazon Elastic Container Service (Amazon ECS) 来启动容器化应用程序的 DL1 实例。为了获得更受管理的体验,客户可以通过 Amazon SageMaker 访问 DL1 实例,让开发人员和数据科学家更轻松、更快速地在云和边缘构建、训练和部署机器学习模型。 DL1 实例受益于 AWS Nitro 系统,这是一组构建块,可将许多传统虚拟化功能卸载到专用硬件和软件,以提供高性能、高可用性和高安全性,同时降低虚拟化开销。 DL1 实例可作为按需实例、Savings Plans、预留实例或 Spot 实例购买。 DL1 实例目前在美国东部(弗吉尼亚北部)和美国西部(俄勒冈)AWS 区域可用。
40 多年来,希捷科技一直是提供数据存储和管理解决方案的全球领导者。希捷的数据科学和机器学习工程师构建了先进的深度学习 (DL) 缺陷检测系统,并将其部署在公司的全球制造设施中。在最近的概念验证项目中,Habana Gaudi 超过了训练希捷生产中当前使用的一种深度学习语义分割模型的性能目标。希捷运营、技术和高级分析高级工程总监 Darrell Louder 表示:“我们预计,由 Habana Gaudi 加速器提供支持的 Amazon EC2 DL1 实例具有显着的性价比优势,未来可能会成为 AWS 计算集群的引人注目的补充。” “随着 Habana Labs 不断发展并使运营商覆盖范围更广,有可能扩展到更多的企业用例,从而节省额外的成本。”
英特尔创建了 3D 运动员跟踪技术,可以实时分析运动员的动作视频,从而为性能训练过程提供信息并增强观众在比赛期间的体验。 “在由 Habana Labs 的 Gaudi 加速器提供支持的 Amazon EC2 DL1 实例上训练我们的模型,将使我们能够准确可靠地处理数千个视频并生成相关的性能数据,同时降低培训成本,”销售和副总裁 Rick Echevarria 说营销集团,英特尔。 “借助 DL1 实例,我们现在可以以所需的速度和成本进行训练,从而高效地为各种运动的各级运动员、团队和广播公司提供服务。”
Leidos 被公认为十大健康 IT 供应商,为医院和卫生系统、生物医学组织以及每个专注于健康的美国联邦机构提供广泛的可定制、可扩展的解决方案。 “我们今天推动医疗保健的众多技术之一是使用机器学习和深度学习基于医学成像数据进行疾病诊断。我们庞大的数据集需要及时有效的培训,以帮助寻求解决一些最紧迫的医学谜团的研究人员,”Leidos 健康与人类服务部首席技术官 Chetan Paul 说。 “鉴于 Leidos 及其客户需要对深度学习模型进行快速、简单且经济高效的培训,我们很高兴能够与英特尔和 AWS 一起开始这一旅程,以使用基于 Habana Gaudi AI 处理器的 Amazon EC2 DL1 实例。使用 DL1 实例,我们预计模型训练的速度和效率会提高,从而降低风险和研发成本。”
Fractal 是人工智能和分析领域的全球领导者,为财富 500 强公司的决策提供支持。 “人工智能和深度学习是我们医疗影像业务的核心,使客户能够做出更好的医疗决策。为了提高准确性,医疗数据集变得越来越大、越来越复杂,需要对模型进行更多的训练和再训练,从而推动对提高计算性价比的需求,”Fractal 集团首席执行官 Srikanth Velamakanni 说。 “新的 Amazon EC2 DL1 实例承诺比基于 GPU 的 EC2 实例的培训成本显着降低,这可以帮助我们控制成本并使 AI 决策更容易为更广泛的客户群体所接受。”
关于亚马逊网络服务
15 年来,Amazon Web Services 一直是世界上最全面、被广泛采用的云产品。 AWS 一直在不断扩展其服务以支持几乎任何云工作负载,现在它拥有 200 多项功能齐全的服务,用于计算、存储、数据库、网络、分析、机器学习和人工智能 (AI)、物联网 (IoT) 、移动、安全、混合、虚拟和增强现实(VR 和 AR)、媒体以及来自 25 个地理区域内的 81 个可用区 (AZ) 的应用程序开发、部署和管理,并宣布计划再增加 24 个可用区和另外 8 个可用区澳大利亚、印度、印度尼西亚、以色列、新西兰、西班牙、瑞士和阿拉伯联合酋长国的 AWS 区域。数以百万计的客户(包括发展最快的初创公司、最大的企业和领先的政府机构)信任 AWS 来支持他们的基础设施、变得更加敏捷并降低成本。
关于亚马逊
亚马逊遵循四项原则:以客户为中心而非以竞争对手为中心、对发明的热情、对卓越运营的承诺以及长期思考。亚马逊努力成为地球上最以客户为中心的公司、地球上最好的雇主和地球上最安全的工作场所。客户评论、一键购物、个性化推荐、Prime、亚马逊物流、AWS、Kindle Direct Publishing、Kindle、Career Choice、Fire 平板电脑、Fire TV、亚马逊 Echo、Alexa、Just Walk Out 技术、亚马逊工作室和气候承诺是亚马逊开创的一些东西。有关更多信息,请访问 amazon.com/about 并关注@AmazonNews。
特别声明:以上文章内容仅代表作者本人观点,不代表ESG跨境电商观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与ESG跨境电商联系。
二维码加载中...
使用微信扫一扫登录
使用账号密码登录
平台顾问
微信扫一扫
马上联系在线顾问
小程序
ESG跨境小程序
手机入驻更便捷
返回顶部