

AWS 宣布推出 Amazon DevOps Guru
西雅图--今天在 AWS re:Invent 大会上,Amazon.com, Inc. (NASDAQ: AMZN) 旗下公司 Amazon Web Services, Inc. (AWS) 宣布推出完全托管的运营服务 Amazon DevOps Guru使用机器学习,通过自动检测操作问题并推荐特定的补救措施,让开发人员更容易提高应用程序的可用性。 Amazon DevOps Guru 应用基于 Amazon.com 和 AWS 多年卓越运营经验的机器学习来自动收集和分析应用程序指标、日志、事件和跟踪等数据,以识别偏离正常运营模式的行为(例如,计算能力不足、数据库 I/O 过度使用、内存泄漏等)。当 Amazon DevOps Guru 识别出可能导致潜在中断或服务中断的异常应用程序行为(例如增加的延迟、错误率、资源限制等)时,它会向开发人员发出问题详细信息(例如所涉及的资源、问题时间线、相关事件等)的警报。 ) 通过 Amazon Simple Notification Service (SNS) 和合作伙伴集成(如 Atlassian Opsgenie 和 PagerDuty)帮助他们快速了解问题的潜在影响和可能的原因,并提供具体的补救建议。开发人员可以使用来自 Amazon DevOps Guru 的补救建议来缩短问题出现时的解决时间,并提高应用程序的可用性和可靠性,而无需手动设置或机器学习专业知识。 Amazon DevOps Guru 没有前期成本或承诺,客户只需为 Amazon DevOps Guru 分析的数据付费。要开始使用 Amazon DevOps Guru,请访问
“客户要求我们继续围绕我们可以应用我们自己的专业知识来提高应用程序可用性的领域添加服务,并从我们在运行 Amazon.com 时获得的多年运营经验中学习”
随着越来越多的组织转向基于云的应用程序部署和微服务架构以在不受本地部署限制的情况下在全球范围内扩展其业务和运营,应用程序变得越来越分散以满足客户需求,开发人员需要更多的自动化实践来维护应用程序的可用性和减少检测、调试和解决操作问题所花费的时间和精力。由错误代码或配置更改、不平衡的容器集群或资源耗尽(例如 CPU、内存、磁盘等)导致的应用程序停机事件不可避免地导致糟糕的客户体验和收入损失。公司投入大量资金和开发人员时间来部署多个通常单独管理的监控工具,然后必须针对常见问题(例如负载均衡器错误峰值或应用程序请求率下降)开发和维护自定义警报。设置阈值以在应用程序资源行为异常时进行识别和警报很难正确设置,涉及手动设置,并且需要随着应用程序使用情况的变化(例如,假日购物季节异常大量的请求)必须不断更新阈值。如果阈值设置得太高,开发人员在操作性能受到严重影响之前不会看到警报。当阈值设置得太低时,开发人员会得到太多误报,最终会被忽略。即使开发人员收到潜在操作问题的警报,确定根本原因的过程仍然很困难。使用现有工具,开发人员通常难以从图表和警报中确定操作问题的根本原因,即使他们能够找到根本原因,他们也常常无法解决问题。每次故障排除尝试都是一个冷启动,团队必须花费数小时或数天来识别问题,这会导致耗时、乏味的工作,从而减慢解决操作故障的时间,并可能延长应用程序中断时间。
Amazon DevOps Guru 的机器学习模型利用了 20 多年为 Amazon.com 构建、扩展和维护高可用性应用程序的运营专业知识。这使 Amazon DevOps Guru 能够自动检测操作问题(例如丢失或配置错误的警报、资源耗尽的早期警告、可能导致中断的配置更改等),提供有关资源和相关事件的上下文,并建议补救措施– 无需机器学习经验。只需在 Amazon DevOps Guru 控制台中单击几下,历史应用程序和基础设施指标(如延迟、错误率和所有资源的请求率)就会自动获取和分析,以建立正常的操作范围,然后 Amazon DevOps Guru 使用预先训练的机器学习模型来识别与既定基线的偏差。当 Amazon DevOps Guru 分析系统和应用程序数据以自动检测异常时,它还将这些数据分组为运营洞察力,其中包括异常指标、应用程序行为随时间变化的可视化以及补救措施建议。 Amazon DevOps Guru 还关联和分组相关的应用程序和基础设施指标(例如 Web 应用程序延迟峰值、磁盘空间不足、错误代码部署、内存泄漏等),以减少冗余警报并帮助用户将注意力集中在高严重性问题上。客户可以查看配置更改历史记录和部署事件,以及系统和用户活动,以在 Amazon DevOps Guru 控制台中生成可能导致操作问题的优先级列表。为帮助客户快速解决问题,Amazon DevOps Guru 提供带有修复步骤的智能建议,并与 AWS Systems Manager 集成以提供运行手册和协作工具,使客户能够更有效地维护应用程序并管理其部署的基础设施。与 Amazon CodeGuru(一种由机器学习提供支持的开发人员工具,可提供智能建议以提高代码质量和识别应用程序中最昂贵的代码行)一起,Amazon DevOps Guru 为客户提供机器学习对其操作数据的自动化优势,以便开发人员能够更多轻松提高应用程序的可用性和可靠性。
亚马逊副总裁 Swami Sivasubramanian 说:“客户要求我们继续围绕我们可以应用我们自己的专业知识来提高应用程序可用性的领域添加服务,并从我们在运行 Amazon.com 时获得的多年运营经验中学习。” Machine Learning, Amazon Web Services, Inc. “借助 Amazon DevOps Guru,我们汲取了我们的经验并构建了专门的机器学习模型,帮助客户检测、排除故障和预防操作问题,同时在出现问题时提供智能建议。这使团队能够立即从亚马逊从运行 Amazon.com 中学到的最佳运营实践中受益,从而为客户节省原本用于配置和管理多个监控系统的时间和精力。”
只需在 AWS 管理控制台中单击几下,客户就可以让 Amazon DevOps Guru 在几分钟内开始分析账户和应用程序活动,以提供运营见解。 Amazon DevOps Guru 为客户提供单一控制台体验,通过汇总多个来源(例如 AWS CloudTrail、Amazon CloudWatch、AWS Config、AWS CloudFormation、AWS X-Ray)的相关数据来可视化其运营数据,并减少在多个工具之间切换的需要.客户还可以在 Amazon DevOps Guru 控制台中查看相关的操作事件和上下文数据以获得操作见解,并通过 Amazon SNS 接收警报。此外,Amazon DevOps Guru 通过 AWS 开发工具包支持 API 终端节点,使合作伙伴和客户可以轻松地将 Amazon DevOps Guru 集成到他们现有的解决方案中,以便针对高严重性问题进行工单、寻呼和自动通知工程师。 PagerDuty 和 Atlassian 是已将 Amazon DevOps Guru 集成到其运营监控和事件管理平台的合作伙伴之一,使用其解决方案的客户现在可以从 Amazon DevOps Guru 提供的运营洞察中受益。 Amazon DevOps Guru 现已在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)和美国西部(俄勒冈)、亚太地区(新加坡)和欧洲(爱尔兰)推出预览版,未来几个月将在其他区域推出.
超过 170,000 家公司的团队依靠 Atlassian 产品简化团队合作,并帮助他们组织、讨论和完成工作。 “Atlassian 很自豪能够与 AWS 合作推出 Amazon DevOps Guru,并帮助团队自信地部署代码和运营服务,”Opsgenie 产品负责人 Emel Dogrusoz 说。 “通过我们新的 Opsgenie 和 Jira Service Management 集成,当 Amazon DevOps Guru 预测潜在问题或确定发生事件时,可以立即通知正确的团队。 Amazon DevOps Guru 提供了一个新维度的洞察力,而 Atlassian 确保了最快的响应。”
PagerDuty, Inc. (NYSE:PD) 是数字运营管理领域的领导者。 PagerDuty 产品高级副总裁 Jonathan Rende 说:“PagerDuty 旨在通过自动化整个事件响应生命周期和解决方案来推动向 DevOps 文化的转变。” “我们很高兴通过与 Amazon DevOps Guru 的最新集成来继续对 DevOps 的承诺。利用 Amazon 数十年的卓越运营和 Amazon DevOps Guru 的机器学习能力,PagerDuty 为我们的共同客户提供了更多实时信号到行动的能力。通过 PagerDuty 引入 Amazon DevOps Guru 的 Amazon SNS,AWS 客户可以在运营问题成为影响客户的中断之前对其采取实时行动。”
SmugMug 是一个付费图片分享服务、图片托管服务和在线视频平台,用户可以在上面上传照片和视频。该公司为业余和专业摄影师销售数字和印刷媒体提供便利。 SmugMug 运营总监 Andrew Shieh 说:“我的团队遵循终身运营的座右铭,我们一直在寻找自动化手动活动的方法。” “借助 Amazon DevOps Guru,我们希望实现这一目标,让 AIOps 接管我们的许多日常任务,让我们的工作日由单个 George-Jetson 风格的 Easy Button 组成,这样我的团队就可以专注于 IT 创新.我们现在不仅能够满足业务需求,而且能够超越它们,因为我们有更多时间专注于最重要的事情——为我们的组织和客户创造价值。”
NextRoll 通过授权市场和营销平台构建和增强其营销解决方案来帮助他们增加收入。 “我们运行了数千个 Amazon Elastic Compute Cloud (Amazon EC2) 实例,我们正在寻找方法来减少我的团队在解决运营问题上所花费的时间,”NextRoll 首席技术官 Valentino Volonghi 说。 “我们很高兴能够使用 Amazon DevOps Guru 并利用其机器学习驱动的洞察力来帮助我们识别、关联和修复运营问题并提供建议。这将帮助我的团队节省时间并减少我们的平均恢复时间。”
关于亚马逊网络服务
14 年来,Amazon Web Services 一直是世界上最全面、应用最广泛的云平台。 AWS 为计算、存储、数据库、网络、分析、机器人、机器学习和人工智能 (AI)、物联网 (IoT)、移动、安全、混合、虚拟和增强现实(VR 和 AR)提供超过 175 项功能齐全的服务)、媒体和应用程序开发、部署和管理,来自 24 个地理区域内的 77 个可用区 (AZ),并已宣布计划在印度、印度尼西亚、日本、西班牙和瑞士再增加 15 个可用区和 5 个 AWS 区域。数以百万计的客户(包括发展最快的初创公司、最大的企业和领先的政府机构)信任 AWS 来支持他们的基础设施、变得更加敏捷并降低成本。要了解有关 AWS 的更多信息,请访问 aws.amazon.com。
关于亚马逊
亚马逊遵循四项原则:以客户为中心而非以竞争对手为中心、对发明的热情、对卓越运营的承诺以及长期思考。客户评论、一键购物、个性化推荐、Prime、亚马逊物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板电脑、Fire TV、亚马逊 Echo 和 Alexa 只是亚马逊开创的部分产品和服务。欲了解更多信息,请访问并关注@AmazonNews。
特别声明:以上文章内容仅代表作者本人观点,不代表ESG跨境电商观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与ESG跨境电商联系。
二维码加载中...
使用微信扫一扫登录
使用账号密码登录
平台顾问
微信扫一扫
马上联系在线顾问
小程序
ESG跨境小程序
手机入驻更便捷
返回顶部