AWS 宣布全面推出 Amazon Textract-ESG跨境

AWS 宣布全面推出 Amazon Textract

亚马逊观察
亚马逊观察
2019-05-29
点赞icon 0
查看icon 954

AWS 宣布全面推出 Amazon Textract

西雅图--今天,Amazon.com 公司(纳斯达克股票代码:AMZN)旗下的 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon Textract,这是一项使用机器学习自动提取文本的完全托管服务和数据,包括来自表格和表格的数据,几乎可以在任何文档中使用,无需人工审核、自定义代码或机器学习经验。 Amazon Textract 不仅可以识别简单的光学字符识别 (OCR),还可以识别表单中字段的内容、存储在表格中的信息以及显示信息的上下文,例如税表或产品中的姓名或社会保险号库存报告中仓库中的 SKU 或数量。提取的文本和数据可以很容易地用于对大型文档档案进行智能搜索,或者可以加载到数据库中供应用程序使用,例如会计、审计和合规软件。 Amazon Textract 的 API 支持多种图像格式,如扫描、PDF 和照片,客户可以将其与 Amazon Elasticsearch Service、Amazon DynamoDB 和 Amazon Athena 等数据库和分析服务以及 Amazon Comprehend、Amazon Comprehend Medical、Amazon 等其他机器学习服务一起使用Translate 和 Amazon SageMaker 从提取的文本和数据中获取更深层次的含义。要开始使用 Amazon Textract,请访问 。

“我们已经使用 Amazon Textract 代表金融机构分析了数以万计的贷款文件,并且我们自己的软件即服务产品通过该服务得到了增强,使我们能够识别 95% 的贷款缺陷应用程序包并帮助银行减少手动数据输入”

许多公司通过手动数据输入或简单的 OCR 软件从合同、费用报告、抵押担保、基金招股说明书、税务文件、医院索赔和患者表格等文件中提取文本和数据。这是一个耗时且通常不准确的过程,它产生的输出需要大量的后处理,然后才能以其他应用程序可用的格式放置。这是因为现有的 OCR 技术无法识别表单和表格等常见布局,只能生成冗长且通常不准确的文本转储。相反,组织想要的是能够从任何格式的文档以及各种文件类型和模板中的表单和表格中准确识别和提取文本和数据。 Amazon Textract 几乎可以分析任何类型的文档,自动生成高度准确的文本、表单和表格数据。 Amazon Textract 识别文档中表格和表格中的文本和数据(例如拍摄收据中的行项目和总计、W2 中的税务信息或扫描库存报告中表格中的值)并识别一系列文档格式,包括那些特定于金融服务、保险和医疗保健的产品,无需任何定制或人工干预。 Amazon Textract 让客户可以在短短几个小时内轻松准确地处理数百万个文档页面,显着降低文档处理成本,让客户专注于从文本和数据中获取商业价值,而不是在后期处理上浪费时间和精力.结果通过 API 交付,无需任何机器学习经验即可轻松访问和使用。

“Amazon Textract 的强大之处在于它可以准确地从几乎任何文档中提取文本和结构化数据,而无需机器学习经验。随后,开发人员可以使用我们的数据库和分析服务(如 Amazon Elasticsearch Service、Amazon DynamoDB 和 Amazon Athena)分析和查询提取的文本和数据,并与 Amazon Comprehend、Amazon Comprehend Medical、Amazon Translate 和 Amazon SageMaker 等其他机器学习服务集成帮助客户从提取的文本和数据中获得更深层次的意义,”亚马逊机器学习副总裁 Swami Sivasubramanian 说。 “除了与其他 AWS 服务的集成之外,围绕 Amazon Textract 开发的丰富合作伙伴社区使客户能够从他们的文件集合中获得真正的意义、更高效地运营、提高安全合规性、自动化数据输入并促进更快的业务决策。”

Amazon Textract 获取存储在 Amazon S3 存储桶中的扫描文件,读取它们,并以带有页码、部分、表单标签和数据类型注释的 JSON 文本的形式返回数据。然后,这些数据可用于一系列应用(例如生成智能搜索索引、编辑大量表单中的文本、创建自动贷款审批工作流程、使用数据进行监管合规以及标记保险索赔的欺诈风险)。客户可以将数据加载到电子表格、数据库和工资系统等业务软件中,也可以使用 Amazon ElasticSearch、Amazon DynamoDB、Amazon Redshift 或 Amazon Athena 分析和查询数据。 Amazon Textract 现已在美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、欧洲(爱尔兰)推出,明年将扩展到其他区域。

The Globe and Mail 是加拿大的标志性媒体和加拿大最知名的媒体品牌。 “作为一家新闻媒体公司,我们依赖于许多 PDF 或扫描源文档,例如 FOI(信息请求自由),这些文档在我们以前无法访问的表格中包含重要信息,”总经理 Michael O'Neill 说The Globe and Mail 的数字和数据科学部主任。“这些文件未被充分利用,因为记者无法轻松访问它们或不知道它们的存在。使用 Amazon Textract,我们能够从 PDF 中的表格中提取信息并将这些数据轻松输出到 CSV,并通过让我们的记者可以搜索查询来轻松访问这些文档。这将我们的记者获取信息的效率提高了十倍。”

Met Office 是英国的国家气象服务机构,在提供天气和气候服务方面处于世界领先地位。 “我们希望使用 AmazonTextract 将来自文档档案的数百万历史天气观测数据数字化,”气象局气候科学家 Philip Brohan 说。“将这些观测数据提供给科学界将提高我们对气候变率和变化的理解。”

普华永道通过提供质量保证、税务和咨询服务来帮助组织和个人创造价值。 “在普华永道,我们致力于为客户提供智能自动化工具,帮助改变以前的手动流程。我们已将 Amazon Textract 集成到我们的制药行业解决方案中,以自动处理各种 FDA 表格(如 MedWatch 和 CIOMS)的文档,”普华永道的 Siddhartha Bhattacharya 说。 “以前,人们会手动审查、编辑和处理这些表格,每一个都需要几个小时。事实证明,Amazon Textract 是可用于这些表单的最高效、最准确的 OCR 解决方案,它提取所有相关信息以供审查和处理,并将花费的时间从几小时缩短到几分钟。”

Healthfirst 是一家非营利性管理式医疗组织,也是纽约发展最快的健康计划之一,拥有超过 140 万多元化成员以及由 35,000 多名提供者和 4,500 名员工组成的网络。 “在 Healthfirst,我们正在构建数据管道,将扫描的医疗图表转化为有用的临床信息,以改善护理协调,推动质量结果,并确保为我们覆盖的成员提供适当的报销,”Healthfirst 首席分析官 Steve Prewitt 说。 “我们使用 Amazon Textract 和 Amazon Comprehend Medical 以有效的方式从非结构化数据源中收集真正的价值,与我们通常的下游业务相比,节省了 10-20 倍的收入。通过扩大分析超过 50,000 个图表,我们可以找到未记录的诊断,并为大约 5,000 名成员推荐他们需要的护理管理。”

Informed, Inc. 自动化金融机构发放贷款和开设银行账户的方式。 “我们已经使用 Amazon Textract 代表金融机构分析了数以万计的贷款文件,并且我们自己的软件即服务产品通过该服务得到了增强,使我们能够识别 95% 的贷款缺陷Informed Inc. 创始人兼首席执行官 Justin Wickett 说、纳税申报表和其他财务文件。我们计划扩展使用 Amazon Textract 分析的文件类型,以使金融机构能够利用我们的机器学习模型,为当今缓慢和手动的情况带来实时决策效率过程。”

Candor 的使命是改变对抵押贷款行业造成负担的陈旧、耗时的流程。 “我们使用 OCR 从各种贷方要求的文件中提取数据,以验证收入、资产、财产价值等。到目前为止,最好的 OCR 解决方案以 38.4 秒的速度读取一页,但 Amazon Textract 只用了一小部分时间就实现了这一目标,”Candor 创始人兼首席执行官 Tom Showalter 说。 “我们已经能够使用 Textract 准确读取复杂、多样化的文件,例如银行对账单、工资单和税务文件,而无需额外的培训或机器学习专业知识,使我们的客户能够在几天内承销和关闭贷款,而不是周。”

UiPath 是领先的机器人流程自动化供应商,提供完整的软件平台来帮助组织有效地自动化业务流程。 “Amazon Textract 将通过增强 UiPath 的文档理解能力进一步区分 UiPath 的机器人流程自动化平台,使我们的客户能够从文档中解锁关键业务数据,将这些数据转化为可操作的业务洞察力,并将这些洞察力传递给业务线和运营系统”UiPath 首席产品官 Param Kahlon 说。

TeraDact 允许客户将存储的图像和纸质文档大规模转换为符合隐私的、可用的数字格式。 “Amazon Textract 的智能文档平台为 TeraDact 的专利编辑服务提供数据,以自动删除和保护敏感数据。 TeraDact 客户可以永久删除这些数据,使其永远无法恢复,或者选择用具有适当权限的个人可以恢复的专利令牌替换敏感数据。 TeraDact 首席运营官 Tom Trobridge 说:“这对于遵守政府对个人数据隐私的要求(例如 GDPR)特别有用。”

Ripcord 的使命是使用视觉引导机器人、机器学习和先进的人工智能从纸质文档中数字化和提取知识。这些知识使业务流程和工作流程自动化。 “我们利用 Amazon Textract 增强了我们先进的实体提取功能,使许多行业受益,并获得了 40 亿美元的新薪酬,取得了巨大的成功。我们期待将 Amazon Textract 的使用范围扩大到金融和政府服务、医疗保健和法律领域,”Ripcord 首席执行官 Alex Fielding 说。

Blue Prism 开发机器人流程自动化软件,为企业和组织提供更灵活的虚拟劳动力。 “Blue Prism 的联网 RPA 可以自动化和执行关键任务流程,让客户可以自由地专注于更具创造性、更有意义的工作。通过使用 Amazon Textract,我们为我们的数字员工提供了另一个强大的自动化工具。 Amazon Textract 使用机器学习准确分析来自各种文档类型的数据,从而增强了我们客户的数字化转型之旅。使用 Amazon Comprehend 和 Amazon Rekognition 等其他 AWS AI 服务,我们可以应对从增加安全客户身份验证流程到欺诈检测功能的挑战。 Amazon Textract 表单数据提取的智能性和灵活性可以将 OCR 提升到金融服务、零售、制造和运输等行业的新水平,”Blue Prism 首席技术官兼联合创始人 Dave Moss 说。

关于亚马逊网络服务

13 年来,Amazon Web Services 一直是世界上最全面、应用最广泛的云平台。 AWS 为计算、存储、数据库、网络、分析、机器人、机器学习和人工智能 (AI)、物联网 (IoT)、移动、安全、混合、虚拟和增强现实(VR 和 AR)提供超过 165 项功能齐全的服务)、媒体和应用程序开发、部署和管理,来自 21 个地理区域内的 66 个可用区 (AZ),跨越美国、澳大利亚、巴西、加拿大、中国、法国、德国、香港特别行政区、印度、爱尔兰、日本、韩国、新加坡、瑞典和英国。数以百万计的客户,包括发展最快的初创公司、最大的企业和领先的政府机构,都信任 AWS 来支持他们的基础设施、变得更加敏捷并降低成本。

关于亚马逊

亚马逊遵循四项原则:以客户为中心而非以竞争对手为中心、对发明的热情、对卓越运营的承诺以及长期思考。客户评论、一键购物、个性化推荐、Prime、亚马逊物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板电脑、Fire TV、亚马逊 Echo 和 Alexa 是亚马逊率先推出的一些产品和服务。

点击咨询现在有哪些新兴平台值得关注 >>>


特别声明:以上文章内容仅代表作者本人观点,不代表ESG跨境电商观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与ESG跨境电商联系。

全球最大电商平台
查看更多
搜索 放大镜
韩国平台交流群
加入
韩国平台交流群
扫码进群
欧洲多平台交流群
加入
欧洲多平台交流群
扫码进群
美国卖家交流群
加入
美国卖家交流群
扫码进群
ESG跨境专属福利分享群
加入
ESG跨境专属福利分享群
扫码进群
拉美电商交流群
加入
拉美电商交流群
扫码进群
亚马逊跨境增长交流群
加入
亚马逊跨境增长交流群
扫码进群
亚马逊跨境增长交流群
加入
亚马逊跨境增长交流群
扫码进群
拉美电商交流群
加入
拉美电商交流群
扫码进群
《TikTok综合运营手册》
《TikTok短视频运营手册》
《TikTok直播运营手册》
《TikTok全球趋势报告》
《韩国节日营销指南》
《开店大全-全球合集》
《开店大全-主流平台篇》
《开店大全-东南亚篇》
《CD平台自注册指南》
《开店大全-俄罗斯篇》
通过ESG入驻平台,您将解锁
绿色通道,更高的入驻成功率
专业1v1客户经理服务
运营实操指导
运营提效资源福利
平台官方专属优惠

立即登记,定期获得更多资讯

订阅
联系顾问

平台顾问

平台顾问 平台顾问

微信扫一扫
马上联系在线顾问

icon icon

小程序

微信小程序

ESG跨境小程序
手机入驻更便捷

icon icon

返回顶部