转换匹配患者记录,看Amazon Lake Formation FindMatches显神通!

2022-01-16
阅读 11 分钟
2.1k
患者匹配是实现医疗护理互通性的主要障碍之一。不匹配的患者记录和无法检索患者历史信息可能严重阻碍做出正确的临床决定,并导致漏诊或治疗延误。另外,医疗护理提供者经常会花精力去处理患者重复数据的删除,尤其当他们的数据库中的患者记录数量急速增加时。电子健康记录 (EHR) 近年来大幅优化了患者的安全和护理协调,...

借助Amazon EMR与外部KDC进行身份认证,有效集成业务场景

2021-12-22
阅读 6 分钟
942
安全始终是亚马逊云科技的头号工作,也是Amazon EMR这项托管Hadoop服务的首要原则。很多客户越来越意识到安全的重要性,尤其数据安全的重要性,在客户进行全球化业务扩展的时候,面对各国家区域的合规要求,更多采用Kerberos在EMR上进行身份验证。但是很多hadoop用户第一次尝试集成Amazon EMR和Kerberos时,尤其面对安全...
封面图

通过Amazon SageMaker与Amazon Step Functions实现机器学习的CI/CD 方案

2021-12-22
阅读 13 分钟
1k
(2)算法团队不断地对算法进行开发与变更,并且需要尝试不同的特征工程,每次变更都需要做单元测试,如何将Amazon SageMaker与CI/CD工具整合,在提升开发效率的同时减少运维团队的工作负担。本文会介绍通过Amazon SageMaker与Amazon Step Functions进行模型自动训练与部署的方法,并会与Amazon CodeCommit、Amazon Code...
封面图

在Amazon SageMaker上快速、灵活构建TensorFlow模型的在线推理服务

2021-12-22
阅读 6 分钟
1.1k
当算法工程师在本地使用TensorFlow深度学习框架训练好模型后,会创建模型服务器供应用程序调用实现在线推理。由于部署本身存在一定的复杂性,他们需要考虑如何安装TensorFlow Serving相关的依赖,如何实现模型服务的高可用、请求负载均衡、A/B测试、自动伸缩机制等。Amazon SageMaker可以帮助用户快速创建多台模型服务器...
封面图

Amazon Timestream 在车联网场景的典型应用和性能测试

2021-12-22
阅读 7 分钟
1k
在工业物联网以及互联网等场景中,常常会产生大量的带时间标签的数据,被称为时间序列数据。这些数据的典型特点为:产生频率快(每一个监测点一秒钟内可产生多条数据)、严重依赖于采集时间(每一条数据均要求对应唯一的时间)、测点多信息量大(实时监测系统有成千上万的监测点,监测点每秒钟都产生数据,每天轻松产生...
封面图

使用 Amazon Athena 做漏斗分析——实现更高效的数据湖检索

2021-12-22
阅读 14 分钟
1.2k
在日常的业务运营过程中,管理者常常需要快速了解业务的运转健康状况,识别出瓶颈和问题,并制订应对的计划。要概览业务全景,我们可以借助一些统计工具。「漏斗分析」就是一种常见的工具,它很适合多个环节按时间顺序串联的业务。
封面图

使用Amazon RDS for Oracle配合Oracle Active Data Guard建立托管的灾难恢复与只读副本

2021-12-22
阅读 10 分钟
1.3k
众多亚马逊云科技用户都在使用Amazon关系数据库服务产品组合(Amazon Relational Database Service,简称Amazon RDS)来减少沉重繁琐且无差异化的数据库日常维护工作。其中Amazon RDS for Oracle也切实帮助用户显著减少了Oracle数据库的管理与维护负担。
封面图

面对持续不断生成的流数据—— Amazon Kinesis Data Analytics 实现及时分析与处理

2021-12-22
阅读 14 分钟
3.2k
如今各种企业每天都在面对持续不断生成的数据需要处理,这些数据可能来自移动或 Web 应用程序生成的日志文件、网上购物数据、游戏玩家活动、社交网站信息或者是金融交易等。能够及时地处理并分析这些流数据对企业来说至关重要,通过良好的流数据处理和应用,企业可以快速做出业务决策,改进产品或服务的质量,提升用户的...
封面图

轻松搭建数据仓库,与FreeWheel一起“玩转”Amazon EMR

2021-12-21
阅读 12 分钟
2.1k
Amazon Elastic MapReduce(Amazon EMR)是Amazon Web Services提供的托管集群平台,用户可以非常方便的使用Amazon EMR搭建起一套集群,用来支撑大数据框架的应用,如Apache Spark,Hive,Flink,Presto等等。因为Amazon EMR具有很好的可配置性和伸缩性,使用者可以灵活的根据自己的需求进行定制,在满足生产需求的同时,...
封面图

通用数据保护条例的监管下,你的数据湖“断舍离”了吗?

2021-12-21
阅读 7 分钟
819
通用数据保护条例(GDPR)是当今技术世界中的重要法规,也是众多在亚马逊云科技公有云当中建立解决方案的用户们所必须遵循的数据处理要求。GDPR中提出一项“删除权”,或者叫“被遗忘权”条款,要求通过实施相关解决方案保证删除特定用户的个人数据。
封面图

Amazon Redshift ML现已正式推出——使用SQL创建机器学习模型并通过您的数据进行预测

2021-12-21
阅读 10 分钟
965
借助 Amazon Redshift,您可以使用SQL在您的数据仓库、操作数据库和数据湖中查询和合并数EB的结构化和半结构化数据。现在,AQUA(高级查询加速器)已全面推出,您可以将您的查询性能最高提高 10 倍,而无需额外的费用和代码更改。事实上,Amazon Redshift提供比其他云数据仓库高出三倍的性价比。
封面图

推出Amazon Kinesis Data Analytics Studio —— 与流数据快速交互

2021-12-21
阅读 10 分钟
1.1k
及时获得见解并对从您的企业和应用程序接收的新信息做出快速反应的最佳方式是分析流数据。这些数据通常必须按顺序和以增量方式按记录或者通过滑动时间窗口进行处理,并且可用于各种分析,包括关联、聚合、筛选和采样。
封面图

手把手教程|通过部署 Apache Superset 实现 Amazon S3 的数据可视化

2021-12-21
阅读 7 分钟
1.4k
为了让数据挖掘和数据查询能够更加普世化,惠及更多的想使用数据的但缺乏SQL能力的一般数据消费者,各类数据可视化工具应运而生,像Amazon Quicksight就是这样一款产品。目前亚马逊云科技中国区Amazon Quicksight还没有上线,开源界也有不少好用的可视化项目,Apache Superset就是其中之一。
封面图