EasyNLP发布融合语言学和事实知识的中文预训练模型CKBERT

2022-11-02
阅读 29 分钟
简介: 本⽂简要介绍CKBERT的技术解读,以及如何在EasyNLP框架、HuggingFace Models和阿里云机器学习平台PAI上使⽤CKBERT模型。导读预训练语言模型在NLP的各个应用中都有及其广泛的应用;然而,经典的预训练语言模型(例如BERT)缺乏对知识的理解,例如知识图谱中的关系三元组。知识增强预训练模型使用外部知识(知识图...

函数计算|如何使用层解决依赖包问题?

2022-11-02
阅读 9 分钟
简介: 在使用阿里云函数计算平台时,如果您曾经遇到过以下问题,本文应该会对您有所帮助: 第三方依赖包太大,每次更新代码都非常耗时,甚至会出现超过代码包限制的情况,我该怎么办? 安装第三方依赖包后,可以在本地运行成功,上传到阿里云函数计算平台上就会报错,这是什么情况? 有很多常用的依赖包,很多用户应该...

跨境电商多语言搜索最佳实践

2022-11-01
阅读 2 分钟
简介: 本文详细介绍智能开放搜索OpenSearch行业版在跨境电商领域的智能搜索应用。典型业务场景搜索是电商场景的核心流量入口,在跨境电商、国际电商场景下亦是如此。在跨境电商搜索场景中,涉及多语言、多场景复杂搜索条件,搜索处理尤为复杂。首先,需要识别不同搜索场景下的语言类型,确定目标商品池。然后,识别用户...

如何将传统 Web 框架迁移部署到 Serverless 架构?

2022-11-01
阅读 5 分钟
简介: 与其说 Serverless 架构是一个新的概念,不如说它是一种全新的思路,一种新的编程范式。与其说 Serverless 架构是一个新的概念,不如说它是一种全新的思路,一种新的编程范式。 但是原生的 Serverless 开发框架却非常少。以Web框架为例,目前主流的Web框架“均不支持Serverless模式部署”,因此我们一方面要尝试接...

传统大型国企云原生转型,如何解决弹性、运维和团队协同等问题?

2022-11-01
阅读 4 分钟
简介: 系统上线 SAE 之后,开发运效率提升了 50%+,机器成本下降了 20%,运维人力成本下降了 60%,扩容速度更是比之前快了十几倍,很好的完成了之前定下的目标。作者:王彬、杏祉尧、黄枫 项目背景 贵州酒店集团有限公司于 2019 年 2 月 28 日注册成立,是经贵州省人民政府批准并授权省国资委履行出资人职责的省管大一...

基于IoT全链路实时质量-魔洛哥

2022-11-01
阅读 6 分钟
简介: 通过基于IoT的全链路实时质量,业务使用狄仁杰进行全链路埋点后,可一键接入魔洛哥平台,实现终端问题的实时感知和链路分析,以及智能终端系统业务场景的全链路实时质量。整体方案接入成本低(分钟级别接入),可实现全链路的实时质量分析,以及精准的终端预警能力。帮助开发运维同学实时发现问题,快速问题的定...

聊一聊分布式锁的设计模型

2022-11-01
阅读 8 分钟
简介: 什么是分布式锁?对于这个问题,相信很多同学是即熟悉又陌生。随着分布式系统的快速发展与广泛应用,针对共享资源的互斥访问也成为了很多业务必须要面对的需求,这个场景下人们通常会引入分布式锁来解决问题。我们通常会使用怎么样的分布锁服务呢?在使用分布式锁过程中,总还是会提出这样、那样的新需求,看起来...

项目环境稳定性指标建设之路

2022-10-31
阅读 5 分钟
简介: 本文通过梳理项目环境生命周期内创建、部署、重启、删除等任务的特点后,去除了流程引擎对消息的依赖,使用分布式分片任务,分布式锁实现任务的分布式运行。通过使用工厂模式,责任链模式,以及领域驱动设计的思路对流程引擎进行重构。最终实现在环境数量翻数百倍以上的情况下,日常以及预发环境平均创建成功率达...

《领域驱动设计》:从领域视角深入仓储(Repository)的设计和实现

2022-10-28
阅读 14 分钟
简介: 《领域驱动设计》中的Repository(下面将用仓储表示)层实际上是极具有挑战性的,对于它的理解,也十分重要。本文讲大部分内容都在众多前辈理论基础上,从一个崭新的领域视觉开始探索,并结合自己的实践感悟进行细致的解析。同时本文不仅仅是DDD前辈的搬运工,也创新提出了仓储实体转移的概念,可以提供给读者思...

一文读懂字符编码

2022-10-27
阅读 20 分钟
简介: 我们天天都在使用字符编码,但是我们知其然却不知其所以然,很少有人能够真正把他说清楚。这次我们通过编码的本质、字符编码的发展历程,到现代编码模型,以及目前常用字符编码原理来讲解,从头到尾把他撸个透作者 | 詹向阳(骁飏)来源 | 阿里技术公众号 前言说起字符编码,让我想起了科幻巨作《三体-黑暗深林》人...

OpenKruise v1.3:新增自定义 Pod Probe 探针能力与大规模集群性能显著提升

2022-10-26
阅读 7 分钟
简介: 在版本 v1.3 中,OpenKruise 提供了新的 CRD 资源 PodProbeMarker,改善了大规模集群的一些性能问题,Advanced DaemonSet 支持镜像预热,以及 CloneSet、WorkloadSpread、Advanced CronJob、SidecarSet 一些新的特性。作者:赵明山(立衡)

EasyCV DataHub 提供多领域视觉数据集下载,助力模型生产

2022-10-25
阅读 5 分钟
简介: 在人工智能广泛应用的今天,深度学习技术已经在各行各业起到了重要的作用。在计算机视觉领域,深度学习技术在大多数场景已经替代了传统视觉方法。如果说深度学习是一项重要的生产工具,那么数据就是不可或缺的生产资料,巧妇难为无米之炊,数据对于视觉模型生产起到了至关重要的作用。作者:伝迹 谦言 夕陌  临在...

技术解读:现代化工具链在大规模 C++ 项目中的运用 | 龙蜥技术

2022-10-24
阅读 9 分钟
简介: 本文详细介绍我们在实际工作中的大型 C++ 项目中现代化工具链的实践以及结果。编者按:C++ 语言与编译器一直都在持续演进,出现了许多令人振奋的新特性,同时还有许多新特性在孵化阶。除此之外,还有许多小更改以提高运行效率与编程效率。本文整理自全球 C++ 及系统软件技术大会上的精彩分享,接下来由作者带我们...

从趋势到挑战,资深工程师一站式解读:操作系统运维和可观测性

2022-10-14
阅读 5 分钟
简介: 结合传统运维工具和 eBPF 技术,我们可以对整个系统的进行全栈观测。编者按:随着企业数字化转型步入深水区,设备数量增加,业务系统更加复杂,除了要保证物理硬件的稳定性和可靠性,运维目的和手段也发生了深刻变革,由龙蜥社区系统运维 SIG 组 Maintainer、统信软件资深操作系统研发工程师高冲从系统运维的趋势...

一文剖析PolarDB HTAP的列存数据压缩

2022-10-12
阅读 11 分钟
简介: PolarDB MySQL是阿里云自研的云原生数据库,主要处理在线事务负载(OLTP, OnLine Transactional Processing),深受企业用户的青睐。前言数据库迁移上云是大数据时代的一大趋势,PolarDB MySQL是阿里云自研的云原生数据库,主要处理在线事务负载(OLTP, OnLine Transactional Processing),深受企业用户的青睐。当下...

MaxCompute笛卡尔积逻辑的参数优化&复杂JOIN逻辑优化

2022-10-11
阅读 7 分钟
简介: 这篇文章主要讲一个SQL优化反映的两个优化点。分别是: 一、笛卡尔积逻辑的参数优化。 二、一个复杂JOIN逻辑的优化思路。1.  优化概述最近协助一个项目做下优化任务的工作。因为主要数据都是报表,对数对的昏天暗地的不敢随便调整SQL逻辑,所以本身只想做点参数调整,但是逼不得已后来还是改了一下SQL。这篇文章...

PolarDB-X 全局二级索引

2022-10-10
阅读 7 分钟
简介: 索引是数据库的基础组件,早在1970年代,SystemR 就已经通过增加索引来支持多维度查询。单机数据库中,索引主要按照用途和使用的数据结构分为 BTree 索引、Hash 索引、全文索引、空间索引等。通常,每张表中包含一个主键索引(Primary Index),主键索引以外的索引,统称为二级索引(Secondary Index)。背景索引是数...

手把手教你PolarDB-X中的表设计——用户表

2022-10-09
阅读 4 分钟
简介: 本系列旨在描述一个具体的业务场景,给出建表的例子,帮助大家更好的使用PolarDB-X。本期的主题是:用户表。本系列旨在描述一个具体的业务场景,给出建表的例子,帮助大家更好的使用PolarDB-X。本期的主题是:用户表。

单元测试运行原理探究

2022-10-08
阅读 17 分钟
简介: 单元测试是软件开发过程中的重要一环,好的单测可以帮助我们更早的发现问题,为系统的稳定运行提供保障。单测还是很好的说明文档,我们往往看单测用例就能够了解到作者对类的设计意图。代码重构时也离不开单测,丰富的单测用例会使我们重构代码时信心满满。虽然单测如此重要,但是一直来都不是很清楚其运行原理,...

BizWorks助力企业应用的高效开发与复用

2022-09-30
阅读 6 分钟
简介: BizWorks作为企业级云原生应用数字工作台,能很好地支撑企业数字中台建设、云原生应用开发、企业资产运营管理等场景。本文不会全面介绍BizWorks平台的能力,而是着重介绍BizWorks在实现应用高效开发与复用上提供的产品能力。企业在数字化转型过程中,为了提高效率、降低成本,追求如何快速高效地开发企业应用,以...

EasyCV带你复现更好更快的自监督算法-FastConvMAE

2022-09-30
阅读 11 分钟
简介: 近期FastConvMAE工作在EasyCV框架内首次对外开源,本文将重点介绍ConvMAE和FastConvMAE的主要工作,以及对应的代码实现,最后提供详细的教程示例如何进行FastConvMAE的预训练和下游任务的finetune。作者:  夕陌、谦言、莫申童、临在导读自监督学习(Self-Supervised Learning)利用大量无标注的数据进行表征学习...

EasyNLP玩转文本摘要(新闻标题)生成

2022-09-30
阅读 13 分钟
简介: 本⽂将提供关于PEGASUS的技术解读,以及如何在EasyNLP框架中使⽤与PEGASUS相关的文本摘要(新闻标题)生成模型。作者:王明、黄俊 导读文本生成是自然语言处理领域的一个重要研究方向,具有丰富的实际应用场景以及研究价值。其中,生成式文本摘要作为文本生成的一个重要子任务,在实际应用场景中,包括新闻标题生...

EasyNLP带你实现中英文机器阅读理解

2022-09-30
阅读 20 分钟
简介: 本⽂将提供对MacBERT模型的技术解读,以及如何在EasyNLP框架中使⽤MacBERT及其他预训练语言模型,进行中英文机器阅读理解任务的训练与预测。作者:施晨、黄俊导读机器阅读理解是自然语言处理(NLP),特别是自然语言理解(NLU)领域最重要的研究方向之一。自1977年首次被提出以来,机器阅读理解已有近50年的发展...

跨模态学习能力再升级,EasyNLP电商文图检索效果刷新SOTA

2022-09-29
阅读 17 分钟
简介: 本⽂简要介绍我们在电商下对CLIP模型的优化,以及上述模型在公开数据集上的评测结果。最后,我们介绍如何在EasyNLP框架中调用上述电商CLIP模型。作者:熊兮、欢夏、章捷、临在 导读多模态内容(例如图像、文本、语音、视频等)在互联网上的爆炸性增长推动了各种跨模态模型的研究与发展,支持了多种跨模态内容理解...

龙湖千丁基于 ACK@Edge 的云原生智慧停车系统架构实践

2022-09-29
阅读 3 分钟
简介: 结合龙湖千丁自研的新版停车云系统以及 ACK@Edge 提供的标准 Kubernetes 服务以及云边一体化协同解决方案,整体来着,边缘部署时间成本由 1 天缩短到 3 小时,将之前的手动升级方式迭代为自动 OTA 升级,升级时间由 3 小时缩短到 5 分钟,计算下来每年节约 740 人天。作者:蔡佩、刘涛 在物联网、大数据、云服务...

Fluid 助力阿里云 Serverless 容器极致提速

2022-09-29
阅读 12 分钟
简介: 本文展示了一个在 ASK 环境中运行 Fluid 的完整数据访问示例,希望能够帮助大家了解 Fluid 的使用体验、运行效果以及 Serverless 和数据密集型应用结合的更多可行性。作者:东伝 背景 数据对于当今互联网业务的重要性不言而喻,它几乎渗透到了当今这个世界的每一个角落。但单有数据是不够的,真正让数据产生价值...

App隐私合规“免费”自动化检测

2022-09-29
阅读 2 分钟
简介: App隐私合规检测提供了全面的隐私合规检测报告和专家建议,从确保形式合规(隐私政策文本合规性)及实质合规(代码层合规性)的一致性,从个人信息收集、权限使用场景、超范围采集、隐私政策、三方SDK等多个维度帮助企业和开发者提前识别App隐私合规相关风险,规避监管通报、应用下架等重大风险。一、为什么要进...

鱼传科技:函数计算,只要用上就会觉得香

2022-09-29
阅读 3 分钟
简介: 复杂交互小程序如何应对访问量激增?深圳鱼传科技有限公司是专注以精准营销和互联网生态产品运营为核心的综合互联网营销推广服务商。通过整合全网优质媒体资源,并结合智能数据模型和 AI 标签算法,向企业提供包括流量矩阵搭建运营、媒介流量采买、投放模型设计、产品营销策划、数据监控分析、效果运营等多层次服...

实战指南 | Serverless 架构下的应用开发

2022-09-28
阅读 9 分钟
简介: 基于 Serverless 架构的应用开发流程将会比基于传统架构的应用开发更简单。在 Serverless 架构下进行应用开发,用户通常只需要按照规范编写代码、构建产物,然后部署到线上即可。作者 | 刘宇、田初东、卢萌凯、王仁达 UC Berkeley认为Serverless架构的出现过程类似于40多年前从汇编语言转向高级语言的过程,在未...

什么是 Serverless 架构?

2022-09-28
阅读 8 分钟
简介: 什么是 Serverless 架构?Serverless 与 AI 机器学习之间怎样碰撞出火花? 随着时间的推移,Serverless 架构变得越来越火热,凭借着极致弹性、按量付费、低成本运维等特性,在很多领域发挥着越来越重要的作用;机器学习领域在近些年也非常火热,并在越来越多的行业中得到应用。 实际上,机器学习项目中一直存在两...