Spark整合Ray思路漫谈

2019-12-20
阅读 6 分钟
之前花了大概两到三天把Ray相关的论文,官网文档看了一遍,同时特意去找了一些中文资料看Ray当前在国内的发展情况(以及目前国内大部分人对Ray的认知程度)。

阿里风控大脑关于大数据应用的探索与实践

2019-12-18
阅读 7 分钟
以下内容根据演讲视频以及PPT整理而成。 本次分享主要围绕以下三个方面: 一、阿里风控大脑整体介绍二、近线引擎三、离线引擎 一、阿里风控大脑整体介绍 1. 阿里风控大脑是什么? 阿里的风控主要分为两大块。一块是金融领域,主要业务是支付宝,另一块是非金融领域,如新零售、高德、大文娱等,我们负责的主要是非金融领...

仅1年GitHub Star数翻倍,Flink 做了什么?

2019-12-18
阅读 7 分钟
阿里妹导读:Apache Flink 是公认的新一代开源大数据计算引擎,其流水线运行系统既可以执行批处理程序也可以执行流处理程序。目前,Flink 已成为 Apache 基金会和 GitHub 社区最为活跃的项目之一。在 Flink Forward Asia 2019 上,阿里巴巴资深技术专家,实时计算负责人王峰 (莫问)总结了 2019 年 Flink 在中国的发展和...

基于深度学习的图像分割在高德的实践

2019-12-17
阅读 5 分钟
图像分割(Image Segmentation)是计算机视觉领域中的一项重要基础技术,是图像理解中的重要一环。图像分割是将数字图像细分为多个图像子区域的过程,通过简化或改变图像的表示形式,让图像能够更加容易被理解。更简单地说,图像分割就是为数字图像中的每一个像素附加标签,使得具有相同标签的像素具有某种共同的视觉特性。

快速搭建 Serverless 在线图片处理应用

2019-12-13
阅读 3 分钟
函数计算(Function Compute):函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传。函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费。函数计算更多信息参考。ImageMagick:ImageMagick 是一个用于查看、编辑位图...

图神经网络(AliGraph)在阿里巴巴的发展与应用

2019-12-11
阅读 5 分钟
在大数据的背景下,利用高速计算机去发现数据中的规律似乎是最有效的手段。为了让机器计算的有目的性,需要将人的知识作为输入。我们先后经历了专家系统、经典机器学习、深度学习三个阶段,输入的知识由具体到抽象,由具体规则到特征再到模式,越来越宏观。相对来说,抽象的层次变高了,覆盖面变广了,但我们对底层的感...

开源 | 全球首个批流一体机器学习平台 Alink

2019-12-06
阅读 7 分钟
阿里妹导读:Flink 在机器学习领域的进展一直是众多开发者关注的焦点,今年 Flink 迎来了一个小里程碑:机器学习算法平台 Alink 开源,这也宣告了 Flink 正式切入 AI 领域。

医疗数据典型特征及架构发展方向研究

2019-12-04
阅读 3 分钟
医疗健康产业目前呈高速发展状态,处在互联网对医疗行业赋能的关键阶段,由于医疗行业数据的隐私性较强,通过传统方式很难获取公开的医疗健康数据进行研究,根据阿里云天池比赛赛题设置研究及提供的脱敏数据集着手进行分析是比较理想的手段。本文的目的在于对医院的信息系统流程进行思考,结合公开数据集对于医疗健康数...

地理文本处理技术在高德的演进(下)

2019-12-03
阅读 6 分钟
​在【上篇】里,我们介绍了地理文本处理技术在高德的整体演进,选取了几个通用query分析的点进行了介绍。下篇中,我们会选取几个地图搜索文本处理中特有的文本分析技术做出分析,包括城市分析,wherewhat分析,路径规划,并对未来做一下展望。

高德JS依赖分析工程及关键原理

2019-12-02
阅读 5 分钟
高德 App 进行 Bundle 化后,由于业务的复杂性,Bundle 的数量非常多。而这带来了一个新的问题——Bundle 之间的依赖关系错综复杂,需要进行管控,使 Bundle 之间的依赖保持在架构设计之下。

开放下载!从RCNN到SSD,这应该是最全的一份目标检测算法盘点

2019-11-29
阅读 3 分钟
导读:从简单的图像分类到3D姿势识别,计算机视觉从来不缺乏有趣的问题和挑战。通过肉眼我们可以检测出一张宠物照中的猫和狗,可以识别出梵高作品《星夜》中的星星和月亮,那如何通过算法赋予机器“看”的智能,就是我们接下来要讲的。

2684亿销售额背后的阿里AI技术

2019-11-25
阅读 5 分钟
大家好,我是林伟,我今天演讲的主题是《AI 突破无限可能—5 亿消费者的云上双 11》。我本人是做系统出身的,但在最近的一些会议上发现,越来越多做系统出身的人开始研究 AI。在 90 年代末的那波热潮里,我有幸在学校的人工智能实验室呆过,那时还在纠结模型效果,最后发现是自己想多了,那时做出来的东西还远远达不到可...

端智能揭秘|促使双十一GMV大幅提升,手淘用了什么秘密武器?

2019-11-22
阅读 5 分钟
导读:信息流作为手淘的一大流量入口,对手淘的浏览效率转化和流量分发起到至关重要的作用。在探索如何给用户推荐其喜欢的商品这条路上,我们首次将端计算大规模应用在手淘客户端,通过端侧丰富的用户特征数据和触发点,利用机器学习和深度神经网络,在端侧持续感知用户意图,抓住用户转瞬即逝的兴趣点,并给予用户及时...

给 AI 讲故事,如何教它脑补画面?

2019-11-19
阅读 6 分钟
阿里妹导读:视觉想象力是人与生俱来的, AI 能否拥有类似的能力呢?比如:给出一段故事情节,如何让机器展开它的想象力,“脑补”出画面呢?看看阿里AI Labs 感知实验室的同学们如何解决这个问题。

解密双十一小程序云背后毫秒级伸缩的Serverless计算平台:函数计算

2019-11-19
阅读 3 分钟
自2017年第一批小程序上线以来,越来越多的移动端应用以小程序的形式呈现。小程序拥有触手可及、用完即走的优点,这大大减少了用户的使用负担,使小程序得到了广泛的传播。在阿里小程序也被广泛地应用在淘宝/支付宝/钉钉/高德等平台上,例如今年双11大家在淘宝/天猫上参加的活动,大部分都是通过小程序提供的。

写1行代码影响1000000000人,这是个什么项目?

2019-11-18
阅读 4 分钟
不带钱不带卡,只带手机出门就能畅行无阻,这已是生活的常态。益普索发布的《2019第一季度第三方移动支付用户研究》报告显示,移动支付在手机网民中的渗透率高达95.1%,截至今年1月,支付宝全球用户数已经突破10亿。你或许每天都会打开支付宝,付款购物、领取权益、享受服务……但你或许不知道的是,在这个方便、快捷、智...

达摩院最新AI技术助力天猫双11,提供接近真人的语音交互体验

2019-11-11
阅读 1 分钟
11月8日,记者了解到,阿里巴巴达摩院机器智能实验室最新研究成果——KAN-TTS将首次大规模应用于今年天猫双11,基于该技术,菜鸟热线机器人、语音机器人小蜜以及天猫精灵将为全球消费者提供接近真人的语音交互体验。

阿里工程师太凶残了,竟把服务器泡在“水里”!

2019-11-07
阅读 2 分钟
万众瞩目的第11个双11要来了!这次天猫说要帮大家省500亿,身边加购物车、组队盖楼的同学数不胜数,热闹非凡。 但在阿里,有一位低调的“高冷男”,丝毫不为红红火火的双11所动,依然稳如磐石、淡定自若。 他的名字就叫做“全浸没液冷服务器”,简直“冷”到令人发指。 15秒视频,一起来详细了解。 ↓↓ 视频链接:[链接] 原来,...

AI赋能DevOps:数据驱动的全栈工程师实践

2019-11-05
阅读 9 分钟
对于传统的软件研发而言,开发,测试,运维,运营,有不同的岗位进行分工协作,以保证质量和专业度,同一件事情,依赖不同岗位的排期、沟通、协调,效率难免会有打折。而对于互联网业务来说,快速的迭代,对人力的需求非常强烈,不大可能有足够的人力支撑这么多岗位。同时跨部门的沟通,强烈影响了项目的进度,因此一些...

哪些技术好书值得一读再读?阿里大牛列了一份经典书单

2019-11-04
阅读 4 分钟
喜爱读书,就等于把生活中寂寞无聊的时光换成巨大的享受时刻。有了书,各个领域的智慧,几乎触手可及。我们能有幸站在前辈、巨人的肩膀上,看更远的风景。这些经典的技术好书,由阿里九位技术大牛为你倾情推荐,与你一起共同成长、探索未来。

深度 | 打败围棋冠军后,机器智能下一步能战胜黑客吗?

2019-10-30
阅读 10 分钟
阿里妹导读:从深蓝战胜象棋冠军到AlphaGo战胜围棋冠军,每一次机器智能在特定领域战胜人类,都会引发整个社会的广泛关注。洞察了棋类博弈真相的机器智能,接下来能洞察网络安全的真相并且在黑客博弈中战胜人类吗?在机器智能炙手可热的今天,或许我们该静下心来,去理解机器智能的本质、网络安全的困境以及未来二者结合...

深度 | 带领国产数据库走向世界,POLARDB底层逻辑是什么?

2019-10-28
阅读 8 分钟
阿里妹导读:在刚刚结束的乌镇世界互联网大会上,阿里云自主研发的POLARDB云原生数据库当选世界互联网领先科技成果,凭实力站上C位。这个”包管“了北京市每天800万人次的公交出行的下一代分布式数据库到底有多强大?我们请阿里云智能数据库事业部总经理鸣嵩跟大家一起聊聊。

码农节快乐|一个系统,高效解决复杂事件采集-计算-实时触达

2019-10-25
阅读 4 分钟
昨天是1024,一个特别的数字,比如某网站内容的解压密码通常都是1024,想求一个种子留言也是1024。1024是属于广大程序猿(又称码农)的节日,在这样一个节日里,各种“黑”程序猿的新老段子将纷纷出现在各大媒体网站。为什么程序猿属于经常被黑的一个群体?凌乱的发型、黑框眼镜、双肩包、格子衫、牛仔裤、运动鞋、钱多话...

高德地图首席科学家任小枫:视觉智能在高德地图的应用

2019-10-17
阅读 5 分钟
2019杭州云栖大会上,高德地图技术团队向与会者分享了包括视觉与机器智能、路线规划、场景化/精细化定位、时空数据应用、亿级流量架构演进等多个出行技术领域的热门话题。现场火爆,听众反响强烈。我们把其中的优秀演讲内容整理成文并陆续发布出来,本文为其中一篇。

如何优化大规模推荐?下一代算法技术JTM来了

2019-10-10
阅读 8 分钟
阿里妹导读:搜索,推荐和广告是互联网内容提供商进行价值创造的核心业务,在阿里巴巴的电子商务交易平台上,搜索,推荐和广告业务同样具有举足轻重的意义和价值。现在,阿里推荐技术又双叒优化了,新的推荐技术,新的体验,一起来看。

藏不住了,这就是阿里 AI 的真正实力!

2019-09-27
阅读 3 分钟
不好意思,我要放大招了! 在今天的杭州云栖大会上,阿里巴巴首次公布人工智能调用规模: 每天调用超 1万亿 次服务全球 10亿 人日处理图像 10亿 张视频 120万 小时语音 55万 小时自然语言 5千亿 句 在AI芯片、AI云服务、AI算法、AI平台、产业AI,阿里巴巴实现全线领先! 有才的网友还帮我们做了一张图 666 ↓↓ 在AI芯片层...

云原生时代|分布式系统设计知识图谱(内含22个知识点)

2019-09-27
阅读 4 分钟
我们身处于一个充斥着分布式系统解决方案的计算机时代,无论是支付宝、微信这样顶级流量产品、还是区块链、IOT等热门概念、抑或如火如荼的容器生态技术如Kubernetes,其背后的技术架构核心都离不开分布式系统。

蚂蚁金服开放计算架构:下一代金融级计算架构

2019-09-26
阅读 2 分钟
当前互联网技术早已进入了大数据、人工智能的阶段,各种计算模式,计算引擎层出不穷。从10年前的MapReduce分布式计算开始,几乎每三年就会出现一次新的计算引擎更迭,从开山鼻祖的Hadoop,到后来流式计算的Storm,之后出现了基于内存迭代计算的Spark红极一时,然后到今天Flink又以迅雷不及掩耳之势走入大家的视野。同时...

当 K8s 集群达到万级规模,阿里巴巴如何解决系统各组件性能问题?

2019-09-24
阅读 8 分钟
本文主要介绍阿里巴巴在大规模生产环境中落地 Kubernetes 的过程中,在集群规模上遇到的典型问题以及对应的解决方案,内容包含对 etcd、kube-apiserver、kube-controller 的若干性能及稳定性增强,这些关键的增强是阿里巴巴内部上万节点的 Kubernetes 集群能够平稳支撑 2019 年天猫 618 大促的关键所在。

常用排序算法总结

2019-09-17
阅读 7 分钟
在计算器科学与数学中,一个排序算法(英语:Sorting algorithm)是一种能将一串数据依照特定排序方式进行排列的一种算法。本文将总结几类常用的排序算法,包括冒泡排序、选择排序、插入排序、快速排序和归并排序,分别使用Java代码实现,简要使用图例方式介绍其实现原理。