阿里云EdgePlus

阿里云EdgePlus 查看完整档案

杭州编辑  |  填写毕业院校阿里云  |  边缘计算 云通信 编辑 edgeplus.com 编辑
编辑
_ | |__ _ _ __ _ | '_ \| | | |/ _` | | |_) | |_| | (_| | |_.__/ \__,_|\__, | |___/ 个人简介什么都没有

个人动态

阿里云EdgePlus 发布了文章 · 3月16日

云通信产品专家翅飞:企业如何提升用户全生命周期管理效率?号码百科来帮忙

企业在对用户提供服务的过程中,会碰到很多的问题。从用户注册&登录开始,到风险控制、价值挖掘、追溯流失等,各个阶段都会面临各种各样的问题。从企业的宣传推广,到最终用户的注册转化,是一个漏斗逐步筛选的过程。因此,在用户注册阶段,如何降低用户的注册门槛,尽量减少用户在注册过程中碰到的各种意外情况。如何提升注册成功率?是企业特别关心的话题。在阿里云2021上云采购季直播中,阿里云通信产品专家翅飞进行了《深度挖掘用户价值,助力企业实现用户全生命周期管理》主题分享,为企业的上述问题提供了全新的解决思路。

直播3.png

当下,无论哪个行业的企业,拉新用户成本都是相对较高的。企在用户生命周期管理中常见的问题有很多,比如:有些粗心的用户,不小心把手机号填错了,导致收不到验证码。企业是否可以主动发现并提醒?再比如:用户的手机号近期做了携号转网,导致短信服务商给客户发的验证码短信接收不到,从而无法完成注册等问题。

而当用户注册完成后,还只是万里长征走完了第一步。这些注册的用户,是否是企业希望带来的用户?是否跟企业经营的预期目标一致?在持续服务用户的过程中,是否可以给用户提供最好的体验、最流畅的服务?对于可能流失的用户,是否可以最大程度的主动发现,并最大程度的挽回?相信这些问题,是所有企业都共同关心的话题。

屏幕快照 2021-03-10 下午8.33.27.png

为了帮助企业解决上述问题,阿里云通信推出了号码百科产品。试图从用户注册的手机号码维度,来解决企业在给不同阶段的用户提供服务时碰到的不同问题。

号码百科的产品定位,是基于手机号属性维度的产品形态。因此,号码百科产品其实是一系列产品能力的集合。对于号码不同维度的属性,会分别由不同的子产品能力来实现。比如:

  • 号码状态能力,主要的展现属性就是号码的实时状态属性,可以查询出某个时刻的号码状态,是空号?还是停机?或者是关机等;二次号能力,主要的展现属性,就是这个号码是否属于运营商二次放号的号码;
  • 号码归属能力,则主要是体现一个号码,它对应归属的省份和城市、以及归属的基础运营商。如果一个号码有办理携号转网业务,那么就可以查到携转后的运营商归属;
  • 视频彩铃能力,则是一个号码订购的视频播放属性,当订购了视频彩铃的手机号作为被叫号码时,主叫用户则可以看到被叫用户设置的视频彩铃。

屏幕快照 2021-03-10 下午8.33.39.png

在未来,阿里云通信还会逐步丰富更多基于号码属性的子产品。欢迎大家加入阿里云通信官方交流钉钉群(钉群号:33968186),提出新的需求,与产品经理进行交流。

号码百科产品功能形态与应用场景

一、号码状态

号码状态主要是通过运营商的信令技术,实时检测某个号码当前所处的状态情况。比如停机、空号等。这个检测的技术和传统的拨测所有区别,传统拨测的过程中,被检测的号码有时候会出现响铃的情况。并且拨测的等待时长也比较高。产品使用的体验不是很好。另外,由于不同省份回铃音的播放内容不同,也很难判断一个号码的实际状态是什么。而通过信令检测技术,则很好的避免了上述问题。

通过这样的方式,可以快速的检测出一个号码的状态是否是无效的。这给一部分外呼型的企业,提供了非常高效的工具。因为外呼的人力成本是非常高的,在外呼前,将这部分无效的号码做过滤,以提升外呼人员的呼叫效率。

屏幕快照 2021-03-10 下午8.55.21.png

另外,对于一些有用户拉新诉求的企业。从各个不同的渠道拉新回来的用户中。曾经发生过注册的时候,用户号码是正常。但注册完没多久,这个号码就会成为空号的情况。通过用户注册后的状态检查,可以有效的识别这部分虚假拉新的用户,帮助企业提升拉新用户的准确率和效率。

还有一部分用户,注册的时候,会不小心把自己的号码填错。所以企业经常会发现自己注册用户的验证码,会发给一些空号,就是这个原因。因此,我们建议当用户填写完自己的手机号码后,针对用户填写的号码做一下实时的检测。如果发现号码是空号,则在注册界面,给予用户适当的提醒。尽可能将这一部分用户转化成有效用户。以帮助企业提升注册用户的转化率。

二、二次号

二次号是用于查询一个号码是否是运营商二次放号的号码。我们知道,当一个消费者注销自己的手机号码后,运营商会将该号码做冷冻处理。在冷冻一段时间后,会把这个号码重新放出来,供其他用户使用。而在这个过程中,前一个号码的主人,之前可能注册了某个平台的账号,而注销号码前,又忘记在该平台做同步注销。那么当这个号码的新主人在该平台注册时,就会出现无法注册的情况。此时,对用户来说,体验是比较差的。此时,如果新用户选择使用手机号找回密码,则对该平台而言,新用户相当于就看到了老用户在该平台的产生的相关数据。如果老用户在该平台还留有资金相关的权益,则这部分资金就存在被盗用的风险。

因此,对于每一个新注册的用户,如果平台发现这个用户已经注册过,而又试图重新注册时,就应该启动相应的检测流程。以避免上述问题。

三、号码归属

近些年,在工信部的大力推动下。运营商之间逐步实现了携号转网的服务能力。对广大消费者而言,可以在不改变自己手机号码的前提下,选择自己喜欢的运营商来给自己提供通信服务。不过由于各个平台、企业,在用户注册时,都需要通过增值电信企业提供短信验证码、语音验证码的能力。而这些增值电信企业,则需要准确的知道每个手机号当前归属于哪个运营商管辖,从而将企业的验证码发送给对应的管辖的运营商,来完成验证码的发送。在这个过程中,对于增值电信企业而言,如果将A运营商的号码,发给B运营商的通道,则会导致下发失败。自然在这个过程中,用户的验证码接受就会出现问题。这样一来,用户的体验变差,企业注册用户流失;增值电信企业也没办法提供更好的服务。因此,对于增值电信企业而言。在每条短信发送前,先查询该短信归属的运营商就是一件非常有必要的事情。

屏幕快照 2021-03-10 下午8.56.48.png

同样的道理,提供短信充值的平台。也面临类似的问题。因此,建议当用户输入自己的手机号进行话费充值时,也需要先查询对应的运营商,然后再调用相关运营商的接口,来完成对用户的充值服务。

另外,还有这样一类传统的企业,使用号码归属能力,检测商品是否存在窜货问题。比如,某手机公司,禁止手机跨地区销售。那通过什么样的方式来发现经销商窜货呢?其实就是通过该手机注册的手机号码归属地来判断。比如,发现某个广东地区经销商销售的手机,产品激活后,对应的手机号都属于山东地区的号码,或者广东地区的手机号占比未达到指定的比例。则该经销商就存在窜货的嫌疑。同样的道理,如果一个公司目前主要运营的用户和业务在湖北地区,但是通过某渠道拉新带来的用户手机号归属,都在湖南地区。那么也说明该渠道存在虚假作弊的嫌疑。

目前,携号转网的用户已达到千万级别。且每天都有大量新的数据更新。因此,号码归属查询商品的及时性和权威性,就显得非常重要。

四、视频彩铃

视频彩铃是基于VoLTE技术的一种新兴通信交互方式,该产品可以为主叫用户展示一段短视频的回铃音业务。视频彩铃用户可自行选择设定个性化的短视频,可以是搞笑视频,也可以是商务宣传,当其作为被叫时,在电话接通前,主叫用户将看到这段短视频。阿里云的视频彩铃服务覆盖了国内三大运营商。产品针对通话渠道可以做到强覆盖、观看免客户端免流量,因此触达率非常高,投放的彩铃内容也是高清的。所以,视频彩铃可有效针对客户进行私域流量转化,准确高效的触达用户。

屏幕快照 2021-03-10 下午8.34.16.png

视频彩铃有如下典型使用场景:

信息流场景(UC),在这个场景下,用户通过浏览器看到感兴趣的内容,拨打号码是可直接看到相关的宣传内容,提高客户对于宣传产品认知,提高广告转化率。

大文娱场景,典型案例包括淘票票、大麦,当客户对电影演出认可时,通过投放电影的短视频宣传片,可以形成热点传播效应,提升宣发效率。

新零售场景,例如天猫校园点、银泰喵街。通过视频彩铃可以宣传统一形象,为品牌升级背书。

地产场景,可以通过阿里云地产文旅客户渗透,为客户的形象宣传、商务合作、对外公关提供新途径。

销售场景,通过视频彩铃发布商品信息,可以吸引客户,或者作为销售人员个人名片,拉近客户距离。

客服场景,可以通过视频实现提升用户第一专业服务映像,提高用户服务满意度。

举个详细的电商场景示例,以其中的广告优惠券为例,当用户A领取优惠券时,需授权品牌方代言视频彩铃,这时候,朋友B拨打A的电话就会看到该品牌的视频彩铃。同样的,在通话结束后朋友B会手到挂机短信,通过挂机短信可以点击唤起手淘完成购买,完成流量转化的闭环。

屏幕快照 2021-03-10 下午8.34.35.png

除了上述场景,视频彩铃作为一个新的内容交互方式,所能提供的业务场景是丰富多彩的。无论是阿里巴巴集团的UC、淘票票、喵街,还是云上客户所在的环保、车辆汽配、地产等服务行业,亦或是面向销售、客服团体的企业赋能,视频彩铃都是一个良好的选择。通过视频彩铃的投放,企业可以快速触达用户,在通信中发现新商机。

欢迎加入云通信官方交流钉钉群(钉群号:33968186),欢迎大家给出各种意见和建议,云通信将认真听取每个用户的声音。以改进产品为客户提供更好的服务。

云通信采购季钜惠狂欢,爆款产品低至7.2折,短信低至0.034元/条,惠不可失,点击下方阅读原文进入分会场查看直播详情与观看更多直播回放。

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 3月8日

女神营业!云通信产品运营带你玩转号码隐私保护:网约车、外卖等O2O行业的最佳实践

大家都知道,用户的号码隐私已经成为了社会和企业共同关注的话题,尤其是在网约车、外卖等O2O行业中,用户号码的频繁使用,如何规避泄露风险呢?今天,阿里云通信产品运营胡杨将带大家一探“号码隐私保护”的究竟。

直播1.png

号码隐私保护是什么

号码隐私保护(Phone Number Protection)是一款基于运营商通信网络能力的软件产品,企业用户根据其不同的业务场景,可以为用户或员工在不插入SIM的情况下,增加隐私号码,使其既能享受优质的通话和短信等服务,又能隐藏真实号码,显示为隐私号码,保护个人及企业数据安全,同时可通过话单、录音等留存通信数据,进行业务分析及安全管控。

通俗一点讲,一个AXB绑定在饿了么送餐场景,用户手机号码为A,骑手手机号码为B,A号码呼叫X号码,B号码振铃显号为X,B号码呼叫X号码,A号码振铃来电显示为X。

号码隐私保护的应用场景

号码隐私保护通常应用于O2O场景,可以分两类。其中订单型场景中最典型的是网约车、外卖、旅游、家政、美甲等场景,基于订单,形成确定的用户与服务人员的绑定关系,在订单有效期内,双方通过隐私号进行通话、短信等联系。

可以解决企业以下问题:
1、消费者手机号码数据隐私保护
2、业务数据留存
3、服务质量考核及纠纷处理
4、防跳单,企业消费者资产保护

第二个O2O典型场景是营销型场景,比如房产交易、汽车交易、金融服务等。营销过程分为线索呼入和线索回访两个部分,如下图:

屏幕快照 2021-03-04 上午11.51.39.png

线索呼入:企业通过头部流量入口、垂直媒体、新媒体等投放营销广告,平台可以通过AXN的绑定关系将咨询电话与隐私号码进行绑定,用户来电,通过AXN的绑定关系进行咨询,形成有效线索;同时,平台保留话单、录音等数据,统计有效线索,从而优化营销线索投策略及服务质量。

线索回访:线索流转到线下服务企业,企业将线索分发到电话坐席或基于LBS的定位分发给门店的销售人员,销售线索就是企业的核心消费者资产,属于企业核心数据,是企业用营销费用真金白银收到的,企业要求对线索进行加密以防止业务人员离职造成企业核心资产泄漏,为此可以使用号码隐私保护产品对外呼号码进行隐藏同时通过手机号码外显能提高外呼电话的接通率进而提高营销转化率,并能兼顾客户回呼等功能。再通过话单、录音等数据分析提高业务人员的话术、销售过程管理等,是CRM软件优化过程管理的数据源,同时也是衡量销售阶段工作考核的数据存证。

号码隐私保护产品实现原理

拿外卖送餐场景举例,业务逻辑分为用户层、客户平台、阿里云、运营商四个层面。当用户在外卖平台下单后,该用户和接单的骑手之间的电话号码已经是确定,阿里云通信平台建立AXB的绑定关系并送达到运营商移动网络上,这时用户或骑手发起主叫,阿里云通信通过路识别并形成呼转,当电话结束后将返回话单及录音给企业。

屏幕快照 2021-03-04 上午11.51.54.png

企业需要做的动作:
•购买号码
•建立绑定关系
•通话及短信等
•获取话单及录音

号码隐私保护产品介绍

不同客户的业务根据其使用功能的要求可以选配不同的绑定方案,常见的方案有以下几个:

屏幕快照 2021-03-04 上午11.52.05.png

阿里云号码隐私保护的优势

虚商牌照:拥有阿里云通信和优酷两张虚商牌照,联通、电信、移动三网虚商号码
多平台容灾:三网多平台互为主备资源,协同保障业务连续性
号码资源丰富:移动和联通运营商号码、三网虚商共五种号码资源,覆盖360+地市,待售号码数量40w+
资源隔离:号池隔离、号码隔离,无二次放号
规模大:行业领跑者,包括外卖、网约车、物流等行业,客户数量5000+
智能服务:达摩院AI技术加持,能提供包括应答机器人、质检、金牌话术、话务小结、话术评分等增值服务
易接入:丰富API及成熟SDK极大降低接入成本,最快2小时可完成全部流程
优服务:专属钉钉群7*24服务响应,为客户业务保驾护航

号码隐私保护的增值解决方案

除了基础通信能力外,阿里云通信也通过与阿里云其他产品合作搭建解决方案,为客户提供一站式服务,包括:
1、录音,MP3 双声道 8K 16bit录音文件,14天免费存储
2、短信,短信截取、智能短信、短信转发
3、ASR转译,将录音文件转译为文本,便于做结构化数据处理和管理,用于后期的NLU加工
4、NLU实现功能,在ASR文本的基础上,做自然语言理解,实现质检、防跳单、话术评分、话务小结、对话机器人、金牌话术等功能
5、号码标记,业务长期使用的号码通过号码标记建立用户心智、提高接通率
6、AX模式,A路为固话,通过SIP的强大能力提高隐私号解决方案的灵活性,通过外显手机号码X,提高接通率

【锦鲤福利】在2021采购季中,阿里云通信为客户提供免费试用邀约:智能状态码。智能状态码是应用于未接通电话归因场景,可以精准识别未接通电话的“空、关、停、忙”等状态,辅助企业业务进行用户分析。

号码隐私保护接入流程

号码隐私保护服务的接入流程非常简单:开通阿里云账号完成实名认证,获取阿里云访问密钥,然后开通号码隐私保护服务,再进行功能对接即可完成。由于隐私号是工信部严管资源,为了保障平台的业务稳定性,阿里云通信对介入客户的业务场景进行审核和管理,首次开通用户需要提交工单报备信息。

欢迎有兴趣的用户加入云通信用户咨询群,与我们共同探讨号码隐私保护的新方案,为业务做更好的服务和支撑。

阿里云通信官方交流群,搜索钉群号:33968186入群~

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 3月3日

产品更新 | 阿里云CDN边缘图像处理功能开放内测

在当下的网络环境中,企业在进行图片内容分发时,需要更快捷、高效地进行图片转换,以此适配各终端屏幕的分辨率、图片格式以及用户所处的网络环境,来提升展示效果。与此同时,海量的高质量图片往往会消耗较多的带宽,企业也需要在成本和质量中间找到最佳平衡点。

为了更好地服务企业客户,阿里云CDN「边缘图片处理」功能结合不同的客户端、网络环境、图片规格,在边缘节点为客户交付最优的图像管理能力,帮助客户降低图片的衍生管理难度,提升终端用户的图片访问效果和效率,提供最佳的互联网访问体验。

本文将为你揭示「边缘图像处理」的价值、应用及如何申请。

这样的你 需要边缘图像处理

你是否面临以下痛点:

  • 用户多终端,统一图片对要求多个尺寸满足不同终端访问需求;
  • 网络环境差异大,正常网络下可以正常打开的图片,在弱网环境下耗时长或无法访问;
  • 不同浏览器或系统对图片格式支持的友好度不一致,对图片格式的要求灵活;
  • 同一张图片会产生多个衍生图,人工处理图片时效慢,管理成本高,产生的衍生图存储和计算成本也高。

你是否有以下诉求:

  • 提升图片加载的效率,提升终端客户访问的效率,降低大量衍生图片的运维管理成本;
  • 对图片缩放、图片剪裁、自适应网络环境和终端、旋转、格式转换、水印有高频需求。

与目前市场上解决方案的对比:

  • CDN携带转换参数在源站进行转换,转换后图片返回到CDN再分发给用户。这种做法会比较消耗源站的计算资源,在图片处理并发高峰时期,会抢占源站的计算能力,甚至出现过载的情况;
  • 提前转好目标图片并存在源站,对应不同的请求url。这种做法比较浪费源站存储,并且访问率低的目标图片也需要提前转好。

边缘图像处理  改进体验即刻启动

阿里云CDN服务全球数十万客户,客户源站种类多样化且部分源站不具备图片转换能力。「边缘图像处理」是在CDN节点上进行图片的优化管理,其支持的图片相关操作有:缩放、裁剪、质量转换、格式转换、旋转、锐化、亮度、对比度、水印等,能够为电商、旅游、音乐、金融、媒体和游戏等行业,提供快速、便捷、高质量的互联网图片加速体验,降低开发与存储成本。

边缘图像处理的功能优势:

  • 更快的分发体验

原图在回源节点被缓存后,边缘触发的多尺寸图片访问需求,直接在回源节点进行图片的处理和分发,减少回源链路,可以更快到达边缘,减少整体请求时间,提升响应效率。

  • 更快的页面加载

图片在CDN进行处理并返回客户端进行访问时,可以在不影响客户观看的体验前提下,进行图片的缩放压缩等操作,缩小图片大小从而使页面打开的速度更快,体验更好。

  • 降低源站压力与成本

衍生图大量消耗源站的存储和计算能力,增加了源站的开发和维护成本。通过CDN进行图片处理,所有的图片处理和缓存都通过CDN节点完成,源站无感知,从而达到为源站节省存储空间,降低转换计算成本的目的。

  • 提升刷新预热效率

原图刷新并失效后,原图对应的衍生图也会全部失效且无法访问,无需再对衍生图进行刷新,降低提交刷新预热的次数,同时节省回源所产生的带宽。

  • 边缘需求定制

通过图片处理参数对图片处理进行控制,可以根据不同的浏览器和客户端版本定制不同的图片处理需求,满足不同客户不同场景下的业务需求。

边缘图像处理的方法:

阿里云CDN支持边缘图片处理,处理的类型以参数形式传入,请求参数为image_process。同时支持多个转换参数,例如crop、rotate等,多个转换参数以正斜线(/)分隔。

处理方法:image_process=action1,param_value1/action2,param_value2。

操作示例:image_process=resize,l_200/quality,q_90/format,webp。

边缘图像处理 内测开放

目前边缘图像处理功能处于内测阶段,您需提交工单申请开通。

关注阿里云Edge Plus微信公众号,回复「图像处理」,获取内测入口。

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 2月2日

阿里云发布CDN产品最佳实践图 全面解析行业应用

2月2日,阿里云发布CDN产品最佳实践图。该图是站在客户视角,基于阿里云CDN多年服务阿里巴巴生态以及数十万家云上企业客户的需求剖析与实战经验,将客户使用CDN的实践路径分解为便捷式扩展、一站式分发和多样化管理三个阶段,旨在帮助客户找到和部署最适合自己的CDN实践之路。

在本次发布的CDN产品最佳实践图之中,阿里云为不同阶段的客户立体化地介绍了CDN的典型使用场景和核心产品技术能力。其中,面向初创企业与个人开发者,阿里云CDN聚焦于大文件分发、动静态混合加速、非标准协议传输、可编程计算、全链路IPv6等场景,协同云产品(ECS、SLB、OSS、SLS等服务)进行云边端能力打通,帮助客户实现便捷式扩展。面向行业客户,阿里云CDN通过丰富的行业应用实践经验,沉淀了面向应用商店下载、政企网站可信加速、电商活动抢购、在线教育课堂、金融安全、社交互动、游戏加速、多媒体视频等不同行业场景下的CDN分发解决方案。基于流量计算智能调度、分布式缓存架构、智能链路系统和数据智能业务支撑四大核心系统,在内容防篡改与安全管理、千万级高并发低延时直播技术、完善的实时性能监控与数据科学决策、边缘安全+云的立体防护等能力加持下,帮助客户解决高并发压力、用户访问体验不佳与内容传输安全风险等问题。

在互联网视频持续爆发的背景之下,通常互联网企业一年会面临数次的“尖峰时刻”,比如春晚。面向此类客户需求,阿里云CDN结合阿里巴巴集团生态,沉淀出一套面向双 11 抢购、春晚红包、强互动直播、大型直播场景的丰富客户实践案例,帮助客户从容应对复杂应用场景流量洪峰。阿里云CDN不仅在技术和产品模式上进行创新,同时匹配具体客户应用场景,依托边缘Serverless可编程计算、全球实时传输网络(GRTN)、精准高效的智能数据科学决策体系等,不断迭代产品服务,为海量用户访问之下,企业的系统平稳运行、流畅访问体验提供强大助力。

大图-微信二维码版.png

阿里云CDN产品经理王斌斌表示:“我们在互联网络边缘构建了一张实时可计算的新型CDN分发网来承载客户业务,阿里云CDN产品 90% 的创新源于客户需求,CDN产品最佳实践是站在客户视角,服务全球数十万云上企业客户、以及服务阿里巴巴经济体大规模复杂应用场景的实战经验沉淀。”

深耕服务 为全球数十万企业客户提供值得信赖的CDN服务

阿里云CDN起源于淘宝CDN,自2009年开始便伴随双11逐步成长,为流量巨大的电商网站提供加速支持,在全球建立了上百个优质节点和带宽资源,起初在电商领域得到了很多的应用和实践。

2011年,CDN作为互联网流量分发基础设施,逐步从服务淘宝电商,扩展到全面服务阿里集团生态,在应用场景上外延。2014年,阿里云CDN正式宣布对外商业化,将服务能力开放给全球企业及创业者使用。2015年,阿里云CDN与电商携手迈进全站HTTPS时代,并不断进行自研调度系统的迭代升级以应对指数增长的流量冲击。

伴随着每年双十一以及移动互联网、视频的普及,CDN的流量呈现指数级增长。2017年,阿里云CDN开启全球化战略,并陆续发布SDCN、DCDN等产品,产品矩阵全面升级。2018年初,由Gartner发布的全球CDN服务市场指南《Market Guide for CDN Services》中,阿里云凭借全球服务能力和产品技术优势定为Global(全球级)服务商。

近几年,阿里云CDN围绕“智能化”和“可计算”不断进行产品技术深耕,在边缘Serverless、多维Workload负载均衡、科学决策、各类边缘应用场景服务上持续打磨。与此同时,阿里云CDN凭借更高效率的产品服务与优质的服务体验赢得客户信赖,在CDN领域体量不断扩大,发展迅猛,CDN的峰值流量规模屡创新高。截止目前,阿里云CDN在全球有2800+边缘节点,130T带宽储备,服务全球数十万企业客户,为超百万域名提供加速服务。阿里云CDN打造的一张连接全球终端用户的边缘生态网络,在晚高峰期间每秒处理上亿QPS的用户连接请求,每天将客户数十亿次配置管理指令下发到全网所有节点。

千锤百炼 面向行业打造全面、专业的CDN产品最佳实践

依托数十万云上企业客户和阿里巴巴丰富的生态应用,以及全球覆盖的基础设施网络,阿里云CDN在文娱、电商、游戏、体育、金融、政企等众多行业拥有丰富的产品实践。

2018年俄罗斯世界杯,阿里云CDN承载全网70%的流量,支撑了优酷单场 2400万人次在线观看。2019年双11,阿里云CDN为5144万的观众带来了4K、低于2%卡顿率的极致观看体验,同时力扛了数千万QPS流量洪峰下的电商交互体验。2020年上半年,疫情当下,互联网流量爆发式增长,阿里云CDN为钉钉视频会议、国家中小学网络云平台、VIPKID等在线办公与教学业务保驾护航,完美支持了低卡顿、秒开流畅以及实时互动的在观看体验,全程护航数亿人的“停课不停学、停工不停业”,开启了在线实时视频互动时代。

在后疫情时代数字化转型加速的背景之下,为了帮助金融、传媒、政企等行业客户抵御网络攻击风险,确保在线业务的高可用性与安全合规,阿里云CDN结合在政务云、金融云上的丰富实践经验,量身定制“政企安全加速解决方案”。央视网等广电传媒企业借助阿里云CDN多种传输链路加密模式,确保全链路内容防劫持防篡改,基于内容安全与加密技术提升版权视频节目在传输和播放链路中的安全系数。

除此之外,阿里云CDN凭借性能卓越的产品服务、视频核心技术优势与多年沉淀的丰富经验,成功保障了跨年晚会、春晚直播、亚运会、英雄联盟全球总决赛、CBA职业联赛、2020年世界人工智能大会、历年双11猫晚等多项重大事件的互联网直播。

多年的的技术奠定了阿里云CDN在一次次“考验”之下成为中流砥柱。当下,在5G、IoT技术以及数字化转型的背景之下,CDN将从内容分发将演变为价值传递,成为企业提升效率、优化经营、智能应用的强大驱动力。此次CDN产品最佳实践大图的重磅发布,将成为千百万企业传递内容与价值的最佳辅助,推动更多新兴行业场景的创新发展。

在线开讲 助你快速找到最适合的CDN应用之路

为了帮助客户更全面了解CDN产品最佳实践,更便捷、省心地使用CDN,阿里云CDN产品经理和产品架构师将围绕CDN行业最佳实践进行全面解析,为您2021开年的企业数字化升级之路加速!欢迎关注“阿里云Edge Plus”官方公众号,回复“CDN实践图”,获取直播报名链接。

直播报名海报.png

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 2月1日

云话题 | 第3期 你女朋友在买买买时,程序员小哥在干嘛?

年货节来了,你女朋友下单了吗?

观看直播已经成为人们日常上网的习惯之一,直播购物作为其中的重要项目,销售额屡创新高。最近,天猫年货节刚刚开幕,淘宝直播中就涌入了不少的用户前来抢购,毕竟足不出户就可以买到全国甚至全球的年货,对热衷买买买的消费者们来说实在太方便了。

那么,直播抢购背后到底蕴藏着哪些技术?平台在开发网络直播系统时为什么如此看重CDN?在高并发直播的当下,CDN的技术人员都需要关注什么?阿里云Edge Plus的第3期云话题,边缘酱将为你讲讲关于直播抢购与CDN的那些事。

你关心的,就是云话题
接下来进入正题

云话题 | 第3期 关于直播抢购与CDN的那些事

特邀专家:卢日 阿里云高级技术专家,GRTN网络总设计和布道师,目前负责阿里云视频直播产品和流媒体实时加速平台研发。

一、互联网直播最关键的技术指标是什么?

想必大家都知道,“直播”已经是非常普遍的一种娱乐形式了,直播的及时性和互动性成为信息触达、互动沟通的新媒介。随着5G、超高清、VR等技术的发展,主播与观众的互动需要更加实时,“延时”这个指标愈发的重要。
高延时影响了直播互动体验,阻碍了直播在一些场景的落地,特别在电商直播,直播间的评论提问是观众和主播互动的一个重要手段,主播的实时互动反馈对直播间的活跃度和交易达成至关重要。

二、直播中的那几秒延时都分布在哪里?

我们剖析直播延时的分布,在直播全链路可以分为7个步骤:分别是采集、编码、发送、分发、接收、解码和渲染。其中采集+编码,解码+渲染总体延时比较固定,共100ms左右,变动比较大的部分是分发和接收,从数十毫秒到数秒不等,主要取决链路时延抖动、协议栈的优化情况,以及CDN资源的覆盖情况。

所以,互联网上的直播的“延时”,主要是受限于不同地域、复杂的网络情况、传输速度等以上的原因。

image.png

三、技术人员如何才能在延时上有所突破?

为了帮助直播系统打破瓶颈,技术人员通常需要深入以上7个环节中进行优化。比如,编码器需要考虑发送时的拥塞情况,来实时调整码率进而缓解拥塞,从而降低延时;再比如传统的流媒体传输中媒体数据发送和底层的传输是相互独立的,底层TCP传输的拥塞控制算法是个通用算法,不会考虑媒体的特性,这样的分层结构是很难形成即时反馈系统的,为了保障流畅度,缓存区的大小设计会相对保守,从而牺牲了端到端的时延,如果传输层和应用层是一体化的,QoS控制针对媒体特性来专门设计,同时配合编码侧的码率控制,就能通过组合拳的方式,大大地降低延时。
在传统的架构里,这个7个环节相互独立,这样做的好处是团队分工比较明确,但问题就是优化手段很难做到跨界融合,导致无法做到系统级优化。

目前,国内常见的直播场景包括1对N广播式直播和N对N互动式直播,其中1对N广播式直播大部分采用RTMP、HLS或FLV协议,虽然具备集成方便、兼容性较好、支持大规模并发等优点,但延时最低也需要3-6秒;而N对N互动直播一般采用WebRTC/RTC协议,延时可以控制在800毫秒之内,但是无法支持大规模并发直播。所以,作为开放视频云服务的云计算厂商,阿里云推出了超低延时直播方案RTS(Real-time Streaming)。这个低延时直播方案是通过嵌入直播推流端与播放端SDK,或集成阿里云基于WebRTC的开放的自研协议,最终实现端到端毫秒级直播能力。

四、直播系统开发人员为什么如此看重CDN?

很多人会把CDN的存在比喻成网络系统中的“快递小哥”,其实它的工作原理就是在复杂的互联网传输链路上,首先确保大量的边缘节点覆盖,复用节点和网络资源,在接入成本、资源覆盖、承载能力上实现了最优平衡;然后,再通过一系列的负载均衡、分布式存储、智能调度、抗弱网优化、缓冲策略、网络请求的重定向和内容管理等技术优化手段,为终端请求的内容寻找一条最快、最优的传输路径。

所以,对于直播系统来说,CDN作为基础设施的资源储备十分重要。尤其是在大型活动期间业务流量突发,弹性、灵活的CDN可以在系统平稳方面发挥关键作用。

五、直播延时,还能进一步降低吗?

想要进一步降低直播延时,是流媒体开发人员的共同目标。卢日所带领的团队联合手淘技术、达摩院XG实验室在先后从直播、短延时直播拓展到RTC领域,并在QoS和AAA方面发力,最终成功构建了GRTN全球实时传输网。它的定位是基于中心云和边缘云的异构节点,构建超低延时、全分布式下沉的通信级流媒体传输网络。

目前,GRTN融合了互联网直播和RTC等多种业务场景的音视频流传输和交换。基于GRTN的短延时直播RTS可以支持标准H5 WebRTC推播,在千万级并发情况下延时可以控制在1s以内;RTC端到端延时可以控制在250ms左右。在2020双十一期间,淘宝首次启用了GRTN全球实时传输网络。数据显示,在启用了GRTN后,直播端到端的延时相较于传统的HTTPFLV/RTMP方式,降低了83%。未来GRTN会在节点资源覆盖和QoS上继续大力投入,在超大规模直播场景下将时延进一步压缩20%。欢迎大家关注“阿里云Edge Plus”微信公众号,后台留言GRTN进入用户交流群。

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 2月1日

这只猫在云端定居了?边缘计算在天猫精灵云应用上的落地实践

IoT的概念早已飞入寻常百姓家,在你我的日常生活中发挥着“智能”作用。比如,智能家居、智慧照明、GPS 导航、手机计步器等。未来,随着用户和技术的延伸和拓展,物联网的信息交换和通信价值将会被继续放大。那么问题来了,如此庞大的设备和信息量,如何进行管理和整合重组?如何高效准确智能地对用户需求和实际应用场景做出反应?如何让数据流动产生更大价值?如何向着更智慧加速迈进?边缘计算,就是让IoT终端更智慧的一把钥匙。

今天,边缘酱找来了天猫精灵和阿里云边缘计算的技术2位小哥,一起来为大家讲讲边缘计算如何让IoT终端有大智慧!

边缘酱:天猫精灵和边缘计算是啥时候搞到一起的?

边缘计算高级技术专家李晓成:

那是在一个夜黑风高的晚上,一次产品需求对焦会上,我们就这么“在一起”了。

天猫精灵高级技术专家林中松:

天猫精灵面临的是一个IoT的家庭市场,在我们带屏设备上运行的应用以安卓应用为主。现在的IoT设备上大部分应用都是以本地应用的方式来运行的,我们比较超前,想要研究一下云应用这个技术方向。所以,这一切还要从“云应用”说起。

边缘酱:怪我没文化了,这“云应用”是个什么意思?

边缘计算高级技术专家李晓成:

云应用(Cloud App)是基于AIoT的应用生态,利用云计算的能力,将安卓应用运行在云端一种云服务;云应用可让最终用户在使用智能带屏终端设备时拥有与本地应用一致的用户体验。随着云的快速发展以及网络基础设施的能力提升, 相信“云游戏”, “云桌面”, “云手机”的这些概念你一定都听过,那么云应用跟这些概念有什么关系呢?本质上,云应用和这些概念是类似的,即都是通过虚拟化的方式来把应用跑在云上,把渲染的结果通过网络流推送到端侧,通过网络协议收集用户操作事件来操控应用的一种技术。

天猫精灵高级技术专家林中松:

云应用这种技术主要的计算发生在云端服务器。在云端的计算和终端的计算都产生计算成本,为什么选择让计算发生在云端呢?假设需要支持100个终端的应用,云应用在服务器上的计算成本比增加100个终端的硬件来支持该应用成本来的低很多,那么云应用就可能会有优势了。要降低成本,提高虚拟化和流化服务的密度是最关键的。

天猫精灵云应用的针对场景不只是游戏,而是比游戏更多的类别,除了游戏之外的大部分应用类型都能支持。另外我们希望把这云应用做成跟本地应用一致的用户体验: 即点即用,不需要登陆到云端的桌面或者手机。我们认为在IoT的设备上这样的用户体验会更加好。

边缘酱:那天猫精灵打算怎么做云应用呢?

天猫精灵高级技术专家林中松 :

天猫精灵是面向家庭市场为主的AIoT产品,当前带屏设备上运行的安卓系统为主,所以天猫精灵云应用的需求主要是以安卓应用上云为主。基于安卓系统的应用生态当前是非常庞大,也是非常普及的,从手表、手机、智能音箱、电视等等智能设备上都可以看到安卓的影子,如果将安卓运行云端,大家可以看到和安卓运行在智能终端上也是有比较大的差异,具体的差异点见下图:
image.png

边缘计算高级技术专家李晓成:

为了更好的满足终端云化业务需求,能更好的支持天猫精灵业务发展,阿里云边缘计算团队(ENS)和天猫精灵团队进行了紧密的合作,经过了一系列实践,现在天猫精灵云应用已经正式在阿里云边缘计算节点的落地啦。

边缘酱:那天猫精灵究竟是怎么用边缘计算实现云应用的呢?

边缘计算高级技术专家李晓成:

大概是这样。阿里云在2018年发布的边缘节点服务(ENS)目前已经实现了31个省三大运营商资源全覆盖,也在进一步下沉到区县。ENS通过部署接入、渲染、编解码、分发及存储等天猫精灵云应用所需的服务,天猫精灵可轻松在边缘拥有自己对应的影子设备。每一个云应用在ENS上对应其一个影子设备(虚拟设备),利用云计算的能力,可以做到按需使用、动态分配,天猫精灵的最终用户无需感知影子设备的真实位置,真正实现云-边-端体系的全面协同。

image.png

为了更好的让大家了解天猫精灵云应用on ENS的方案,这里重点讲一下,我们采用的是云-边-端协同的软件架构:

云:以管控和调度能力为主,能力部署在中心云,简称云

天猫精灵调度服务:负责终端设备的鉴权、云端资源的调度/管理、用户事件的记录和分析等;
影子设备托管服务:负责影子设备的鉴权、云应用调度/管理/分发、监控及告警等;
ENS资源调度服务:负责实例资源的生产、调度、销毁等,提供资源全生命周期管理能力;

边:以提供就近接入的影子设备为主,能力部署在边缘云,简称边

计算:提供影子设备所需的虚拟机实例以及相关容器;
网络:提供影子设备所需的网络能力,多租户、容器网络、安全组等能力;
存储:提供影子设备所需的存储能力,存放系统和用户数据;

端:用户最终使用的天猫精灵终端(含云应用),简称端

包括天猫精灵云应用运行所需的基础操作系统及硬件,以及各类应用软件及优化后的特性
包括了云应用所需的流化等功能,负责与边缘云进行进行设备及音视频流交互

image.png

天猫精灵高级技术专家林中松:

目前,天猫精灵分布在各个城市的不同家庭里面,可家庭网络根据属地不同就近接入边缘云,实现终端流畅视频播放及交互体验,而ENS所提供的低时延、低成本、广覆盖的边缘云资源,可以作为云应用快速发展的基础。云应用对天猫精灵的价值体现在打破低成本IoT设备导致的硬件限制,让各种复杂度的应用在天猫精灵上流畅运行,应用接入无限制,可运营度得到极大提高,升级维护变得容易。云应用提高了IoT设备的想象空间,让泛计算得以实现,智能应用只需要通过屏幕就可以输出给千家万户。

边缘酱:看来初步的合作十分成功呀,两位小哥接下来有什么计划呢?

天猫精灵高级技术专家林中松 :

天猫精灵云应用或者设备云化的实践才刚刚开始。从产品和技术发展来看,面向终端云化场景的云计算软硬件解决方案尚处于起步阶段,各个云厂商、芯片、服务器 、软件方案多为第一代产品,整体的方案、功能、性能、稳定性、成本结构均有较大的提升和优化空间。我们初步计划在虚拟化密度提升、高可用优化、流化协议优化和视频质量提升等方面再下点功夫,继续前进。

边缘计算高级技术专家李晓成:

5G的快速发展和普及让万物互联时代加速到来,这进一步加速了终端设备摄像头、手机、平板、手表、音箱、电脑、智能家居等终端的移动属性,终端上云的趋势愈发明显,未来数千亿级别的智能终端及应用需要一个全新的机遇云原生架构的生态系统来支持,来运行在云端。

image.png

边缘云作为中心云计算的延伸,具有分布式、广覆盖、低延时等特性,基于已有边缘节点以及与运营商等合作的MEC节点,来进一步构建基于城市计算场景,利用新技术、新方案、新硬件体系驱动创造新的商业模式,通过科技驱动创新,为社会创造价值,让生活更美好。

边缘酱:

作为大脑般的云计算的触角,边缘计算如神经元一样将能力延伸到更靠近终端或人或物的网络节点,提供分布式、可定义、可调度、标准开放且安全的计算平台及服务。未来,我们也期待更多的场景落地生根,等着两位的好消息哦~关注“阿里云Edge Plus”公众号,即刻开启「边缘 连接 无限可能」的技术世界。

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 1月25日

大促密集,CDN如何保障电商体验如丝般顺滑?

简介: 前不久,阿里云技术天团空降CSDN在线峰会,对核心技术竞争力进行解读。其中,阿里云高级技术专家曾福华分享了《双11: CDN如何保障电商大促如丝般顺滑》的议题。俗话说:养兵千日,用兵一时。每一次的战役,后面都有无数的团队、无数的预案以及无数的演练在支撑着。双十一的稳定,不仅仅有各种创新各种高科技,还有非常多的体系化工程给与了足够的保障,从物理层到应用层,从资源准入到线上演练,无一不例外的都蕴含着各种门道。面对电商大促,面对百 Tbps 级别的流量,阿里云 CDN 又是如何确保如丝般顺滑的呢?

前不久,阿里云技术天团空降CSDN在线峰会,对核心技术竞争力进行解读。其中,阿里云高级技术专家曾福华分享了《双11: CDN如何保障电商大促如丝般顺滑》的议题。俗话说:养兵千日,用兵一时。每一次的战役,后面都有无数的团队、无数的预案以及无数的演练在支撑着。双十一的稳定,不仅仅有各种创新各种高科技,还有非常多的体系化工程给与了足够的保障,从物理层到应用层,从资源准入到线上演练,无一不例外的都蕴含着各种门道。面对电商大促,面对百 Tbps 级别的流量,阿里云 CDN 又是如何确保如丝般顺滑的呢?

讲师:曾福华,高级技术专家,阿里云边缘云智能调度系统负责人,主要研究技术方向为边缘云网一体化调度。

关注阿里云Edge Plus微信公众号,看见更多技术资讯,文末留言更有阿里云T恤免费拿哦~

内容目录:

  1. CDN的发展历程及架构简介
  2. 大促场景下,有关CDN的体量、保障以及排布那些事
  3. 弹性、算力及模拟仿真等关键技术解读

阿里云CDN发展历程

2008年:阿里云CDN起源于淘宝CDN,当时主要服务对象就是淘宝电商。
2009年:双11启动; CDN研发团队成立; 阿里的CDN和电商有着千丝万缕的联系。
2011年:CDN作为流量基础设施,逐渐从服务淘宝电商扩展到全面服务阿里集团。
2014年:阿里云CDN正式商业化; Tengine+Swift节点架构上线,替换了ATS节点架构。
2015年:阿里云CDN与电商携手迈进全站https阶段;阿里云CDN自研AIM1.0智能调度系统上线。
2017年:阿里云CDN开启全球化战略;合并优酷CDN;正式发布SCDN、DCDN等产品;同年被Gartner评定为全球级供应商。
2018年:阿里云CDN支撑了全网70%世界杯直播流量;AIM2.0智能调度系统发布。
2019年:围绕“智能化”,阿里云CDN在技术上深耕,在可编程CDN、多维资源负载均衡、精细化运营、各种边缘场景服务上持续打磨。
2020年:在全民抗疫的背景下,阿里云CDN支撑直播在线教育等场景流量大幅增长;在技术层面,进行CDN边缘云原生与云网一体化调度改造。

屏幕快照 2021-01-21 下午5.30.04.png

上图中可以看出,伴随着每年双十一以及移动互联网、视频的普及,CDN的流量也呈现一个指数级增长。截止目前,阿里云CDN在全球有2800+边缘节点,覆盖了3000多个地区和运营商。服务全球数十万客户,为超百万域名提供加速服务。阿里云CDN打造的一张连接全球的边缘生态网络,在晚高峰期间每秒处理上亿QPS的用户连接请求,每天将客户数十亿次配置管理指令下发到全网所有节点。

CDN简介与技术架构

众所周知,站点加载速度对上网体验影响非常大。据统计,大部分站点如果不能在3秒内打开的话,接近50%的用户会选择离开。对于大型在线系统来说尤为明显,加载时间每延长1秒,一年就会减少数以亿计的营收。
CDN就是旨在提供客户站点访问加速的PaaS云服务(虽然CDN诞生的时候云计算的概念还没有提出来),CDN非常普及,承载了互联网90%以上的流量。工作的原理是通过广域覆盖的边缘节点将内容分发到全球各地,调度系统将用户请求引导合理的边缘节点来大幅减低访问时延,并控制着缓存内容回源流向,进而达到给客户站点加速的目的。

屏幕快照 2021-01-21 下午5.30.13.png

CDN比较切确的定义是,基于运营商资源通过低成本、高可靠、广覆盖的计算基础设施、内容链接能力及视频承载平台。CDN内部系统覆盖智能调度、网络/协议以及供应链的管理等模块,同时加之数据和安全防护生态能力,在此基础之上,提供面向网页、图片、点播、直播、动态、政企、安全等不同场景的加速能力。

电商大促的技术特征与挑战

今天的大促规模十分庞大,通常是百T级的业务带宽,亿级的并发请求,需要百万级的CPU核消耗,如此大规模的场景磨炼下,推动了云产品尤其是CDN的快速成长。

大促活动有两个特征,第一是密集排布,包括活动安排紧凑,对应不同业务方;活动形式多样,如猫晚直播、大主播、红包、秒杀、0点开抢等等;同时活动估量非常复杂,需要考虑并发连接、带宽、算力、命中率等指标。第二是需要在高负载下灵活变阵,考虑到:高负载大盘资源运行水位;各活动场景对不同维度资源需求差异大;各活动场景的调度覆盖策略要具备随机应变能力,以及强大的资源弹性伸缩能力。

屏幕快照 2021-01-21 下午5.30.31.png

那在这样复杂的背景之下,如何去满足业务高速发展的需求呢?

直面洪峰流量:CDN如何承载大促洪流?

通常,拿双11大促举例,CDN的保障分为预备、战前、护航三个大的阶段。同时,因为双11保障是组织和系统结合的体系工程,详细拆解下来可以分为需求评估、预案准备、需求交付、演练压测、封网保障、大促护航等不同阶段。

一、预备

在需求采集和评估阶段,CDN需要向各个业务侧去采集业务需求,明确时间点、业务特征画像和业务活动报量,同时要明确是否涉及新的功能定制。然后根据业务需求转化成资源需求,包括库存盘点、错峰复用和资源缺口与建设;
在预案的准备阶段,需要盘点清楚往年既有预案和新增预案;按场景和用途分成提前预案、还是紧急预案;大部分预案是CDN平台侧独立完成即可,还是部分需要和业务方一起配合联动;
定制需求交付过程中,主要涉及定制开发、联调测试、上线验证等过程;资源在建设交付过程中,也需要对交付的资源进行业务模拟仿真,并配合进行业务资源池的调整。

二、战前准备

首先需要完成演练压测阶段,包括对容灾、安全、性能和功能各方面的演练,进一步确保双11对软硬件系统、人员组织等方面的准备工作是到位的,包括预案是否覆盖完整;接下来,就要进入封网保障阶段了,一般在大型活动上线之前都会禁止所有的发布和变更,不断进行系统巡检,巡检中确保所有出现的缺陷修复到位,同时这个阶段也会进行战前动员保障,激励士气的同时也对大促保障规范做进一步强调。

三、护航阶段

正式开始护航后,通常会按照提前安排好的分工进入现场保障,尤其前期工作做得充分,这个阶段主要工作就是盯盘,针对异常情况需要快速地发现并定位问题,按计划启动相应紧急预案进行响应。最后,保障结束后需要对整体护航进行复盘总结,为未来的大促保障去做更多参考沉淀。

CDN保障大促的关键技术点应用

一、大促场景弹性如何保障?

由于大促期间业务排布非常多,那么在高资源运行水位的情况如何进行灵活的弹性调度保障非常关键。阿里云CDN是如何保障的呢?如下图(上半部分)所示,海量业务中每个业务都有自己的资源偏好,为了保障弹性在业务和资源的匹配过程中,采用了不强制只择优的业务资源匹配机制。总结下来,阿里云的CDN调度系统在弹性保障上:
资源共池融合是业务弹性保障的最关键因素;
不做业务级别的节点硬件隔离,流量实时按需流动到全网所有节点上;
弹性、质量是可权衡的双目标,可根据实际情况进行自主灵活可控(业务资源匹配程度);
按整体大盘需求进行资源规划、资源建设、资源调度;

屏幕快照 2021-01-22 上午10.39.09.png

如上图(下半部分)所示,我们要做到通过业务资源池资源调度优化,让全网2800+CDN节点所有节点的齐涨齐落,这样才能给大促业务提供最大的资源弹性保障。所以,调度不仅是全局负载均衡,更是弹性伸缩,阿里云CDN调度系统进行了以下准备:

  • 节点角色交调度系统决策,剪除硬约束;
  • 业务资源池交调度系统实时决策,灵活变阵;
  • 节点上业务混布交调度系统决策,充分复用;
  • 资源池规划、全局负载均衡中台的双剑合璧,弹性伸缩;

二、 大促场景算力如何调度?

很多人认为CDN单纯是流量分发系统,但其实这个观念是值得商榷的,在一些场景下还会海量大促突发请求会消耗巨大算力资源。拿双11来举例,电商网站进行了全站的https改造,在11日凌晨0点电商大促开抢瞬间,所有请求汇聚进来,这时候会形成非常巨大的尖脉冲,算力消耗十分巨大,此时如果没有很好的机制去进行算力资源调度和全局负载均衡,就会出现大面积的业务异常。按天维度来看,双11当天QPS比平时要高出约三成。所以CDN在大促场景下的另一个核心挑战是:如何对海量业务算力消耗进行精准的全局负载均衡调度?

曾福华在此介绍:在带宽调度或流量调度时,我们可以从日志上精准推演每个请求消耗的流量,但是比较难精准去推算出每个请求消耗了多少算力,这对我们来说是非常大的难题。如下图所示是阿里云CDN的解题思路,基于已知的每个节点的CPU消耗以及节点的并发QPS这两个数据,可以对每个业务单位QPS的CPU消耗进行公式的计算。同时根据不同时间点的不同数据变化,不断进行机器学习训练,得出各个业务平均单请求的CPU消耗精准数据了。有了带宽和算力消耗的数据,如此一来,之前的单维带宽调度就需要升维到多维资源调度模型,生成带宽与算力等多资源维度下的全局负载均衡的调度新策略。

B501FEA6-E4BA-4EA7-9056-F0AA1123681A.png

三、大促限流保障机制

前面有介绍到大促期间整个大盘是在资源高水位状态下运行,所以需要业务侧做精准的业务报量,CDN平台会根据这个报量去进行资源评估。但是任何事情都需要考虑到突发性和意外性,如果突增业务量超过了之前评估的业务报量,CDN平台怎么进行风控呢?

这一方面需要业务侧对于报量进行精准评估,而另一方面CDN平台侧需要限流的策略来确保整体业务平稳运行。
阿里云CDN在限流保障上已经在多方面沉淀了很多实战经验和能力。阿里云CDN多级全方位限流保障包含:

  • 业务类型: 直播、点播、下载、动态加速等场景限流;
  • 限流类型: 带宽、QPS、连接数等;
  • 限流形态: 单阈值区间限流,多阈值区间限流;
  • 限流范围: 全网、区域、节点等;
  • 限流层级: L1限流、L2限流、回源限流;

仔晟图.png

四、调度模拟仿真平台

前面我们讲到大促场景中需在高负载的情况下进行灵活变阵,调度模拟仿真平台是一个非常好用的工具。
大促场景结合各个业务预估报量进行全局调度策略侧模拟仿真,可以在事前未卜先知资源瓶颈和风险点会发生在什么地方,需要针对各个业务怎么做资源补充和策略调整,循环迭代调整业务资源池,直到模拟仿真平台上风险点解除掉。
除了大促场景之外,调度模拟仿真平台还可以加速辅助CDN调度核心系统的功能演进,从全局角度来观察验证新组件带来的变化影响是正面还是负面。

模拟平台的用途总结:

第一,基于沙盘模拟迭代,打磨了一套零成本试错之路

•加速调度核心系统等组件的进化;
•测试平台+模拟仿真平台,共同捍卫稳定性;
•业务策略、资源的调整实时评估;

第二,通过大促模拟仿真,可以提前预知风险

•业务报量到资源建设,衔接管控全流程;
•精确推导资源缺口,精确推导承载增量;
•大促活动变阵模拟,循环迭代业务资源池;

图片 1.png

以上是阿里云CDN基于多年电商大促场景保障过程中沉淀下来的一些实战经验分享。阿里云CDN目前也在边缘云原生和云网一体化调度上做了很多技术上的演进,后面我们将持续给大家进行相关分享,谢谢观看。

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 1月21日

阿里云熊鹰:基于融合、协同系统的边缘云原生架构演进和实践

熊鹰.jpeg

云原生和边缘计算是近两年都非常火的技术话题了,在第十届云计算标准和应用大会上,阿里云高级技术专家熊鹰分享了《基于融合、协同系统的边缘云原生架构演进和实践》,希望通过介绍现在阿里云在边缘计算和边缘云原生这些技术领域的系统架构演进,让大家了解到业务在云原生和边缘计算结合场景下落地的一些思考。

关注阿里云Edge Plus公众号,回复“熊鹰”,获得演讲PPT材料

概述

近几年边缘计算发展非常迅猛,大家可以在各种标准和资料中看到各家对它的定义,这里对其中的几个基础概念做一个总结性的表述

【缘起】
边缘计算概念的缘起,可以追溯到比较久远的时期,但是真正热度兴起,主要还是因为5G的发展;4G的发展使得移动互联网大爆发,因此在5G时代边缘计算被赋予了很大的期望,希望成为新的产业赛道;另一方面,5G标准3GPP里定义的的三大场景大带宽、低延时、广连接,从各个方面都会强化边缘计算的应用场景,而由此带来的电信的基础设施的改造,使计算可以进一步下沉,从互联网到核心网、进一步下沉到接入网,计算正在一步步变得离用户越来越近。

【定义】
关于边缘计算的定义,身处不同的领域和角度,运营商、云服务厂商、硬件厂商,各家对于边缘计算的定义是不一样的。在阿里云的边缘云标准里,定义边缘云为:在靠近终端(人和物)的网络节点,提供分布式、可定义、可调度、标准开放且安全的计算平台及服务。目标是要拓展云的边界,让计算与连接离物更近,让它作为万物互联的基石。

【特征】
与中心云来对比,边缘的节点是分散的多级的,节点多而体量小,不止是区域级省级,还会下沉到地市级园区级,在5G场景里,更要下沉到接入网,云与边、边与边之间的网络可能都是互联网通道。

【挑战】
海量的、分布式的、异构的边缘节点资源特性,会给业务带来巨大的挑战:多个网络入口,代表着统一的流量监控和弹性伸缩策略是不可用;节点多而体量小,代表着单一集群的弹性弱,而全局的弹性强;海量节点的纳管和互联网的网络环境,对于高可用、灾备、迁移等等都是大的冲击。

总体来说,由于新基建的提出和布局,5G、物联网、工业互联网得到了广泛的关注。5G的商业化和产业化进程的加速,使底层基础架构更加的成熟,在今年已经催生出了一大批新行业入场,云应用、云游戏、互动娱乐、工业互联网2.0等等,同时也在推动着整体技术架构在迅速地变化和演进。

基础设施演进

首先来介绍边缘基础设施的演进情况,阿里云根据业务形态,定义了三个阶段:

屏幕快照 2021-01-05 上午10.22.48.png

第一个阶段为边缘云就绪,在这个阶段,用户只是把运行在物理机上面的应用,迁移到虚拟化环境中,这个过程是以降低成本为主要驱动力的,用户不再自建节点,将底层物理设施的运维转交给边缘云处理,而应用的开发和运维方式并没有非常不同。

第二个阶段为边缘云原生,用户希望能再进一步降低整体拥有成本,提升系统能力和研发效能,利用标准化、自动化的方式来管理资源、交付应用、运维系统,用户基于K8S进行深度开发和定制,将边缘资源进行一个整合,适配边缘的特性,在之上开发搭建自己的PaaS平台,以提供给内部的业务使用。

大家对前两个阶段应该很熟悉了,跟中心云的演进过程很类似;

第三个阶段为边缘融合云原生,应该算是一个比较新的概念,这是阿里云在实践过程当中,结合对用户业务的思考,摸索出来定义的一个阶段。

展开来讲:边缘的特性是分布式、资源小而多、网络条件复杂,这样用户需要随时关注基础设施的稳定性,并进行业务和数据的切换和迁移;另外,弹性不强,那么用户的业务也很难做到按需使用;另外,边缘各种能力在技术架构上的整合,也需要用户更深入到K8S之中,具备定制开发能力。总结来说,就是用户需要感知底层资源、基础设施,甚至库存、水位、规划等等情况,并且业务要下沉到边缘的技术挑战和难度都很大。在边缘融合云原生里,带给用户的是,在边缘也并不需要去关心底层基础架构设施,就能享受到弹性、高可用、按需使用的能力。边缘融合云原生应该将异构资源、多集群、库存水位的边缘特性屏蔽;将资源调度、弹性伸缩、多级协同等方面的能力进行沉淀和打通;利用云原生的良好的扩展性,将资源、能力进行抽象融合;同时还需要针对通用业务场景和新兴业务场景,提供统一标准的接口封装;将这些能力释放给用户。

系统架构演进

在技术架构演进实践当中,同样按照刚才的思路进行分层设计:
基础设施层:具备异构资源纳管、多级网络架构、融合存储形态等能力,解决底层资源融合纳管、融合生产、抽象屏蔽的问题;
云边协同层:具备计算、存储、网络流动的能力,具备云边、边边、多云的协同能力,解决各种能力和系统协同打通的问题;
平台引擎层:具备边缘云原生抽象集成能力,解决将资源、组件和应用、调度、编排等能力集成融合的问题;
业务场景层:具备统一接口、业务沉淀、场景深化的能力,解决开发者生态闭环的问题。

屏幕快照 2021-01-05 上午10.22.58.png

可以预料到,随着5G技术和基础设施的持续演进和完善,以及创新型业务的发展,系统架构还会随之进行演进和更迭。

纸上得来终觉浅,绝知此事要躬行。接下来,熊鹰通过介绍阿里云在实际业务实践过程中的案例,来一一解读各层的能力和设计。

应用案例——无状态应用

该场景主要针对的是任务类的业务(例如压测、拨测、离线转码任务)、或者对等网络系统(P2P传输网络)等,这类业务,对弹性伸缩能力有较高要求、对成本有强烈的敏感度,但是对位置、高可用性等要求不高。由于边缘单节点弹性能力弱,但是全局资源弹性强的特点,这种场景算是考验边缘计算基础设施能力的典型应用场景。在架构上,它是需要有一个对全局资源的一个统一库存、融合调度、协同编排的能力:在计算形态上,要支持虚机、容器、安全容器等多种融合计算的形态来满足不同场景的业务诉求;在资源库存方面,要有一个融合的资源池;在调度和编排方面,也是有一个协同统一的调度能力;这样就能很好的提供在事件触发、流量突发场景下的弹性伸缩和按需使用的能力,也能让用户的使用成本大幅度降低。

应用案例——有状态应用

这个场景,业务除了将计算和弹性托管以外,还将域名和调度托管了。另外,由于业务的复杂性,架构上也日趋复杂。首先,在单集群内,系统需要拆分为多个独立工作的微服务;第二,多个微服务自身和之间,都有相互编排依赖的关系;第三,在云与边(管控与业务)、边与边(集群与集群)之间会有协同通信的需求;最后,再加上域名和流量调度、SLB、数据库、中间件等通用能力和组件集成需求;从这个角度来看,在边缘的应用场景已经不比在中心云里的应用复杂度低了,同时还要加上边缘的分布式、多集群、广调度的特性;分布式云计算是对这个场景比较贴切的描述。

在架构上都需要如何来解决业务的需求?最底层基础架构设施层,产品能力上,引入分布式SLB、分布式DB等;网络能力上,加入了可编程可配置的云边、边边覆盖网络能力;在协同层上,云边协同、边边协同、流量和资源的动态平衡协同也是核心的能力;在引擎层上,需要有深度开发适配边缘的云原生能力,像解决海量节点纳管引入的K8S多集群管理联邦能力、解决业务多租户隔离的Virutal Cluster能力、解决微服务架构中服务发现和协同通信的Service Mesh组件、适配边缘虚拟网络、虚拟存储的CNI、CSI组件等等。

屏幕快照 2021-01-05 上午11.21.09.png

熊鹰:"分布式云计算概念目前还没有太多的标准和规范,一个复杂应用要做成分布式,从中心下沉到边缘,还需要做很多系统架构改造适配的工作。这也是阿里云努力的方向,希望沉淀出更多的平台能力出来,形成一个个开发生态的闭环,让分布式云计算,也能轻松落地边缘。”

应用案例——终端上云

这个业务场景在今年非常火热,典型是云游戏和云应用这两个领域。业务将运行在终端上的系统或者应用,托管到云端,以降低终端成本,也可以降低高质量业务的可准入门槛。在边缘融合云原生里,这里会有一个根本性的概念转变:从资源托管、应用托管到设备托管、位置无感托管。在基础设施层和引擎层,针对各类异构资源将资源做初步的封装,抽象出一层统一的标准的虚拟化的资源,提供安全和隔离的能力;在业务层上,再进行一层封装,将资源属性屏蔽掉,不再提供资源的概念,取而代之的是设备的概念;同时,在协同层上加入了协同计算、协同存储、协同网络的能力,让虚拟设备能够流动起来。在业务上,不再能看到传统意义上应用和资源的概念,只能看到一个一个虚拟设备的管控能力,例如设备数据、设备应用、设备调度等等。

屏幕快照 2021-01-05 上午11.21.19.png

这里强调一下数字孪生的概念,熊鹰表示:在万物互联时代,每一个物理终端的背后,最终都有一个影子终端在边缘云上,或者是数据的载体,或者是系统的延伸。

应用案例——超清视频

这个场景还处在技术摸索的阶段,是真正下沉到5G MEC节点的一个场景,希望能够打造一个可复制的5G领域的通用技术架构模型。这个场景里最关键是要能打通协同层和运营商MEC系统的资源协同、流量调度、网络分流协同的能力。5G/MEC时代算力的持续下沉,到接入网,到MEC节点,通用协议如DNS协议会无法满足精准的调度需求;一方面调度将会需要根据终端的精确地域信息来决策,另一方面也要根据业务的需求场景来进行决策;例如,对于定位、AR/VR等极高实时性的业务,会放在接入机房来满足实时性的要求;视频分析等高传输带宽节省业务和云游戏较高实时性业务,会放在汇聚机房,兼顾功能和实时性的需求;而重计算/大存储的业务放在重汇聚机房或核心机房;多级计算、多级网络的设计能让整个系统的能力更加强大和丰富。

边缘融合云原生希望在兼顾业务时延、计算能力等需求的基础上,能分场景灵活的选择业务的部署位置,来满足各类业务的需求。当然,这些能力应该是封装抽象提供给上层,用户和业务是不应该感知到底层基础架构设施的复杂性的。

总结

5G时代,终端上云、VR/AR、边缘AI、工业互联网、智慧农业的应用场景将逐渐爆发起来;在一些专有领域内,已经有重量级的应用场景落地;但是在通用互联网技术领域,真正的5G的Killer应用还没有出现,或者说真正的结合5G技术还有基础设施的技术架构还待演进。熊鹰十分期待边缘计算平台能够通过共建、合作的方式,将多级网络里的资源融合调度起来,将云边端真实打通协同,基于云原生技术,为行业提供开放的、标准的云边协同、云网一体化能力,让更多的应用能轻松的下沉到边缘,实现万物互联的时代。

查看原文

赞 0 收藏 0 评论 0

阿里云EdgePlus 发布了文章 · 1月20日

大文件下载及视频点播的CDN加速实践

为了帮助用户更好地了解和使用CDN产品,CDN应用实践进阶系统课程开课啦!前几天,阿里云CDN产品专家陈智城在线分享了《大文件下载及视频点播的CDN加速实践》议题,解读大文件下载和视频点播的业务场景、内容分发挑战及对应解决方案。本篇文章,将为你详述分享原文。

关注阿里云边缘计算和CDN官方账号:阿里云Edge Plus ,免费获得讲师课件PPT

一、大文件下载和视频点播的内容分发挑战

对于下载类的场景来说,常见细分场景包括:手机应用商店、游戏应用商店以及游戏更新和手机操作系统更新等,而对于视频类的应用场景来说,主要细分场景包括短视频、长视频、在线教育、OTT机顶盒、广电传媒和音乐网站等等。

为什么会把下载类的应用场景和视频点播类应用场景放在一起去做比对呢?因为视频点播这个应用场景实际上也是一种大文件下载场景,这两个应用场景有着很高的业务相似性,也有很多共性问题,而它们之间的区别在于视频点播对于访问的性能会有更高的要求。

图片1.png

两个场景在内容分发方面所面临的挑战主要有三大类:

  1. 用户体验问题,主要体现在:国内运营商环境复杂,跨运营商访问效果差;用户分布广,跨地区访问时延高、速度慢;弱网环境下传输性能差,速度慢、卡顿严重等方面;
  2. 源站性能与成本问题,主要体现在:中心式部署的源站弹性扩展能力差,无法承受大规模突发流量以及中心式部署的源站带宽成本高昂;
  3. 业务安全问题,主要体现在:时刻面临着DNS劫持(例如被劫持了页面内容,被嵌入了页面广告等)、资源盗链(源站面临带宽成本上的损失)等安全威胁。
    • *

二、CDN内容分发网络架构

当下,CDN已经是成为了缓解网络拥塞、提高业务响应速度、提升用户体验的一种非常重要的技术手段,也是互联网基础设施当中不可或缺的重要组成部分。下面我们通过阿里云CDN的内容分发网络架构来说明典型的CDN内容分发网络都包含哪些组成部分:
图片2.png

(1)调度系统
用户的终端会发起各种应用访问,比如:点播和下载这两个应用场景。用户的访问请求会首先去做域名DNS解析,然后用户的域名DNS解析请求将会通过阿里云CDN的调度系统去处理;

(2)链路质量系统
链路质量探测系统的作用是去实时地监测缓存系统中的每一个节点和链路的实时负载和健康状况,然后反馈给调度系统,调度系统会根据用户请求中携带的IP地址信息去解析用户的运营商和区域归属,然后综合链路质量信息为用户分配一个最佳的接入节点;

(3)缓存系统
用户收到最佳接入节点的IP以后,就会去访问这个缓存节点,节点如果已经缓存了用户请求的资源,那么就将会直接将资源返回给用户;如果L1节点没有命中,会上溯到L2节点,如果L2节点也没有缓存资源,才会返回源站去拉取这个资源;某个资源首次拉取后将会在缓存系统中缓存下来,这样如果后续用户访问到同一个资源,就可直接从缓存系统去拉取资源,避免重复回源;通过分级缓存的这种部署架构可以达到提高内容分发效率、降低回源带宽以及提升用户体验的效果;

(4)支撑服务系统
阿里云CDN在内容分发之外也提供了支撑服务系统。第一是具备资源监测能力,可以对缓存系统上客户业务运行的状态进行监测,比如对CDN加速域名的QPS、带宽、http状态码等常见指标实现监控。第二是数据分析,用户可以分析CDN加速域名的TOP URL、PV、UV等数据。第三是配置管理系统,用户通过该系统可以下发如缓存文件类型、缓存时间、去参数缓存等缓存规则,以提升缓存系统的运作效率。


三、 CDN如何解决互联网内容分发所面临的问题?

下面,从用户体验、源站性能与成本以及业务安全这三个方面来看看CDN是如何解决问题的。

第一,用户体验问题

首先,CDN可以为用户提供诸多的就近接入的节点。
阿里云CDN建立了一张覆盖全球六大洲70多个国家的2800多个的节点,全网具备了130Tbps的带宽输出能力,基本上覆盖了国内以及做海外的主要运营商。依托丰富的资源节点覆盖,阿里云CDN能够让用户就近接入同运营商节点,解决跨运营商互联互通、远距离访问时延大等用户体验问题。

其次,提升用户体验的第二点是需要提供精准的调度能力,阿里云CDN在这里是提供了4项关键的优化措施:

1、持续更新的精准IP数据库:IP数据库的作用是在用户的DNS解析请求转发到了CDN调度系统时,调度系统会判断用户的地区和运营商归属,以此来为用户分配就近接入的同运营商CDN节点。为了确保IP数据库的数据处于最新的状态,数据库一直在持续地更新。
2、提供HTTPDNS服务(需要客户端兼容):采用HTTPDNS这项技术使得用户终端可以绕开运营商的local DNS,直接采用HTTP协议去访问调度系统,请求所需要访问的域名的最优接入节点,这样可以避免DNS劫持所带来的业务安全问题。
3、节点数据分析:CDN调度系统通过链路状态系统去实时地分析整个缓存系统中的所有节点和链路的健康状况,为用户选择最优的接入节点,避免因为接入节点质量不佳而影响到用户访问体验。
4、基于内容调度,提高访问命中率:在大文件下载和视频点播这两个应用场景上经常使用302调度这种基于内容的调度技术,302调度是一种中心调度方案,用户在请求某一个资源的时候,在完成域名DNS解析之后,用户请求将会先访问到中心调度系统上,然后中心调度系统将会解析用户请求需要访问的内容,再通过302重定向的方式为用户分配最佳接入节点。
通过采用以上4项优化措施,能够为用户提供更加精准的调度能力,从而让用户能够接入最佳的CDN节点。

CDN常见的三种调度方案简单对比如下图所示:
图片3.png

这里简单说明下这三种常见的CDN调度方式的优缺点:
(1)DNS调度是最常用和最通用的调度方案,缺点是存在DNS劫持的风险,调度的精确度也会差一些;
(2)302调度非常适合用在大文件下载和视频点播这两个应用场景,优点是可以提高调度的精确度,缺点是将会增加首包的时延(在大文件下载和视频点播场景下对首包时延不太敏感,而对调度精确度要求更高)
(3)HTTPDNS调度的优点是有较高的安全性(可以规避DNS劫持风险)和调度精确度,但是有个很大的缺点,需要客户端提供支持(例如在手机APP上嵌入SDK),通用性较差。

再次,提升用户体验的第三个优化点是对传输链路做智能优化

1、协议优化:通过调整拥塞算法、丢包探测算法等优化措施,对TCP协议栈的性能做了大幅度提升,尤其对弱网环境下的网络性能提升明显;
以下两张带宽利用率对比图,左边是标准TCP传输协议,在建立TCP连接之后,需要通过相对更长的时间去提升带宽利用率,一旦碰到丢包情况,带宽利用率会快速下跌,并且需要经历慢速爬坡阶段才能够逐步提升带宽利用率,尤其在弱网环境下,使用标准TCP协议的情况下,带宽利用率的下降会非常的严重。右侧是阿里云优化后的TCP协议,通过快速启动、主动拥塞探测和快速丢包恢复等技术优化措施,能够提供更高的带宽利用率,即使在网络条件相对差一些的情况下,也可以有比较好的优化效果。

图片4.png

2、连接加速:通过修改协议栈的 Handshake Timer 来实现快速重试,以弥补由于丢包导致的重试超时;
3、持久连接:在CDN节点间预先建立好 TCP 连接,并长时间保持不断开,这样在有新连接过来的时候就可以直接复用,减少TCP握手时延。

第二,源站性能、成本压力问题

通过提高缓存系统的效率帮助客户降低源站的性能和成本压力,主要包括六个方面的技术措施:
1、分布式部署:确保用户能够就近访问同运营商的节点,以此来提高访问速度,解决跨运营商访问慢、长距离回源时延高等问题;
2、多级缓存架构:多级缓存架构中的每一级都能够用来缓存用户请求的资源,多级回源收敛之后可以极大地降低回源流量;
3、内容预取:通过内容预取技术提前把源站的内容预取到CDN节点上,减少回源量和提高缓存命中率;
4、合并回源:配置若干个域名的回源请求与某一个域名(业务相同的情况下)相合并,以减少重复回源的流量;
5、去参数缓存:设置hashkey(缓存key)时,配置去掉资源URL后面的参数,以不带参数的URI作为缓存key,以提高缓存命中率;
6、流量控制:提供精细化的流量控制能力,支持单请求流控和全网流控,支持边缘流控和回源流控,能够有效降低客户成本。

下图中标记的序号代表了以上6个技术措施在CDN缓存系统上的作用位置:

图片 5.png

这些技术措施综合起来可以帮助客户去有效地减少回源带宽、提升缓存命中率,从而降低源站的带宽压力、降低源站的带宽成本。

第三,业务安全风险问题

阿里云CDN通过可靠的安全防护措施,去帮助用户规避业务上的安全风险。
1、防盗链:可以选择使用Referer、UA、URL、IP等通用鉴权方式,也可以用EdgeScript来定制鉴权规则,支持边缘鉴权和中心鉴权,通过严格校验用户的资源访问请求来防止源站资源被盗用;
2、DNS防劫持:HTTPDNS技术使用HTTP协议访问阿里云的服务端,获得域名解析结果,可以绕过运营商的Local DNS,避免域名DNS劫持;
3、HTTPS传输加密:支持采用TLS协议来加密HTTP协议内容,防止明文数据暴露在互联网上,并且可以设置TLSv1.3、HSTS等高级功能。

图片 16.png

最后,我们再整体回顾一下,阿里云CDN在大文件下载和视频点播这两大应用场景下提供了哪些的核心能力:
1、丰富的资源节点:能够为用户提供就近接入的同运营商CDN节点,解决长距离接入和跨运营商访问带来的延迟高和速度慢的问题
2、精准的调度系统:能够实时地获取CDN节点的健康状况,并根据用户的所在位置和运营商来分配最合适的接入节点,以便取得最佳接入效果
3、智能的传输链路:通过协议优化、连接优化等措施来降低总体时延、提高传输速度,尤其是提高弱网环境下的传输速度
4、高效的缓存策略:高效的缓存策略能够带来更高的用户命中率(命中就近节点上的缓存资源),从而提供更高的访问速度
5、可靠的安全防护:可靠的安全防护措施能够对用户的资源访问请求做严格的校验和加密,保护用户的资源和业务安全

如果对阿里云CDN产品应用进阶感兴趣,可以关注阿里云Edge Plus微信公众号,了解更多产品信息和技术干货

查看原文

赞 0 收藏 0 评论 1

阿里云EdgePlus 发布了文章 · 1月20日

正确使用CDN 让你更好规避安全风险

为了帮助用户更好地了解和使用CDN产品,CDN应用实践进阶系统课程开课了。12月17日,阿里云CDN产品专家彭飞在线分享了《正确使用CDN,让你更好规避安全风险》议题,内容主要包括以下几个方面:

  1. 使用CDN的常见误区和问题有哪些?
  2. DDoS攻击是如何一步步演进的?
  3. CDN场景中更有效的防护方式是什么?
  4. 阿里云CDN边缘安全体系如何帮助客户抵御攻击?
  5. 针对近期潜在安全风险,你可以怎么做?

客户体验和安全稳定是企业的两大核心诉求

阿里云CDN正式商业化至今,已经服务了30万+的全球客户,其中最核心的两类场景就是网站和APP的业务。在这个业务中,客户的核心诉求还是相对集中的,一方面,希望能够给他们的用户提供更优质的体验,需要解决分布于不同运营商网络下的终端用户的跨网访问效率、广泛分布用户的一致性访问体验、中心部署源站成本高昂、突发流量下的弹性扩展以及弱网环境下传输性能等等方面的问题;另一方面,客户希望业务是安全稳定运行,这种稳定就包括了提供SLA可靠性、解决网络DDoS和CC攻击、保护内容不被恶意爬取、劫持、篡改等等。综上所述,用户体验和安全稳定是企业的两大核心诉求。

CDN是企业常用的互联网服务之一,主要提供内容分发服务。CDN能帮助用户缓解互联网网络拥塞、提高互联网业务响应速度、是改善用户业务体验的重要手段。同时,CDN使用反向代理技术,能有效的保护用户源站,避免源站暴露进而遭到黑客的攻击。CDN海量的服务节点天然给用户提供了一定的防护能力,继而获得相应的稳定性提升。默认情况下会用整个CDN大网的网络能力和计算能力,有效的对抗攻击者的攻击。

关注阿里云Edge Plus微信公众号,看5G、边缘计算、CDN和通信干货分享

关于CDN安全的那些误区和问题

前文提到了CDN节点可以为用户提供一定的防护能力,其实在使用CDN过程中会有一些常见的误区,比如:第一个误区是有些用户认为用了CDN之后有效保护源站就不需要额外购买安全服务了,甚至可以使用CDN平台来抵抗攻击;第二个误区是用户认为其用了CDN后无需进行任何额外配置,有攻击CDN自动来抵抗,和其没什么关系,对其没什么影响。

伴随这两种误区就会产生一些问题,比如:第一个问题是当用户遭到DDoS攻击,CDN为保证整体服务质量,会将用户业务切入沙箱,网站业务质量受到较大影响,且影响该域名后续的CDN加速服务质量。第二个问题是当用户遭到刷量型CC攻击,由于请求非常分散,CDN认为是客户正常业务的流量增长,因此尽力提供服务,造成短时间大量带宽突增,客户要为此付出大额账单,造成较大的经济损失。

正确地认识网络攻击

客户业务线上运行过程中,不可避免会遇到网络安全威胁,DDoS攻击是最典型的。DDoS的核心原理是什么?是如何发展演进的? 我们有必要进行详细的了解,以便于更好的在CDN上给与其防护。

屏幕快照 2020-12-17 下午5.02.10.png

DDoS的核心目标是造成业务损失,受害目标无法对外进行服务,进而造成业务损失。其本质是消耗目标系统的资源,具体有2种实现方式:一种叫做拥塞有限的带宽,第二种叫耗尽有限的计算资源。本质上CDN给用户提供的就是这两种资源。一个是分发的带宽资源,第二个是在节点上提供相应的算力,所以攻击本身就是在消耗这个。

其中三类攻击包括:

一、网络流量型攻击
这种攻击会利用到一些协议漏洞,比如UDP、SMP协议,很轻易地构造出过载大报文来堵塞网络入口,这就导致正常请求很难进入。

二、耗尽计算资源型攻击——连接耗尽

最典型的就是网络层CC,利用HTTP协议的三次握手,给服务器发一半的三次握手请求,后续的一些请求不再发了,所以服务器端就会等待,进而占用大量的资源,导致服务器连接资源直接被耗尽,服务不可持续。

三、耗尽计算资源型攻击——应用耗尽

典型是是7层的应用层CC攻击。这种攻击发出的攻击请求,从报文来看,看不出他有非常明显的畸形或有害性,很难去做相应的判断。由于七层CC都是正常的业务请求,同时CDN只是缓存内容,并不了解业务逻辑,同时业务也经常会遇到客户业务突发,当CC攻击时,如果无特殊的错误码异常,从CDN角度来看会和正常的业务上量是一样的,因此也会尽力服务。进而CC攻击会形成突发带宽峰值,进而产生高额账单,因此给客户造成了较大的经济损失。

DDoS攻击的演进

了解到攻击实质之后,再看看整个攻击的演进过程,便于大家更好地了解攻击原理。整个的演进大概分为四个阶段:

第一个阶段:DoS攻击

基于一个单点的服务器进行攻击流量的发送。这时流量规模在500Mbps到10Gbps之间,由于传统服务器的硬件、服务性能、带宽水平都有限,在这样的流量规模之下,就可以造成服务器的全面瘫痪,甚至终止。通过对传统硬件设备直接进行流量清洗的单点防护,再回到服务器,就可以达到防御目的。同时,也可以对相应的原IP进行封禁。

第二阶段:DDoS攻击

也就是分布式的DoS攻击,它的攻击源就不是单点的服务器,而是一群僵尸网络,黑客通过系统漏洞在网络上抓取大量肉鸡,运用这些肉鸡在不同的网络里去同时发起攻击,造成的带宽规模可能从10Gbps到100Gbps。对这种分布式的僵尸网络攻击形式,通常防御手段就是用多点的大流量清洗中心去做近源的流量压制,之后再把清洁流量注回到服务器。

第三阶段:DRDoS,分布式反射型拒绝服务攻击。

互联网上的肉鸡抓取可能存在困难,但一旦被发现,很快这个周期就会丢失掉。所以这些僵尸网络在控制一定的这个周期数量后,会通过反射的机制向目标主体进行攻击。反射的主要机制是互联网上公共的真实存在的设备,在处理协议的过程中可能会形成一个攻击流量成本的放大,比如请求NTP 10K返回50K,请求的原地址改成目标服务器,所有终端都以为受害主机在请求,所有请求都会回到受害主机。整个流量可能会从100Gbps到2Tbps之间,所以对于这种攻击一个是要在很多的协议源头去做流量的阻断,另一个就是还要通过全球化分布式的DDoS进行相应防御。

第四阶段:未来发展

未来,5g、IPv6和IoT技术发展,会导致单位攻击能力翻10倍、公网IP数量指数增长以及潜在肉鸡无处不在,都是我们将要面临的一些风险。所以未来的攻击规模可能会超过2Tbps甚至更高。

CDN场景中应该怎么去更加有效的防护?

沿着以上两个核心场景来看,一个是拥塞带宽,一个是耗尽资源。

屏幕快照 2020-12-17 下午5.02.33.png

对于拥塞有限带宽入口这类攻击,本质上要在流量上Hold住。CDN天然具有丰富的节点资源,使用分布式的网络将攻击分散到不同的边缘节点,同时在近源清洗后返回服务端。

对于耗尽有限资源资源这类攻击,本质上要做到攻击的快速可见,并且能够把相应特征进行阻断。单纯依靠CDN不能特别有效的解决问题,需要通过CDN节点上的配置,完成智能精准检测DDoS攻击,并自动化调度攻击到DDoS高防进行流量清洗。这时候需要用户购买高防抗DDoS的产品。

本质上标准的CDN仍然是一个内容分发产品,不是安全产品,也没有承诺安全方面的SLA,因此,如果用户需要更加专业的安全服务,还是需要选择云安全的DDoS等产品,形成多级的安全防护体系,来更加有效的进行风险防御。

那么,具体阿里云CDN结合云安全的产品之后,能够提供怎样的安全防护体系呢?

屏幕快照 2020-12-18 下午5.43.25.png

政企安全加速解决方案 是一套基于基于阿里云CDN构建的边缘安全体系,核心能力是加速,但又不止于加速。加速是整体方案的基础,依托于阿里云全站加速平台,通过自动化动静分离,智能路由选路,私有协议传输等核心技术,提升静动态混合站点的全站加速效果。在加速基础之上,为客户提供WAF应用层安全、DDoS网络层安全、内容防篡改、全链路HTTPS传输,高可用安全,安全合规 6大方面安全能力,从客户业务流量进入CDN产品体系,一直到回到客户源站,全链路提供安全保障,保障企业互联网业务的安全加速。

CDN边缘安全——网络层与应用层双重安全

一、网络层

银行,证券,保险等金融行业的业务线上化已经成为常见的业务办理模式,客户的 金融网银,网上业务办理业务,一般情况下Web攻击较多,遭遇DDoS网络攻击的场景并不常见,但一旦发生DDoS攻击,企业核心互联网业务就面临瘫痪风险,将会严重影响企业品牌,产生重大资损。因此一般情况银行客户都在源站侧部署DDoS防护能力,同时在CDN边缘分发侧,也希望CDN能利用大量分布式的节点优势,提供边缘DDoS防护能力,在边缘检测DDoS攻击并实现攻击阻断,保护源站不受到攻击冲击。最终实现,无攻击CDN分发,有攻击DDoS防护。

在CDN的边缘节点具备基础的抗D的防护能力。如果用户当前的攻击流量比较高,达到了用户设置的阈值之后,就可以自动化的检测到当前的攻击的流量,并且通过智能调度的方式,将当前恶意的请求全部解析到高防的IP。高防IP的产品去做流量的攻击检测,以及攻击的清洗防护,整个过程是自动化实现。

整个业务流程是:

•客户需要分别开通CDN和DDoS高防产品,并将域名配置在两个产品中,其次,将高防侧生成的调度CNAME在CDN侧进行联动配置。配置后即可实现无攻击CDN分发,有攻击DDoS防护的效果
•在遇到攻击时,首先,自动化丢弃非80|443端口非正常流量,第二,CDN会智能识别网络层攻击行为,精准,实时将DDoS攻击区域流量切换到高防服务,整个过程完全自动化,无需用户介入;第三,在高防侧用户可以享受最高超过1T的DDoS防护和清理能力,以及超过250W QPS的防护能力
•当攻击结束后,CDN将自动将流量重新调度回CDN网络,实现正常业务分发

如上就能够完整平滑的实现CDN与高防的联动,实现无攻击CDN分发,有攻击DDoS防护。

屏幕快照 2020-12-18 下午5.43.37.png

二、应用层

零售客户通过线上电商进行产品宣传和售卖已经成为一种常见的销售模式,无论是企业官网,电商平台,运营活动页面,只要是面向互联网业务无可避免的,经常经常遭遇Web,CC,刷量攻击,对客户体验,稳定性产生较大影响。客户在源站部署WAF能力,保护源站。同样,在CDN分发侧,希望在云端进行Web安全防护。客户会优先开启观察模式,在云端感知到网络攻击风险,然后,逐步灰度源站策略,实现多级防护结构,保证源站安全。

阿里云CDN团队与云安全团队合作,将沉淀多年的云WAF能力,注入到CDN边缘节点,实现WEB攻击的边缘安全防护。

屏幕快照 2020-12-18 下午5.43.44.png

大家都知道,CDN产品一般由2层节点构成多级分发体系,边缘节点更靠近客户,回源上层节点与源站交互获取源站内容,回源节点和边缘节点之间形成多级缓存,提升命中率。当前,云WAF能力已经注入到CDN回源节点,针对动态回源请求,防护OWASP Top10威胁,例如:SQL注入,XSS跨站等常见Web攻击;同时客户还能享受到0 DAY漏洞更新能力,24小时内提供高危漏洞虚拟补订防护。

然而仅能解决回源防护就足够了吗?如果出现恶意刷量,恶意爬取,大文件CC攻击场景,仅会对CDN边缘节点产生影响,请求不经过L2,会产生大量下行带宽,极大提升客户的带宽成本。所以,CDN在边缘节点提供频次控制,机器流量管理能力。通过频次控制能力,用户可以自定义防护规则,有效识别异常的高频访问,边缘抵御CC攻击。通过机器流量管理能力,识别恶意爬虫,刷单软件等机器流量,有效降低下行带宽,节约成本。

通过以上两层能力,CDN可以为用户提供较为立体的应用层防护能力。

关注阿里云Edge Plus微信公众号,看5G、边缘计算、CDN和通信干货分享

查看原文

赞 0 收藏 0 评论 0

认证与成就

  • 获得 27 次点赞
  • 获得 2 枚徽章 获得 0 枚金徽章, 获得 0 枚银徽章, 获得 2 枚铜徽章

擅长技能
编辑

(゚∀゚ )
暂时没有

开源项目 & 著作
编辑

(゚∀゚ )
暂时没有

注册于 2016-07-15
个人主页被 1k 人浏览