SF
干货技术博文
干货技术博文
注册登录
关注博客
注册登录
主页
关于
RSS
Flink on Zeppelin (4) - 机器学习篇
数据库知识分享者
2020-03-20
阅读 3 分钟
Flink 在机器学习这个领域发力较晚,社区版没有一个完整的机器学习算法库可以用,Alink[1]是目前 Flink 生态圈相对比较完整的机器学习算法库,Alink 也在往 Flink 社区贡献的路上。今天我主要讲的就是如何在 Zeppelin 里使用 Alink。
防删库实用指南 | 只需一步,快速召回被误删的表
数据库知识分享者
2020-03-20
阅读 2 分钟
数据库的一些非常不错的企业级功能都是“养兵千日,用兵一时”,比如Oracle 10g中的回收站(Recycle Bin)功能,可以在特殊情况下发挥特种兵的功能,比如当你删除一个表空间、一个用户(Schema)时,可能会删除很多的表,包括你不想删除的一些表。
在阿里,40岁的奋斗姿势
数据库知识分享者
2020-03-20
阅读 5 分钟
在阿里,什么样的年纪可以称为老呢?35岁? 在云网络,有这样一群人,他们的平均年龄接近40,却刚刚开辟职业生涯的第二战场。 他们的奋斗姿势是什么样的呢?
DataWorks百问百答01:数据同步该用什么资源组
数据库知识分享者
2020-03-20
阅读 1 分钟
很多用户在使用数据集成建立同步任务时,往往都会困惑一个设置,即“资源组设置”。 大家常有的疑问是“资源组是用来做什么的?跟网络之间什么关系?我该选择那种资源组?” 下面本文给您一个简要的介绍。
任务不再等待!玩转DataWorks资源组
数据库知识分享者
2020-03-20
阅读 7 分钟
DataWorks提供了三种资源组的能力:独享资源组、自定义资源组和默认资源组,很多开发者在使用资源组时经常会碰到各类情况,到时候任务运行失败或者延迟,例如: 1. 正在使用默认资源组,任务经常要等待 2.购买错了资源组类型(独享数据集成资源组与独享调度资源组),使用不了 3.购买错了地域(杭州开通DataWorks购买了...
网聚宝上云 帮助企业实现大数据变现 让生意更简单
数据库知识分享者
2020-03-19
阅读 4 分钟
我们是上海云贝网络科技有限公司,正式成立于2011年,是一家专注于全域大数据应用的服务商,多元化的产品矩阵,专业团队协同运作,为企业提供专业“大数据+”升级服务,帮助企业构建数字化商业能力,实现大数据变现。
网鱼网咖通过大数据架构 极致洞察会员偏好
数据库知识分享者
2020-03-19
阅读 3 分钟
我们网鱼网咖成立于1998年,致力于打造多人游戏空间,为顾客提供极致的游戏上网体验。我们公司的业务范围覆盖连锁上网服务门店、电脑及周边产品、游戏社交软件等,为加盟伙伴提供一体化的解决方案。我们公司旗下拥有网鱼网咖、风蝶网咖、网鱼电竞、虎猫电竞、诺诺茶、YVR六大连锁品牌。网鱼网咖发展快速,到现在为止门店...
小红唇APP通过大数据计算平台21天内搭建推荐系统
数据库知识分享者
2020-03-19
阅读 4 分钟
小红唇App是国内最大的一款针对15-25岁年轻女性的垂直视频分享社区和社交化电商平台,业务模式为短视频美妆社区电商。我们为用户提供了丰富的平台内容、活跃的社区生态和优质的产品选择。
MySQL实战—更新过程
数据库知识分享者
2020-03-18
阅读 4 分钟
本文属于个人备忘录,主要是极客时间《MySQL实战45讲》学习笔记。 MySQL实战—更新过程 一条查询语句的执行过程一般是经过连接器、分析器、优化器、执行器等功能模块,最后到达存储引擎。那么更新语句又是如何执行? 和查询流程不同的是,更新流程涉及两个重要的日志模块:redo log(重做日志)和 binlog(二进制日志)。...
系列文章:Kubernetes日志采集最佳实践
数据库知识分享者
2020-03-18
阅读 6 分钟
上一期主要介绍Kubernetes日志输出的一些注意事项,日志输出最终的目的还是做统一的采集和分析。在Kubernetes中,日志采集和普通虚拟机的方式有很大不同,相对实现难度和部署代价也略大,但若使用恰当则比传统方式自动化程度更高、运维代价更低。
系列文章:Kubernetes日志采集最佳实践
数据库知识分享者
2020-03-18
阅读 6 分钟
上一期主要介绍Kubernetes日志输出的一些注意事项,日志输出最终的目的还是做统一的采集和分析。在Kubernetes中,日志采集和普通虚拟机的方式有很大不同,相对实现难度和部署代价也略大,但若使用恰当则比传统方式自动化程度更高、运维代价更低。
使用CLONE TABLE方式实现同region不同可用区的MaxCompute
数据库知识分享者
2020-03-18
阅读 2 分钟
该文章主要针对于用户同region不同账户之间的MaxCompute数据迁移方式,属于迁移的方式可以有三种方式,一、添加MaxCompute数据源的方式进行数据迁移(该方式针对多个表配置同步节点较为繁琐);二、使用tunnel方式结合代码进行数据的迁移;三、使用clone table进行MaxCompute数据到另一MaxCompute之间的数据迁移。本案例...
疫情之下,中小企业数字化转型之路正在被“激活”?数字化工具的应用或成关键
数据库知识分享者
2020-03-18
阅读 2 分钟
“看来这次是真的过不去了”,疫情发生后的几个礼拜,老林一筹莫展。老林是A企业的创始人,白手起家一步步把A企业打造成了全国知名化妆品连锁品牌,这些年,大部分收入仍是依靠线下门店销售,而现在,企业正在遭遇巨大危机。如何破局? 关键时刻,企业早先布局的新零售解决方案让老林看到了方向。新零售的精髓在于无处不零...
日均万亿条数据如何处理?爱奇艺实时计算平台这样做
数据库知识分享者
2020-03-18
阅读 6 分钟
摘要:本文由爱奇艺大数据服务负责人梁建煌分享,介绍爱奇艺如何基于 Apache Flink 技术打造实时计算平台,并通过业务应用案例分享帮助用户了解 Apache Flink 的技术特点及应用场景。提纲如下:
性能提升约7倍!Apache Flink 与 Apache Hive 的集成
数据库知识分享者
2020-03-18
阅读 5 分钟
导读:随着 Flink 在流式计算的应用场景逐渐成熟和流行,如果 Flink 能同时把批量计算的应用场景处理好,就能减少用户在使用 Flink 时开发和维护的成本,并且能够丰富 Flink 的生态。SQL 是批计算中比较常用的工具,所以 Flink 针对于批计算也以 SQL 为主要接口。本次分享主要介绍 Flink 对批处理的设计与 Hive 的集成。...
IoT助力七喜电脑打造电子制造业标杆示范工厂
数据库知识分享者
2020-03-17
阅读 1 分钟
广州七喜电脑有限公司隶属七喜集团旗下IT产业公司, 是国内老牌的个人电脑制造商,已有22年的品牌历史, 专业从事个人电脑、服务器、云计算设备等产品的研发制造, 也是专业的云计算解决方案提供商和服务商。
万郡租车全面提升系统高可用性、高安全性、高扩展性
数据库知识分享者
2020-03-17
阅读 2 分钟
万郡租车成立于2015年,2017年正式与比亚迪合作投入新能源网约车运营, 目前在上海、广州、南京、杭州、厦门、长沙、合肥等13城投放超过25000台自有运营车辆。我们万郡租车公司有着强有力的市场资源及丰富的租赁管理经验,在全国多个城市享有金牌口碑。
云栖号在线课堂—云服务器&数据库快速入门特辑
数据库知识分享者
2020-03-17
阅读 2 分钟
目前阿里云为用户提供丰富的云服务器ECS产品,不同系列ECS之间存在较大差异,选择合适的ECS,是业务起飞的第一步!除了基础的ECS产品选型和技术揭秘,还有阿里专家分享的ECS+迁云工具轻松上云最佳实践、ECS弹性伸缩最佳实践、云上大数据分析最佳实践以及云上资源编排模板开发实战等等。
行列秩智能科技上云 构建消费金融的资产定价及评级体系
数据库知识分享者
2020-03-17
阅读 2 分钟
行列秩专注于消费金融的资产定价。2019年3月成立以来,行列秩精耕信托,依托自身技术及风控模型能力,创新性地为信托机构的消费金融业务解决风控需求,成功地为各大信托机构降低了风险率,实现了价值最大化,迅速地赢得了业内的一致好评,陆续获评“2019年度信托智能风控引领机构”、“2019年金融科技领军品牌”、“2019年普...
阿里云2020上云采购季,你适合买什么云产品?
数据库知识分享者
2020-03-17
阅读 2 分钟
线下IDC机房成本高? 自建数据库卡、慢,延迟高? 被黑客攻击了怎么办? 今年IT预算没多少? 不知道怎么过等保2.0? 你遇到了哪些问题?来阿里云2020上云采购季!主会场请戳:[链接]
深度解读!阿里统一应用管理架构升级的教训与实践
数据库知识分享者
2020-03-16
阅读 11 分钟
从 2019 年初开始,阿里巴巴云原生应用平台团队开始逐步在整个阿里经济体内,基于标准应用定义与交付模型进行应用管理产品与项目统一架构升级的技术工作。
直击痛点,详解 K8s 日志采集最佳实践
数据库知识分享者
2020-03-16
阅读 6 分钟
导读:上一篇文章主要介绍 Kubernetes 日志输出的一些注意事项,日志输出最终的目的还是做统一的采集和分析。在 Kubernetes 中,日志采集和普通虚拟机的方式有很大不同,相对实现难度和部署代价也略大,但若使用恰当则比传统方式自动化程度更高、运维代价更低。本文为日志系列文章的第 4 篇。
视觉智能开放平台通过函数计算赋能实现多人脸口罩识别!
数据库知识分享者
2020-03-16
阅读 2 分钟
春节期间肺炎疫情来势汹汹,虽然时至今日疫情已得到了有效地控制但是由于复工潮的临近,仍不可掉以轻心。在公共场所对于口罩佩戴的监管依然是关键的疫情防控点,因此口罩佩戴检测是一项核心工作。 疫情当前,阿里云视觉智能开放平台(vision.aliyun.com)紧急推出了基于视觉AI分析的“人脸口罩检测”算法服务,通过对接该...
3 种发布策略,解决 K8s 中快速交付应用的难题
数据库知识分享者
2020-03-16
阅读 13 分钟
软件技术更新换代很快,但我们追求的目标是一直不变的,那就是在安全稳定的前提下,增加应用的部署频率,缩短产品功能的迭代周期,这样的好处就是企业可以在更短的时间内获得产品的价值、更快地获得客户反馈和响应客户需求,从而进一步提升产品的竞争力;除此之外,企业还可以释放更多的资源投入到创新业务的研发上,创...
轻松搭建基于 Serverless 的 ThinkPHP 应用
数据库知识分享者
2020-03-16
阅读 4 分钟
函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传。函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费。函数计算更多信息 参考。 Fun: Fun 是一个用于支持 Serverless 应用部署的工...
MaxCompute费用对账分摊统计,优化使用数据资源
数据库知识分享者
2020-03-13
阅读 16 分钟
利用MaxCompute InformationSchema与阿里云交易和账单管理API 实现MaxCompute费用对账分摊统计 一、需求场景分析 很多的企业用户选择MaxCompute按量付费模式构建自己的数据平台,利用MaxCompute按作业付费的计费模型,在获得高性能的同时避免"IDLE"状态的不必要资源费用支出,仅为实际使用付费。 那么在一个规模比较大的...
Spark在MaxCompute上是如何运行的
数据库知识分享者
2020-03-13
阅读 4 分钟
左侧是原生Spark的架构图,右边Spark on MaxCompute运行在阿里云自研的Cupid的平台之上,该平台可以原生支持开源社区Yarn所支持的计算框架,如Spark等。
MaxCompute 费用暴涨之新增SQL分区裁剪失败
数据库知识分享者
2020-03-13
阅读 2 分钟
现象:因业务需求新增了SQL任务,这SQL扫描的表为分区表,且SQL条件里表只指定了一个分区,按指定的分区来看数据量并不大,但是SQL的费用非常高。费用比预想的结果相差几倍甚至10倍以上。 若只知道总体费用暴涨,但是没明确是什么任务暴涨,可以可以参考查看账单详情-使用记录文档,找出费用异常的记录。 分析:我们先明...
跨年演讲《时间的朋友》如何扛得住百万级流量冲击
数据库知识分享者
2020-03-13
阅读 2 分钟
罗辑思维,著名的知识服务商和运营商,有微信公众号、知识类音视频节目、知识服务得到App等产品。随着品牌日积月累的沉淀,跨年演讲和其相关业务需求不断增大。
小打卡依托 MaxCompute 实现千人千面的推荐算法
数据库知识分享者
2020-03-13
阅读 3 分钟
小打卡是国内最大的兴趣社群平台,每天能够产生上百万条新的内容。在这样超大的内容生产背景下,平台也面临着千人千面、内容分发上的巨大挑战。依托于阿里云MaxCompute,小打卡已经完成了TB级数据仓库方案。在此基础之上,结合机器学习PAI,实现了千人千面的推荐算法。本文将从技术选型、推荐架构、开源算法结合三个方面...
上一页
1
…
More
119
120
121
(current)
122
123
…
More
下一页
上一页
121
(current)
下一页