揭秘:为什么一家风控公司要通过网页重要性分析来进行机器学习?

2018-01-26
阅读 3 分钟
2k
我们是一家业务风控公司, 公司的一项主要业务是提供给客户私有化部署的风控系统和长期的风控分析服务,最后提供给客户的产出,简单归纳来说就是哪些ip,哪些用户,哪些设备,哪些页面存在风险,并提供确实的证据。因为客户的需求、访问流量、内部架构情况各不相同,前期双方对接中涉及爬虫、订单、营销活动等大量业务信...

实战:从Python分析17-18赛季NBA胜率超70%球队数据开始…

2018-01-03
阅读 3 分钟
3.2k
12月19日,科比再次站在斯台普斯中心球馆中央,见证自己的两件球衣高悬于球馆上空。作为一个正奋战在 Python 之路上的球迷,开始了一次数据分析实战,于是,以分析球赛数据为起点的操作开始了......

手把手教你用Python爬虫煎蛋妹纸海量图片

2017-11-29
阅读 2 分钟
3.4k
最近听说煎蛋上有好多可爱的妹子,而且爬虫从妹子图抓起练手最好,毕竟动力大嘛。而且现在网络上的妹子很黄很暴力,一下接受太多容易营养不量,但是本着有人身体就比较好的套路,特意分享下用点简单的技术去获取资源。以后如果有机会,再给大家说说日本爱情动(大)作(雾)片的种子搜索爬取,多多关注。

用Python做数据分析:Pandas常用数据查询语法

2017-10-25
阅读 3 分钟
3.3k
在使用Pandas之前,大多数数据分析师已经掌握了Excel和SQL,并且在刚上手Pandas时会经常习惯性想到“老办法”。"如果谁能把常用的数据查询语法做个对比就好了 ",我也曾不止一次地想享受前人的成果,无奈发现网上的文章侧重不同且深浅不一,还涉及到一些Pandas新老版本的问题,于是决定自己动手。

如何从零设计结构清晰、操作友好的权限管理模块

2017-10-09
阅读 5 分钟
2.2k
在开讲之前,先列举几个场景:场景一Hi,今天那个销售总监说要设立几个销售经理的职位,然后每个经理管理自己小组的销售员,我们把用户的销售数据按组分开来吧。场景二Mario,今天那个市场部的说要分立几个板块,公众号的管理所有文章投稿评论,推广管各平台宣传策略方案与实施,对,竞品的相关资料数据也要分立出来,我...

浅谈如何建立互联网风控系统

2017-08-01
阅读 4 分钟
3.3k
弹指间,一起创业已有大半年。这大半年间,累与成果并存,痛并快乐着,这自不用多提,应该是这一行从业者的普遍感受了。现在每每反思以往,总结不足,其中一条就是技术团队过于封闭,闷着头干活,发声不足,既不利于引入别人的好的经验,也没法将自身的成果拿出去接受批判,这其实与我们的技术宗旨是不符合的,还是需要...

埋点进化论:从埋点到无埋点

2017-07-27
阅读 2 分钟
3.6k
鲁迅先生说:世界上本没有埋点,需要数据的人多了,也就有了埋点。 埋点的诞生 在最初的互联网世界中,并没有埋点的概念。大家并不关心流量从哪里来,用户在网站上做了什么事,一切都是野蛮生长。 随着业务的增长,访问网站的人越来越多,用户的需求越来越复杂,运营人员就需要一些关键的数据作为参考。 一般来说,互联网...

babel: yet another rpc, but far beyond rpc(下)

2017-07-21
阅读 1 分钟
1k
(图片源自网络) 4框架生态 实际上,在做babel的同时,我也在探索如何更好的利用技术工具来影响团队组织架构。以babel举例,实际上整个框架生态分为三类人: 业务研发。 在框架上提供服务,或调用他人的服务。由于绝大部分的通讯细节已经封装好。业务研发可以更加专注于他的业务方面的逻辑。 框架研发。 研发babel通讯...

babel: yet another rpc, but far beyond rpc(中)

2017-07-17
阅读 4 分钟
1.4k
从之前的描述,已经可以看出我们会采用RPC over MQ的方式做底层实现,类似方法调用的通信语义会在client和server两端的库中作封装。

适用于初创公司的超轻量级smtp服务配置

2017-07-12
阅读 3 分钟
8.8k
smtp 是一种常见的服务,提供了程序自动化邮件外发的可能。不光是用于产品向客户的通知服务;更多的是用在企业内部的信息工具,比如我们就有 sentry / confluence / zulip 等等非常多的开源工具,都需要配置 smtp 来实现内部信息的联动。当前最简单的邮箱使用方式是使用开放的邮箱服务,比如现在很多小型企业在使用的企...

做好了监控报警,创业公司如何搭建强壮的SaaS服务

2017-07-11
阅读 7 分钟
2.8k
数据共同指向一点,越来越多的交易行为正从线下转到线上,由传统到互联网化。而当互联网给我们的生活带来便利和高效的同时,又带来了什么呢?那就是业务风控的压力,并不是所有的交易都是安全的,并不是所有的用户都是可靠的。如何在极短的时间内在成千上万笔交易以及成千上万个用户中迅速定位风险、降低损失,我们都知...

CSO进击之路:初来乍到,业务安全新官上任做点啥

2017-06-12
阅读 2 分钟
1.4k
人才市场每年的三月四月份被称为金三银四,为传统意义上的人才招聘高峰期。对于企业安全市场来说,人才稀缺,每年基本也就是圈子里那么几个人跳来跳去,对业务安全的中层管理来讲,人才更少,同时被几十个猎头盯着随时手上都有 offer 的情况也是非常常见的。那么对于业务安全人员,在正式进入一家新公司前,不太可能了解...

搭建风控系统道路上踩过的坑合集

2017-06-05
阅读 7 分钟
3.7k
从业近10年,大大小小参与了3家公司不同领域的风控系统的设计,从前到后把风控系统所有环节都细细的琢磨过,然而至今仍然感觉刚刚一只脚踏进门而已。

一个CPO的心得分享:搭建风控系统道路上踩过的坑04-风险分析

2017-05-31
阅读 2 分钟
2.8k
风控系统和大部分的产品项目一样,最终需要对领导层汇报这个项目为公司带来了什么价值,这是评估项目成功与否的要素; 另外是哪里做的不够好,如果改善了能带来更多的价值,给出了预期才有后续资源的补充,整个项目才能转起来形成一个良性循环。 现在开始说说这个系列的最后一话: 如何对风控系统进行效果评估与优化 与...

Python机器学习工具:Scikit-Learn介绍与实践

2017-03-20
阅读 4 分钟
9.6k
机器学习关注的是: 计算机程序如何随着经验积累自动提高性能。而最大的吸引力在于,不需要写任何与问题相关的特定代码,泛型算法就能告诉你一些关于数据的秘密。

初创公司如何实现 Ansible 多机房自动部署发布

2017-02-23
阅读 6 分钟
9.5k
一个完整的程序开发流程少不了部署发布这个环节,而部署发布是一个重复的过程,最基本的操作包含停止系统服务、更新软件包、重启系统服务,复杂的还需要做好监控、灰度发布、回滚等。在只有少量服务器的情况下,大多数运维人员会选择手动更新,减少自动化部署发布的开发成本。而当服务器数量增加,甚至服务器可能存在于...

高效利用Sentry追踪日志发现问题

2016-12-22
阅读 4 分钟
11k
程序运行的日志是一个必不可少的东西,可能是一些系统信息,比如 gc 的情况;可能是一些正常的模块处理信息,比如最近更新的配置;还可能是一些在程序运行中,我们不希望出现的错误所带来的信息。通过日志,可以知道我们的程序是不是在正常地运行,看到错误日志,我们还需要利用日志排查错误。

搭建风控系统道路上踩过的坑03-阻断风险 | 一个CPO的心得分享​

2016-12-05
阅读 2 分钟
2.1k
本系列的上一篇文章搭建风控系统道路上踩过的坑02-风险分析,我们介绍了在采集信息后如何去分析这些数据产出风险事件,而产出的报警已经脱离了业务系统并不能被采用的。 说白了:分析出来的东西不能光自己看着High,还得去阻拦这些风险才能真正产生业务价值。 在开始前,我们还是回顾下业务风控主要做的四件事: 1、拿到...

搭建风控系统道路上踩过的坑02-风险分析 | 一个CPO的心得分享

2016-11-21
阅读 2 分钟
4.1k
上一章《搭建风控系统道路上踩过的坑01--信息采集》我们介绍了第一点,如何去获取足够多的数据,而接下来的事情就是要创建一个机制去灵活的处理这些信息,为自动分析捕捉风险事件提供基础原料,进而借助规则引擎从中分析出风险事件。

搭建风控系统道路上踩过的坑01-信息采集 | 一个CPO的心得分享

2016-10-13
阅读 2 分钟
2.6k
从业近10年,大大小小参与了3家公司不同领域的风控系统的设计,从前到后把风控系统所有环节都细细的琢磨过,然而至今仍然感觉刚刚一只脚踏进门而已。

Zulip聊天机器人Python开发

2016-09-12
阅读 3 分钟
8.8k
就Zulip而言,该公司对消息的处理专注于会话,而不仅仅是基本的“聊天”。因此,消息流中包含主题和线程式回复,每个主题可以包含多个细分主题。

Python工具分析风险数据

2016-08-16
阅读 6 分钟
6.5k
随着网络安全信息数据大规模的增长,应用数据分析技术进行网络安全分析成为业界研究热点,小安在这次小讲堂中带大家用Python工具对风险数据作简单分析,主要是分析蜜罐日志数据,来看看一般大家都使用代理ip干了一些啥事。