TF-IDF、词袋模型与特征工程

2017-10-09
阅读 6 分钟
10k
词袋模型:如果一个单词在文档中出现不止一次,就统计其出现的次数,词袋在词集的基础上加入了频率这个维度,使统计拥有更好的效果,通常我们在应用中都选用词袋模型。

K-means在Python中的实现

2017-08-26
阅读 3 分钟
14.8k
K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,相同簇中的数据相似度较高,不同簇中数据相似度较低。

基于svm算法的简单XSS攻击识别模型

2017-04-13
阅读 3 分钟
8k
学习机器学习已经有段时间了,心里一直在寻思着如何将其运用在安全上,前几天刚好看到兜哥的那篇文章,于是花了两天时间实现了一个简单的基于svm的xss过滤器,这里做一个比较接地气的分享。

PHP微型框架设计

2017-02-04
阅读 4 分钟
2.9k
一、框架整体分析在实现一个框架之前,我们需要了解这个框架应该达到一个怎样的效果,按照传统框架的思路,大致可以总结出以下这么几条:1.实现MVC架构,将控制、逻辑、视图层进行分离。2.封装各种函数及功能模块,实现一处编写,多处调用,减少代码冗余。3.便于扩展,可方便的引入外部扩展库,对自身框架进行增强。4.选...