Stardustsky的安全世界 - SegmentFault 思否

2017-10-09

阅读 6 分钟

9.7k

词袋模型：如果一个单词在文档中出现不止一次，就统计其出现的次数，词袋在词集的基础上加入了频率这个维度，使统计拥有更好的效果，通常我们在应用中都选用词袋模型。

2017-08-26

阅读 3 分钟

14.6k

K-means是机器学习中一个比较常用的算法，属于无监督学习算法，其常被用于数据的聚类，只需为它指定簇的数量即可自动将数据聚合到多类中，相同簇中的数据相似度较高，不同簇中数据相似度较低。

2017-04-13

阅读 3 分钟

7.7k

学习机器学习已经有段时间了，心里一直在寻思着如何将其运用在安全上，前几天刚好看到兜哥的那篇文章，于是花了两天时间实现了一个简单的基于svm的xss过滤器，这里做一个比较接地气的分享。