比较型排序与非比较型排序算法的总结

2016-09-12
阅读 12 分钟
5.1k
排序方法 冒泡排序 In [1]: {代码...} Out[1]: {代码...} In [21]: {代码...} Out[21]: {代码...} 复杂度分析 平均情况与最坏情况均为 $O(n^2)$, 使用了 temp 作为临时交换变量,空间复杂度为 $O(1)$. 选择排序 核心:不断地选择剩余元素中的最小者。 找到数组中最小元素并将其和数组第一个元素交换位置。 在剩下的元素...

[林轩田]15-验证的方法

2016-08-19
阅读 2 分钟
2k
演算法选方面选择:PLA, pocket, linear regression, logistic regressioniteration的次数:100,1000每步大小: 1,0.01特征transform: linear线性的、quadratic二次的,poly-10 10次多项式,legendre-poly-10 10次垂直多项式。 regulation选什么: L2 regularizeer L2范数,L1范数,对称范数。。。规范化的权重λ 0,0.01,1

[林轩田]14-规范化

2016-08-18
阅读 5 分钟
2.6k
监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们的训练数据,而规则化参数是防止我们的模型过分拟合我们的训练数据。 我们需要保证模型“简单”的基础上最小化训练误差,这样得到的参数才具有好的泛化性能...

[林轩田]13-过拟合的危害

2016-08-17
阅读 3 分钟
3.3k
[TOC] 什么是过拟合 如下图我们本来想要的是蓝色的二次曲线,取了五个点,但是我们使用红色的四次曲线穿过这5个点,使得 $$ E_{in} $$ 很小 但是我们从图像上可以看到 $$ E_{out} $$ 是很大的。 overFitting: fitting指的是通过学习使得 $$ E_{in} $$ 很小。 overFitting表示 虽然$$ E_{in} $$很小,但是 $$ E_{out} $$...

[林轩田]12-非线性变换

2016-08-16
阅读 3 分钟
2.8k
[TOC] 二次方程的hypothesis 对于非线性的数据分类,如果我们使用线性模型,就会使得Ein很大,分得不好。 对称中心在原点的二次方程 现在我们考虑如何用二次方程(圆的方式)来进行separate: 我们可以使用半径平方为0.6的圆可以将它分开 。 这里我们进行非线性的变换,实现坐标系的变换。从x空间变到z空间。在x系里面圆...

11-分类的线性模型

2016-08-14
阅读 3 分钟
1.9k
s表示用这个模型得出的分数,取值范围应该跟原来是一样的,线性回归的s=wx取值范围为实数R,logistic回归的取值范围为0-1(一个概率)ys:合起来表示正确的分数

logistic regression

2016-08-12
阅读 4 分钟
2.6k
这里我们的二值分类和硬性二值分类的数据是一样的,但是目标函数是不一样的。而软性二值分类所真正需要的数据是跟目标函数一样的概率,但是我们收集的数据却是分类的结果。

cpp11新特性详解与应用

2016-08-09
阅读 11 分钟
2.5k
以下是我最近几个星期学习c++11做的一些记录,包括收集的一些信息,整理的相关概念和写的一些测试代码。具体相关代码我写了24个cpp文件,托管在来github上面cpp11,记录一下。

Git 命令使用心得

2015-06-11
阅读 4 分钟
5.7k
最近学习了一下git命令来操作一下库,发现git命令虽然不多(当然也不算少),但是它们组合起来功能很强大,更重要的是很多命令在不同的状态下发挥的效果不一样,本博文总结了一下git命令,并详细说明了一些命令的使用场景。