多项式回归(Polynomial Regression)(附代码)

2016-12-01
阅读 3 分钟
11.8k
多项式回归有个很重要的因素就是指数(degree)。如果我们发现数据的分布大致是一条曲线,那么很可能符合多项式回归,但是我们不知道degree是多少。所以我们只能一个个去试,直到找到最拟合分布的degree。这个过程我们可以交给数据科学软件完成。需要注意的是,如果degree选择过大的话可能会导致函数过于拟合, 意味着对...

A Brief Introduce of Database Index(索引简介)

2016-12-01
阅读 5 分钟
2.6k
这是我写的一篇研究生申请的writing sample,关于数据库索引的,对关系型数据库的索引从数据结构到用途再到作用对象简单分析了一下,因为我发现在实际工作中,index是个好东西,但是很多DBA并不能找到合适的index使用,这样会使查询效率提高得不大,甚至影响查询效率。所以这篇文章希望帮助大家理解一下index。我没有在...

简单线性回归(Simple Linear Regression)(附代码)

2016-11-30
阅读 4 分钟
9.7k
简单线性回归是最基础的一种回归模型,自变量只有一个,函数曲线为直线,因变量为连续型,自变量可以是连续的或者是离散的。函数表示如下: 其中 y 是因变量, x是自变量, β0 和 β1 属于起始值和系数,ε 为偏移量,为了使得到的函数模型更加准确,最后会加上偏移量。 线性回归一般使用最小二乘法来求解函数模型级求解 β...

机器学习(三):线性回归(polinomial regression多项式回归)

2016-11-29
阅读 5 分钟
13.1k
首先我们需要明确一个概念,我们讨论的线性或者非线性针对的是自变量的系数,而非自变量本身,所以这样的话不管自变量如何变化,自变量的系数如果符合线性我们就说这是线性的。所以这里我们也就可以描述一下多项式线性回归。

机器学习(二):线性回归(simple and multiple)

2016-11-20
阅读 8 分钟
7.5k
写之前先声明一下,[链接] 是我的个人github page,所以同样的文章我会在这上边先发。本来我想机器学习系列用四到五篇文章结束,但是这一篇介绍回归的文章写了刚写了简单线性回归和多元线性回归就已经很长了为了读者阅读方便,我会分几篇文章来介绍。关于数据集(data set)我不会在这里放出来,因为这个系列是介绍性质...

机器学习(一):入门

2016-11-19
阅读 6 分钟
8.4k
这是一个机器学习的系列,偏数据分析方向,未来或许会写一些偏人工智能方向的机器学习的文章。这个系列将会详细介绍常用的机器学习模型和算法,像是线性回归和分类算法。最后会介绍机器学习方向合适的一些可视化工具。