原文:http://cs229.stanford.edu/not...
让我们从几个有监督的学习问题的例子开始。假设我们有一个数据集,显示来自俄勒冈州波特兰的47个住宅的起居面积和价格:
Living area(feet^2) Price(1000s)
2014 400
1600 330
2400 369
1416 232
3000 540
... ...
我们可以绘制这些数据:
鉴于这样的数据,我们怎样针对他们居住面积的大小来预测波特兰其他房屋的价格?
$$ 在这里我们先规定一下符号和定义,它们在将来还会用到。我们将使用x^{(i)} 来表示输入input变量 $$
$$ (在这个例子中就是房屋的面积),这也被称作输入的特征(feature)。使用y^{(i)}来表示输出output或者 $$
$$ 目标变量,即我们想要去预测的值(这个例子中是指价格)。我们用来学习的数据集是含有m个训练样本 $$
$$ \left \{ \left ( x^{(i)},y^{(i)};i=1,\cdots ,m \right ) \right \}的列表——被称作是训练集(training set)。注意上标(i)在符号表示中只是 $$
$$ 训练集的 索引(index) 记号,与数学中的求幂无关。另外我们使用X来表示输入值的空间,使用Y来表示输出值 $$
$$ 的空间。在这个例子中,输入和输出空间都是实数域,即X=Y=R。 $$
$$ 接下来对监督学习问题给出一个更加正式的描述:我们的目标是,给定一个训练集,通过训练得到一个函数 $$
$$ h:X\rightarrow Y,使得h(x)对于y的真实值而言是一个好的预测结果。由于历史的原因,函数h被称为假设 $$
$$ (hypothesis)。如下图所示,整个过程是是这样的: $$
当我们试图预测的目标变量是连续(continuous)的,就像我们的房屋面积-价格的例子一样,这样的学习问题被称为回归(regression)问题。当 y 只能取一小部分离散(discrete)值时(比如给定房屋面积,我们要来确定这个房子是一个住宅还是公寓),这样的学习问题被称为分类(classification)问题。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。