神经元网络
神经网络的模型:
一个神经网络模型可分为三层:以预测T恤是否会称为顶级热销商品为例
- input layer(输入层):特征变量(feature variance) 有price,shipping cost,marketing,material四个,共同组成一个输入向量x
- hidden layer(隐藏层):具有三个神经元:afford ability,awareness,perceived quality,每一个神经元都可能是由输入层中的特征值的一个或多个共同决定(可以用函数表达)
- output layer(输出层):由隐藏层的特征值组成的特征向量a传递出来,并作出最终的预测
在一个多元神经网络中,隐藏层可以有多层,每层的神经元个数不定
神经网络中的网络层
神经网络的具体工作原理:
以三层网络为例:每一层都输入一个数字向量,并对其应用一堆逻辑回归单元(神经元),从而计算出另外一个数字向量,一层一层的进行这种工作,直到得到了最终层的计算输出结果,简单的工作原理图如下所示,其中参量右上角[ ]的上标数字表示所在层数- layer 0
- layer 1
- layer 2
更复杂的神经网络
计算每一层的激活值:
神经网络向前传播
- 有一个8*8的矩阵,255代表白色像素,0表示黑色像素,计算能输出数字1的概率
- 使用一个神经网络模型,隐藏层layer1有25个单元,隐藏层layer2有15个单元,现在计算特征向量a1的值,其中x可以用a0表示:
a1的计算
a2的计算
a3的计算
计算a3的输出值,若>=0.5,则预测y-hat的值1,即可正确输出数字1的图像,反之则为0,不能正确输出数字1的图像
f(x)表示逻辑回归或者线性回归的输出 这种神经网络架构称为向前传播(forward propagation):这种架构的神经网络的特点是随着靠近输出层,隐藏层的神经单元会减少
用代码实现推理
以上是使用Tensorflow进行的神经网络的推理
Tensorflow和numpy的转换搭建一个神经网络
单个网络层上的向前传播
向前传播的一般实现
强人工智能
人工只能的分类:
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。