深度学习 | 神经网络概论-Demystification

在许多领域中，人工神经网络运用是很广泛的，比如：语音识别、机器翻译、人脸图像识别、癌细胞的识别、疾病的预测和股市走向的预测等领域。

人工神经网络听起来very高大上，其实它本质上是一种有向图，只不过它这有向图有点特殊。

有向图包括节点和有向弧。

人工神经网络神经元其实是有向图的节点，不过是换种代名词。

下面我谈一下这种有向图的特殊性：
  1．所有的节点是分层的（同一层节点没有弧相互连接，不能跨过一层到上上层）（X,S,Y）
  2．每条弧上有权重（权值）（W）


如下图（典型的人工神经网络（三层））：

最下面的一层是输入层，最上面的一层是输出层，中间不可见的是隐含层；

所谓的“智能”其实归结为在多维空间进行模式分类的问题；

<div align=center></div>

如果把不同输出节点上得到的值看成是一种概率分布，那实际上的人工神经网络就等价于一个概率模型。

<div align=center></div>

有监督的训练：先有一批标注好输入数据x和对应输出值y的数据集，求解权重参数w，根据人工神经网络得到的输出值（分类结果）和实际训练数据中的输出值之间的差距（成本函数：可以定欧几里得距离），然后可采用常用的梯度下降法找到让成本达到最小值的参数。

无监督的训练：只有输入数据x，而没有输出数据y。根据具体的运用设计成本函数，由于人工神经网络要解决的是分类问题，所以成本函数要得出的结果是同一类问题尽量靠近，不同类问题尽量远离。定义了成本函数后，就可以用梯度下降法进行无监督的参数训练。