深度学习 | 神经网络概论-Demystification
在许多领域中,人工神经网络运用是很广泛的,比如:语音识别、机器翻译、人脸图像识别、癌细胞的识别、疾病的预测和股市走向的预测等领域。
人工神经网络听起来very高大上,其实它本质上是一种有向图,只不过它这有向图有点特殊。
有向图包括 节点 和 有向弧 。
人工神经网络神经元其实是有向图的节点,不过是换种代名词。
下面我谈一下这种有向图的特殊性:
1. 所有的节点是分层的(同一层节点没有弧相互连接,不能跨过一层到上上层)(X,S,Y)
2. 每条弧上有权重(权值)(W)
如下图(典型的人工神经网络(三层)):
<div align=center></div>
最下面的一层是输入层,最上面的一层是输出层,中间不可见的是隐含层;
所谓的“智能”其实归结为在多维空间进行模式分类的问题;
<div align=center></div>
如果把不同输出节点上得到的值看成是一种概率分布,那实际上的人工神经网络就等价于一个概率模型。
<div align=center></div>
有监督的训练:先有一批标注好输入数据x和对应输出值y的数据集,求解权重参数w,根据人工神经网络得到的输出值(分类结果)和实际训练数据中的输出值之间的差距(成本函数:可以定欧几里得距离),然后可采用常用的梯度下降法找到让成本达到最小值的参数。
无监督的训练:只有输入数据x,而没有输出数据y。根据具体的运用设计成本函数,由于人工神经网络要解决的是分类问题,所以成本函数要得出的结果是同一类问题尽量靠近,不同类问题尽量远离。定义了成本函数后,就可以用梯度下降法进行无监督的参数训练。
本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。