Loading... ### 机器学习、深度学习、强化学习  #### 机器学习 一切通过优化方法挖掘数据中规律的学科。 机器学习是人工智能的重要分支,这一领域通常会利用概率论、统计学、计算机科学等知识,从训练数据中识别特征模式、学习规律,以此对未来数据进行分类、预测。 分类: 监督学习(Supervised Learning):**通过“监督者”预先填好标签(label)的训练数据进行学习的方式**。 无监督学习(Unsupervised Learning):**无需事先为数据贴好标签**。这种方式更像是聚类(clustering)的过程,即根据数据的特征,发现实例之间的相似性。 强化学习:需要 **通过与“环境”的交互,逐步进行学习**。强化学习和无监督学习的机制不同——无监督学习的目标是挖掘数据的潜在结构,而强化学习则是 **通过与环境交互获得最优解的过程。** #### 深度学习 一切运用了神经网络作为参数结构进行优化的机器学习算法。 深度学习(Deep Learning)是从数据训练数据中学到一个非线性函数,**将未知数据与标签对应** ; #### 强化学习 不仅能利用现有数据,还可以通过对环境的探索获得新数据,并利用新数据循环往复地更新迭代现有模型的机器学习算法。学习是为了更好地对环境进行探索,而探索是为了获取数据进行更好的学习。 强化学习则是学习一个状态机制,在各种情况下每次都选择回报最大的方式。 强化学习可以分为 **基于模型** (Model\_Based)和**无模型**(Model-Free)两大类。 强化学习是一种根据 **奖惩机制** 而工作的技术,基本思想是,**学习在不同环境状态和状态下哪种行为能把预期利益最大化。** #### 他们的关系 深度学习的训练样本是有标签的,强化学习的训练是没有标签的,他通过环境给出的奖惩来学习。 深度学习的过程是静态的,强化学习的过程是动态的,需要及时与环境交互获取奖惩结果。 深度学习一般用于处理感知问题,强化学习一般用于处理决策问题。 ### CNN、RNN、GAN #### CNN **CNN** 的假设——人类的视觉总是会关注视线内特征最明显的点。 卷积神经网络(Convolutional Neural Network,CNN或ConvNet)是一种具有**局部连接、权重共享**等特性的深层前馈神经网络。 CNN通过卷积操作实现局部连接和权重共享,这有助于捕捉图像中的局部特征。 CNN 用于提取图像的空间特征,通过不断的卷积和池化操作实现特征提取和降维。 **卷积神经网络(简称CNN)**常用于影像数据进行分析处理 CNN主要应用可分为图像分类(image classification)、目标检测(object detection)及语义分割(semantic segmentation)。 图像分类:识别图片属于哪种分类类别 目标检测:找到目标坐标及识别目标类别,最常见的算法为YOLO及R-CNN 语义分割:在图像处理领域一般是用于边界识别 一个卷积神经网络一般有以下结构组成: * **输入层**(Input layer) * **卷积层**(CONV layer,包含**激活函数**,比如 ReLU、sigmoid、tanh 等) * **池化层**(Pooling layer) * **全连接层**(FC layer) * **输出层**(Ouput layer) #### RNN **RNN** 的假设——事物的发展是按照时间序列展开的(前一刻发生的事物会对未来的事情的发展产生影响)。 循环神经网络(RNN,Recurrent Neural Network)是一类用于**处理序列数据**的神经网络。 RNN通过循环结构实现权重共享,允许网络在处理序列数据时考虑先前的信息。 有别于CNN,RNN的特色在于可处理图像或数值数据,并且由于网络本身具有记忆能力,可学习具有前后相关的数据类型。 RNN具有存储功能,但他不是刚性地记忆所有固定长度的序列,而是通过隐藏状态来存储之前时间步的信息。 **递归神经网络(简称RNN)**常用于文本分析或自然语言处理的 一个典型的 RNN 网络架构包含一个输入,一个输出和一个神经网络单元 。和普通的前馈神经网络的区别在于:RNN 的神经网络单元不但与输入和输出存在联系,而且自身也存在一个循环 / 回路 / 环路 / 回环 (loop)。这种回路允许信息从网络中的一步传递到下一步。 通常用于**自然语言处理**和**语音识别**中,可以用来处理**时间序列**数据。RNN 的主要思想是把前面的**信息传递**到后面,这样网络就可以利用之前的信息做出预测,能够处理序列中每个时间步的数据。 RNN虽然解决了CNN无法处理的问题,但其本身仍然有些缺点,所以现在很多RNN的变形网络,其中最常被使用的网络之一为**长短记忆网络(Long Short-Term Network,简称LSTM)**。 #### GAN 除了深度学习外,还有一种机器学习技术是强化学习(Reinforcement Learning),其中一种很具有特色的网络为生成式对抗网络(GAN)。 **生成对抗网络(简称GAN)**常用于数据生成或非监督式学习应用的 ### 参考资料 [一图看懂机器学习、深度学习、强化学习与人工智能的关系\_人工智能 机器学习 深度学习,强化学习的关系-CSDN博客](https://blog.csdn.net/dzcera/article/details/122769329) [深度学习、强化学习、监督学习……机器学习概念大辨析! - 知乎 (zhihu.com)](https://zhuanlan.zhihu.com/p/647124858) [神经网络 | CNN 与 RNN——深度学习主力军\_cnn rnn-CSDN博客](https://blog.csdn.net/ttrr27/article/details/136018712) [科普 | 深度学习算法三大类:CNN,RNN和GAN - 知乎 (zhihu.com)](https://zhuanlan.zhihu.com/p/163065584) [深度学习、强化学习、监督学习……机器学习概念大辨析! - 知乎 (zhihu.com)](https://zhuanlan.zhihu.com/p/647124858) 最后修改:2024 年 10 月 26 日 © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 如果觉得我的文章对你有用,请随意赞赏