简单读懂人工智能:机器学习与深度学习是什么关系
- 格式:docx
- 大小:104.55 KB
- 文档页数:7
机器学习与深度学习的关系机器学习和深度学习是人工智能领域中最为热门和广泛应用的两个分支。
机器学习是一种通过计算机学习数据模式和规律的方法,而深度学习则是机器学习的一种特定形式,利用人工神经网络模拟人脑的工作原理来进行数据处理和决策。
本文将探讨机器学习与深度学习的关系以及它们在实际应用中的区别和共同点。
一、机器学习与深度学习的定义与理念机器学习是一种让机器通过学习和数据分析来改进算法性能的方法。
它通过从历史数据中发现模式和规律,让计算机能够根据这些规律来判断和处理新的数据。
机器学习包括监督学习、无监督学习和强化学习等方法,可以通过训练模型来实现预测、分类、聚类等任务。
深度学习是机器学习的一种特殊形式,它利用人工神经网络模拟人脑的结构和工作原理进行数据处理和决策。
深度学习通过多个隐藏层的神经元节点相互连接,逐层抽象提取特征,最终生成能够完成高级任务的模型。
深度学习的最大特点是可以自动进行特征提取,不需要手动选择和提取特征,能够处理更加复杂的数据和任务。
二、机器学习与深度学习的区别和共同点机器学习和深度学习在定义和理念上有一些区别,但它们也有一些共同的特点。
1. 数据需求:机器学习和深度学习都需要大量的数据来进行训练和学习。
机器学习通过分析和学习历史数据来建立模型,而深度学习则需要更多的数据来进行模型训练和参数调整。
2. 特征提取:机器学习需要手动选择和提取特征,而深度学习可以自动进行特征提取。
机器学习的特征工程过程需要人工干预,而深度学习通过多层神经网络自动学习和提取特征,能够更好地处理高维数据和复杂任务。
3. 算法复杂度:深度学习相对于机器学习而言更为复杂。
深度神经网络的训练过程需要大量的计算资源和时间,而机器学习的算法相对简单,更易于实现和部署。
4. 应用场景:机器学习广泛应用于自然语言处理、图像识别、推荐系统等领域,而深度学习则在图像处理、语音识别、自动驾驶等领域表现出更好的性能。
深度学习的应用对数据量和计算资源要求更高。
人工智能与深度学习一、人工智能的概念人工智能可以定义为一种能够模仿人类智慧的智能系统。
它可以识别语音和图像等自然界的信息,然后进行处理和分析,并做出相应的决策。
人工智能的应用范围非常广泛,比如医疗、交通、金融、教育等领域都可以运用人工智能技术。
二、深度学习的概念深度学习是人工智能的一种分支技术,它是一种对数据进行分析和处理的方式。
通过建立多层神经网络来模拟人类大脑的结构,让机器可以学习和理解复杂的数据。
深度学习的技术已经在语音识别、图像处理等领域实现了突破性进展。
三、人工智能与深度学习的关系人工智能需要有大量的数据来支撑其学习和分析过程,但是这些数据往往是非常庞大和复杂的。
这时候,深度学习技术就可以派上用场了。
深度学习能够通过建立多层神经网络来处理大量的数据,然后从中提取出有意义的信息,并转化成人类可以理解的结果。
四、人工智能与深度学习的应用人工智能与深度学习技术已经在很多领域得到了广泛的应用。
比如在医疗领域,可以通过人工智能技术来分析大量的病历数据,从而提高诊断的准确性和效率。
在金融领域,人工智能的风险评估模型可以更准确地帮助投资者评估风险。
在交通领域,人工智能技术可以帮助城市规划师更好地优化城市交通系统。
五、人工智能和深度学习的未来随着人工智能技术和深度学习的发展,我们可以预见人工智能未来将在更多的领域得到应用。
例如,在家庭生活领域,我们可以通过人工智能技术来检测居家环境中的安全隐患;在教育领域,人工智能可以根据不同的学习特点和能力,为学生量身定制个性化的学习计划。
人工智能技术的发展将为我们带来更多的便利和效率,但同时也要注意保护个人隐私和数据安全的问题。
六、结论人工智能和深度学习技术已经成为了现代科技发展的重要方向。
它们可以应用于各个领域,帮助我们更好地理解和处理大量的数据,并用更快的速度和更高的精度进行决策。
未来,人工智能和深度学习技术仍将继续不断地发展,为人类的生活带来更多的便利和进步。
机器学习与深度学习技术随着科技的不断发展,机器学习和深度学习技术已经逐渐走进了人们的日常生活中。
它们被广泛应用于语音识别、图像识别、自然语言处理、智能推荐等领域。
在这篇文章中,我们将探讨机器学习和深度学习技术的基本概念、原理和应用。
一、机器学习技术机器学习是指利用算法模型对大量数据进行学习和预测的技术。
它的原理是通过找到数据中的规律和模式,从而对未知数据进行自动化的推断和决策。
机器学习技术可以分为监督学习、无监督学习和强化学习。
1.监督学习监督学习是指在训练数据中已知输出的情况下,通过训练模型,预测未知的数据输出。
它的基本原理是将输入数据通过某些算法转换成一个输出结果,然后不断迭代调整模型,直到得到最优的预测结果。
监督学习主要应用于分类和回归问题。
2.无监督学习无监督学习是指在没有标签的情况下,通过对数据的分析和处理,发现数据中隐藏的结构与模式。
它的基本原理是通过聚类、降维和关联规则挖掘等算法,将数据分为不同的类别或者充分利用数据的相关性,来提取数据中的信息和知识。
3.强化学习强化学习是指一个智能体通过试错和反馈机制,学习如何在复杂环境下做出最优的决策。
它的基本原理是通过不断试错探索环境,从而获得正确的反馈信息,进一步调整决策策略,最终达到最优的结果。
强化学习主要应用于游戏、机器人等复杂的领域。
二、深度学习技术深度学习是指利用神经网络模型对复杂数据进行训练和预测的技术。
它的基本原理是模拟人类神经元的工作原理,在不断学习反馈和迭代中,逐渐优化模型的参数和权重,从而达到对数据的高精确度预测。
深度学习主要应用于图像识别、语音处理、自然语言处理等领域。
1.神经网络模型神经网络是深度学习的核心部分。
它由大量的节点(神经元)和连接组成。
每个节点都有权重和偏置值,其中权重表示节点对输入的影响程度,偏置值表示节点的激活门槛。
当输入的数据通过神经网络时,每个节点都会根据其权重和偏置值进行计算,最终得到输出结果。
2.卷积神经网络卷积神经网络是深度学习中应用最广泛的一个分支。
机器学习和深度学习的区别和联系机器学习和深度学习是人工智能领域中两个热门话题,它们在许多应用场景中发挥着重要作用。
尽管这两者相互关联,但它们有着明显的区别,本文将重点探讨它们的异同点。
一、机器学习和深度学习的定义机器学习通俗的讲是指让计算机从数据中学习规律,并逐渐完善自我优化的过程。
简单来说,它是让机器根据数据来学习相关的知识,并使用这些知识来解决复杂问题。
深度学习则是机器学习领域的一个重要的子集,它利用人工神经网络的层次化结构对数据进行抽象化表示。
深度学习模型由多层神经网络构成,每一层都会提取出数据的一些更抽象的特征。
这是一个自我学习过程,通过目标函数优化和反向传播算法来不断地进行调整和优化以提高预测准确性。
二、机器学习和深度学习的差别1. 原理的不同机器学习主要是依靠不同的统计方法,如朴素贝叶斯、支持向量机(SVM)和随机森林等,它是以数据驱动的方式来进行模型训练。
而深度学习依赖于人工神经网络,即神经元之间相互连接的网络结构,并且该网络通常由数百万个参数组成。
2. 数据需求的不同机器学习所需的数据集相对较小。
然而,当涉及到深度学习时,需要大量的数据来进行训练,其数据集大小往往是机器学习的十倍以上。
3. 算法性质的不同对于分类问题,机器学习算法通常可以找到一个精度相对较高的模型,然而深度学习算法在存在大量输入特征的情况下可能会过度拟合。
这意味着,深度学习可能并不总是能够找到全局最佳解。
三、机器学习和深度学习的共同点1. 数据的预处理和特征工程开发机器学习或深度学习算法之前需要进行数据预处理和特征工程。
例如,为了理解文本,需要将文本进行分词,移除停用词,并将单词表示为向量。
这些步骤对于分类和预测任务的准确性都非常重要。
2. 都需要大量的计算资源在训练模型时,机器学习和深度学习都需要相当大的计算资源。
但是,深度学习可能比机器学习需要更多的GPU资源,因为深度学习模型需要处理大量的数据。
3. 都可以用于解决各种应用问题机器学习和深度学习都应用于各种领域。
了解机器学习和深度学习的基本原理机器学习和深度学习是当今科技领域的热门话题,它们对于人工智能技术的发展起着重要推动作用。
本文将探讨机器学习和深度学习的基本原理,帮助读者进一步了解这两个领域。
一、机器学习的基本原理机器学习是指利用计算机算法和模型来分析数据,从中学习规律并做出预测的一门学科。
机器学习的基本原理主要包括数据预处理、特征提取、算法模型选择、模型训练和模型评估等环节。
首先是数据预处理。
在机器学习中,原始数据往往不够完善或存在噪声干扰,因此需要对数据进行清洗和整理。
数据预处理的目标是去除异常值、填补缺失值、归一化数据等,以保证数据的质量和准确性。
接下来是特征提取。
特征提取是将原始数据转化为机器学习算法能够处理的特征表示的过程。
不同的特征提取方法有PCA、LDA、特征哈希等,这些方法能够从数据中提取出最具代表性和区分性的特征,便于后续的模型训练和预测。
然后是算法模型选择。
机器学习中常用的算法模型包括线性回归、决策树、支持向量机、朴素贝叶斯等。
选择合适的算法模型需要考虑数据的特点和问题的要求,不同的模型有不同的适用场景和性能指标。
模型训练是机器学习的核心环节。
在训练过程中,需要根据已有的数据集通过优化算法不断更新模型的参数,使其能够更好地拟合训练数据。
常用的优化算法有梯度下降法、随机梯度下降法等。
最后是模型评估。
模型评估是判断机器学习算法性能的重要手段。
常用的评估指标包括准确率、召回率、F1 score等,可以通过交叉验证和混淆矩阵等方法来评估模型的泛化能力和稳定性。
二、深度学习的基本原理深度学习是机器学习领域中的一种特殊算法模型,其以人工神经网络为基础,模拟人脑神经元的工作原理。
深度学习的基本原理主要包括神经网络构建、前向传播、反向传播和优化算法等步骤。
首先是神经网络构建。
神经网络由多层神经元组成,通常包括输入层、隐藏层和输出层。
每个神经元接收到上一层神经元传递过来的信息,并通过激活函数进行非线性转换,然后将结果传递到下一层。
机器学习和深度学习的区别和联系机器学习和深度学习是近年来被广泛讨论的话题。
它们都属于人工智能领域的一个重要分支,但两者又有着明显的区别和联系。
本文将从不同的角度探讨机器学习和深度学习的区别和联系,希望能让读者对它们有更深入的理解和认识。
一、概念区别机器学习是人工智能领域的一个分支,也是一个非常具体的技术。
它通过对已有数据的学习和分析,从而使机器能够自动地进行任务。
也就是说,机器学习是一个“有监督”的过程,机器可以根据已有的数据来进行学习和预测。
而深度学习则是机器学习中的一种算法,从本质上来讲,深度学习是一种特殊的神经网络。
与传统的机器学习算法不同的是,在深度学习中,不需要手动地提取特征,因为深度学习可以从原始数据中自动地进行特征提取。
这也是深度学习与传统机器学习的一个重要区别。
二、算法区别在算法方面,机器学习和深度学习也有着不同的特点。
机器学习算法通常可以分为以下几类:1、监督学习2、非监督学习3、半监督学习4、强化学习机器学习算法通常是基于特征提取的,即从已有数据中提取有效的特征,并在此基础上建立模型。
不过,由于特征的选取和提取是一个较为困难的过程,并且与具体场景相关,因此这也是机器学习算法的一大缺点。
而深度学习算法则是基于神经网络的,这种算法可以在原始数据上进行端到端的训练,从而学习到更深入和更复杂的特征。
同时,深度学习算法也可以通过神经网络的不断迭代来不断优化模型,使其更加准确。
三、应用区别机器学习和深度学习的应用范围也有所不同。
虽然两者都属于人工智能领域,但对具体应用场景的要求会有所区别。
机器学习算法通常应用于以下三个方面:1、预测性任务2、分类性任务3、聚类性任务而深度学习的应用范围则更加广泛,可以应用到以下几个方面:1、图像识别2、语音识别3、自然语言处理4、推荐系统5、机器翻译4、优缺点比较机器学习和深度学习虽然有着区别,但也都有各自的优缺点。
机器学习的优点在于:1、易于实现2、可以很好地处理小数据集3、相对消耗更少的计算资源但机器学习也存在缺点:1、需要人为设定特征2、无法处理非线性和复杂问题3、准确率有限而深度学习的优点则在于:1、可以从原始数据中自动提取特征2、可以处理非线性和更加复杂的问题3、准确率相对较高但深度学习也具有缺点:1、需要更多的计算资源2、易于出现过拟合问题3、模型更加复杂,难以解释总之,机器学习和深度学习虽然有着区别,但也有着相互补充的关系。
什么是⼈⼯智能、机器学习和深度学习(概念⼊门)⼀、概念整体介绍⼈⼯智能(Artificial Intelligence)机器学习(Machine Learning):⼀种实现⼈⼯智能的⽅法深度学习(Deep Learning):⼀种实现机器学习的技术 三者的关系图⼈⼯智能分类: 强⼈⼯智能:强⼈⼯智能观点认为有可能制造出真正能推理(Reasoning)和解决问题(Problem_solving)的智能机器,并且这样的机器将被认为是有知觉的,有⾃我意识的。
可以独⽴思考问题并制定解决问题的最优⽅案,有⾃⼰的价值观和世界观体系。
有和⽣物⼀样的各种本能,⽐如⽣存和安全需求。
弱⼈⼯智能:弱⼈⼯智能是指不能制造出真正地推理(Reasoning)和解决问题(Problem_solving)的智能机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有⾃主意识。
⼈⼯智能是计算机学科的⼀个分⽀,⼆⼗世纪七⼗年代以来被称为世界三⼤尖端技术之⼀(空间技术、能源技术、⼈⼯智能)。
也被认为是⼆⼗⼀世纪三⼤尖端技术(基因⼯程、纳⽶科学、⼈⼯智能)之⼀。
这是因为近三⼗年来它获得了迅速的发展,在很多学科领域都获得了⼴泛应⽤,并取得了丰硕的成果,⼈⼯智能已逐步成为⼀个独⽴的分⽀,⽆论在理论和实践上都已⾃成⼀个系统。
⼈⼯智能的研究分⽀ ⼈⼯智能的发展历程 各种概念关系相关链接:⼀张图解释⼈⼯智能、机器学习、深度学习三者关系:⼀篇⽂章讲清楚⼈⼯智能、机器学习和深度学习的区别和联系:科普⼀下:机器学习和深度学习的区别和关系:⼈⼯智能的三个分⽀:认知、机器学习、深度学习:还纠结选机器学习还是深度学习?看完你就有数了:=====================================================⼆、⼈⼯智能应⽤领域关键词:⾃然语⾔⽣成、语⾳识别、虚拟助理、机器学习平台、⼈⼯智能硬件优化、决策管理、深度学习平台、⽣物信息、图像识别、情绪识别、P2P⽹络、内容创作、⽹络防御、AI建模/数字孪⽣、机器处理⾃动化、⽂本分析和⾃然语⾔处理游戏:⼈⼯智能在国际象棋,扑克,围棋等游戏中起着⾄关重要的作⽤,机器可以根据启发式知识来思考⼤量可能的位置并计算出最优的下棋落⼦。
深度学习与机器学习的关系近年来,深度学习和机器学习的技术发展飞速,并且这两种技术都可以用来实现自动化和智能化的计算机应用。
深度学习和机器学习有着不可忽视的联系,但又有着自身的独特和不同。
本文将介绍深度学习和机器学习的技术基础,以及它们之间的关系。
首先,在计算机视觉中,深度学习和机器学习都是人工智能的重要分支,它们都是有监督学习的一部分。
机器学习是以特定的算法模型为基础,从给定的数据集中提取模式,以更好地解释更多的数据集数据的过程。
机器学习的算法包括决策树,支持向量机和K最近邻等算法,广泛应用于图像分类,文本分类等任务。
而深度学习是一种基于深度神经网络的机器学习技术,它采用类似人类大脑的多层神经网络结构,以及各层间的非线性映射来学习非线性特征和模式。
典型的深度学习模型包括卷积神经网络(CNN),循环神经网络(RNN),以及生成对抗网络(GAN)等模型,广泛应用于无人驾驶,医学图像分析等任务。
其次,深度学习和机器学习在技术上也有着很大不同。
简单地说,深度学习更依赖于大数据,而机器学习更依赖于统计模型。
深度学习的过程更像是一个基于经验的学习,它比机器学习更依赖于大量数据来进行模型学习,但它也需要较大的计算能力,比如GPU,来支持其复杂的模型学习过程。
而机器学习则更注重数据的统计模型分析,它不需要很多的数据,但是也不需要特别大的计算能力,只需要一般的处理器即可。
同时,机器学习的模型往往比深度学习的模型更加规范,更容易解释,并且也更易于部署。
最后,深度学习和机器学习之间也有一定的联系,比如,深度学习可以作为机器学习的一个组件来实现更复杂的特征提取和模型训练,并且深度学习也可以作为机器学习的一个基础技术,以辅助完成机器学习的任务。
而在特定的领域,也可以将机器学习技术与深度学习技术结合起来,以实现更高效的解决方案。
综上所述,深度学习和机器学习各有其特点,在技术上也有着很大不同,但它们之间也存在着不可忽视的联系。
机器学习与深度学习的应用与探索机器学习和深度学习是现代计算机科学领域中的热门话题。
它们的应用范围广泛,可以用于图像识别、自然语言处理、计算机视觉等领域。
本文将深入探讨机器学习和深度学习的应用,并提供一些它们的相关资源和学习材料。
一、机器学习的应用机器学习指的是一种可以使计算机系统自动学习和适应的技术。
在过去的几年中,机器学习在各种领域中的应用已经得到了越来越多的关注和发展。
下面是一些机器学习的应用案例。
1. 智能家居智能家居是人类社会向智能化迈进的一个重要标志。
智能家居系统是一个通用的家庭控制中心,它可以通过各种传感器来自动控制温度、照明、安全等功能。
2. 自然语言处理自然语言处理(NLP)是人工智能(AI)的一个重要分支,它的目的是让计算机理解和处理自然语言。
自然语言处理可以用于构建聊天机器人、语音识别、自动翻译等。
3. 图像识别图像识别是机器学习应用的另一种方式。
它能够识别图像中的对象、场景和图案等,有效地支持自动分类和智能推理的应用。
二、深度学习的应用深度学习是机器学习的一个重要分支,用于构建深度神经网络模型,这些模型可以自动学习来执行复杂的任务。
深度学习广泛应用于视频和图像分析、自然语言处理和语音识别等:1. 用于智能驾驶系统深度学习在智能驾驶系统中的应用日益广泛。
它可以帮助汽车识别出其他车辆、行人和障碍物,并提供智能导航和自动驾驶功能。
2. 用户推荐深度学习也可以用于用户推荐系统。
通过分析用户的历史记录和个人喜好,深度学习可以为用户推荐最相关的商品和服务。
3. 语音识别深度学习也可以应用于语音识别。
通过分析大量的语音数据,深度学习可以创建高度准确的语音识别模型。
三、机器学习和深度学习资源机器学习和深度学习是现代计算机科学领域中的重要学科。
以下是一些有益的资源,可以帮助你更深入地学习它们:1. KaggleKaggle是一个为机器学习、数据科学和计算机视觉专业人士提供的一个机会,让他们分享他们的算法,建立自己的模型,并在竞赛中得到高分。
简单读懂人工智能:机器学习与深度学习是什么关系本文章来自于阿里云云栖社区摘要:引言:随着AlphaGo战胜李世石,人工智能和深度学习这些概念已经成为一个非常火的话题。
人工智能、机器学习与深度学习这几个关键词时常出现在媒体新闻中,并错误地被认为是等同的概念。
本文将介绍人工智能、机器学习以及深度学习的概念,并着重解析它们之间的关系。
引言:随着AlphaGo战胜李世石,人工智能和深度学习这些概念已经成为一个非常火的话题。
人工智能、机器学习与深度学习这几个关键词时常出现在媒体新闻中,并错误地被认为是等同的概念。
本文将介绍人工智能、机器学习以及深度学习的概念,并着重解析它们之间的关系。
本文将从不同领域需要解决的问题入手,依次介绍这些领域的基本概念以及解决领域内问题的主要思路。
本文选自《Tensorflow:实战Google深度学习框架》。
从计算机发明之初,人们就希望它能够帮助甚至代替人类完成重复性劳作。
利用巨大的存储空间和超高的运算速度,计算机已经可以非常轻易地完成一些对于人类非常困难,但对计算机相对简单的问题。
比如,统计一本书中不同单词出现的次数,存储一个图书馆中所有的藏书,或是计算非常复杂的数学公式,都可以轻松通过计算机解决。
然而,一些人类通过直觉可以很快解决的问题,目前却很难通过计算机解决。
这些问题包括自然语言理解、图像识别、语音识别,等等。
而它们就是人工智能需要解决的问题。
计算机要像人类一样完成更多智能的工作,需要掌握关于这个世界海量的知识。
比如要实现汽车自动驾驶,计算机至少需要能够判断哪里是路,哪里是障碍物。
这个对人类非常直观的东西,但对计算机却是相当困难的。
路有水泥的、沥青的,也有石子的甚至土路。
这些不同材质铺成的路在计算机看来差距非常大。
如何让计算机掌握这些人类看起来非常直观的常识,对于人工智能的发展是一个巨大的挑战。
很多早期的人工智能系统只能成功应用于相对特定的环境(specific domain),在这些特定环境下,计算机需要了解的知识很容易被严格并且完整地定义。
例如,IBM的深蓝(Deep Blue)在1997年打败了国际象棋冠军卡斯帕罗夫。
设计出下象棋软件是人工智能史上的重大成就,但其主要挑战不在于让计算机掌握国际象棋中的规则。
国际象棋是一个特定的环境,在这个环境中,计算机只需要了解每一个棋子规定的行动范围和行动方法即可。
虽然计算机早在1997年就可以击败国际象棋的世界冠军,但是直到20年后的今天,让计算机实现大部分成年人都可以完成的汽车驾驶却仍然依旧十分困难。
为了使计算机更多地掌握开放环境(open domain)下的知识,研究人员进行了很多尝试。
其中一个影响力非常大的领域是知识图库(Ontology)。
WordNet 是在开放环境中建立的一个较大且有影响力的知识图库。
WordNet是由普林斯顿大学(Princeton University)的George Armitage Miller教授和Christiane Fellbaum教授带领开发的,它将155287个单词整理为了117659个近义词集(synsets)。
基于这些近义词集,WordNet进一步定义了近义词集之间的关系。
比如同义词集“狗”属于同义词集“犬科动物”,他们之间存在种属关系(hypernyms/hyponyms)。
除了WordNet,也有不少研究人员尝试将Wikipedia 中的知识整理成知识图库。
谷歌的知识图库就是基于Wikipedia创建的。
虽然使用知识图库可以让计算机很好地掌握人工定义的知识,但建立知识图库一方面需要花费大量的人力物力,另一方面可以通过知识图库方式明确定义的知识有限,不是所有的知识都可以明确地定义成计算机可以理解的固定格式。
很大一部分无法明确定义的知识,就是人类的经验。
比如我们需要判断一封邮件是否为垃圾邮件,会综合考虑邮件发出的地址、邮件的标题、邮件的内容以及邮件收件人的长度,等等。
这是收到无数垃圾邮件骚扰之后总结出来的经验。
这个经验很难以固定的方式表达出来,而且不同人对垃圾邮件的判断也会不一样。
如何让计算机可以跟人类一样从历史的经验中获取新的知识呢?这就是机器学习需要解决的问题。
卡内基梅隆大学(Carnegie Mellon University)的Tom Michael Mitchell教授在1997年出版的书籍Machine Learning中对机器学习进行过非常专业的定义,这个定义在学术界内被多次引用。
在这本书中对机器学习的定义为“如果一个程序可以在任务T上,随着经验E的增加,效果P也可以随之增加,则称这个程序可以从经验中学习”。
通过垃圾邮件分类的问题来解释机器学习的定义。
在垃圾邮件分类问题中,“一个程序”指的是需要用到的机器学习算法,比如逻辑回归算法;“任务T”是指区分垃圾邮件的任务;“经验E”为已经区分过是否为垃圾邮件的历史邮件,在监督式机器学习问题中,这也被称之为训练数据;“效果P”为机器学习算法在区分是否为垃圾邮件任务上的正确率。
在使用逻辑回归算法解决垃圾邮件分类问题时,会先从每一封邮件中抽取对分类结果可能有影响的因素,比如说上文提到的发邮件的地址、邮件的标题及收件人的长度,等等。
每一个因素被称之为一个特征(feature)。
逻辑回归算法可以从训练数据中计算出每个特征和预测结果的相关度。
比如在垃圾邮件分类问题中,可能会发现如果一个邮件的收件人越多,那么邮件为垃圾邮件的概率也就越高。
在对一封未知的邮件做判断时,逻辑回归算法会根据从这封邮件中抽取得到的每一个特征以及这些特征和垃圾邮件的相关度来判断这封邮件是否为垃圾邮件。
在大部分情况下,在训练数据达到一定数量之前,越多的训练数据可以使逻辑回归算法对未知邮件做出的判断越精准。
也就是说逻辑回归算法可以根据训练数据(经验E)提高在垃圾邮件分类问题(任务T)上的正确率(效果P)。
之所以说在大部分情况下,是因为逻辑回归算法的效果除了依赖于训练数据,也依赖于从数据中提取的特征。
假设从邮件中抽取的特征只有邮件发送的时间,那么即使有再多的训练数据,逻辑回归算法也无法很好地利用。
这是因为邮件发送的时间和邮件是否为垃圾邮件之间的关联不大,而逻辑回归算法无法从数据中习得更好的特征表达。
这也是很多传统机器学习算法的一个共同的问题。
类似从邮件中提取特征,如何数字化地表达现实世界中的实体,一直是计算机科学中一个非常重要问题。
如果将图书馆中的图书名称储存为结构化的数据,比如储存在Excel表格中,那么可以非常容易地通过书名查询一本书是否在图书馆中。
如果图书的书名都是存在非结构化的图片中,那么要完成书名查找任务的难度将大大增加。
类似的道理,如何从实体中提取特征,对于很多传统机器学习算法的性能有巨大影响。
我们看一个简单的例子。
不同的数据表达对使用直线划分不同颜色结点的难度影响如果通过笛卡尔坐标系(cartesian coordinates)来表示数据,那么不同颜色的结点无法被一条直线划分。
如果将这些点映射到极角坐标系(polar coordinates),那么使用直线划分就很容易了。
同样的数据使用不同的表达方式会极大地影响解决问题的难度。
一旦解决了数据表达和特征提取,很多人工智能任务也就解决了90%。
然而,对许多机器学习问题来说,特征提取不是一件简单的事情。
在一些复杂问题上,要通过人工的方式设计有效的特征集合,需要很多的时间和精力,有时甚至需要整个领域数十年的研究投入。
例如,假设想从很多照片中识别汽车。
现在已知的是汽车有轮子,所以希望在图片中抽取“图片中是否出现了轮子”这个特征。
但实际上,要从图片的像素中描述一个轮子的模式是非常难的。
虽然车轮的形状很简单,但在实际图片中,车轮上可能会有来自车身的阴影、金属车轴的反光,周围物品也可能会部分遮挡车轮。
实际图片中各种不确定的因素让我们很难直接抽取这样的特征。
既然人工的方式无法很好地抽取实体中的特征,那么是否有自动的方式呢?答案是肯定的。
深度学习解决的核心问题之一就是自动地将简单的特征组合成更加复杂的特征,并使用这些组合特征解决问题。
深度学习是机器学习的一个分支,它除了可以学习特征和任务之间的关联以外,还能自动从简单特征中提取更加复杂的特征。
下图展示了深度学习和传统机器学习在流程上的差异。
传统机器学习和深度学习流程对比如图所示,深度学习算法可以从数据中学习更加复杂的特征表达,使得最后一步权重学习变得更加简单且有效。
深度学习在图像分类问题上的算法流程样例在上图中,展示了通过深度学习解决图像分类问题的具体样例。
深度学习可以一层一层地将简单特征逐步转化成更加复杂的特征,从而使得不同类别的图像更加可分。
比如图中展示了深度学习算法可以从图像的像素特征中逐渐组合出线条、边、角、简单形状、复杂形状等更加有效的复杂特征。
早期的深度学习受到了神经科学的启发,它们之间有非常密切的联系。
科学家们在神经科学上的发现使得我们相信深度学习可以胜任很多人工智能的任务。
神经科学家发现,如果将小白鼠的视觉神经连接到听觉中枢,一段时间之后小鼠可以习得使用听觉中枢“看”世界。
这说明虽然哺乳动物大脑分为了很多区域,但这些区域的学习机制却是相似的。
在这一假想得到验证之前,机器学习的研究者们通常会为不同的任务设计不同的算法。
而且直到今天,学术机构的机器学习领域也被分为了自然语言处理、计算机视觉和语音识别等不同的实验室。
因为深度学习的通用性,深度学习的研究者往往可以跨越多个研究方向甚至同时活跃于所有的研究方向。
虽然深度学习领域的研究人员相比其他机器学习领域更多地受到了大脑工作原理的启发,而且媒体界也经常强调深度学习算法和大脑工作原理的相似性,但现代深度学习的发展并不拘泥于模拟人脑神经元和人脑的工作机理。
模拟人类大脑也不再是深度学习研究的主导方向。
我们不应该认为深度学习是在试图模仿人类大脑。
目前科学家对人类大脑学习机制的理解还不足以为当下的深度学习模型提供指导。
现代的深度学习已经超越了神经科学观点,它可以更广泛地适用于各种并不是由神经网络启发而来的机器学习框架。
值得注意的是,有一个领域的研究者试图从算法层理解大脑的工作机制,它不同于深度学习的领域,被称为“计算神经学”(computational neuroscience)。
深度学习领域主要关注如何搭建智能的计算机系统,解决人工智能中遇到的问题。
计算神经学则主要关注如何建立更准确的模型来模拟人类大脑的工作。
总的来说,人工智能、机器学习和深度学习是非常相关的几个领域。
下图总结了它们之间的关系。
人工智能、机器学习以及深度学习之间的关系图人工智能是一类非常广泛的问题,机器学习是解决这类问题的一个重要手段。
深度学习则是机器学习的一个分支。
在很多人工智能问题上,深度学习的方法突破了传统机器学习方法的瓶颈,推动了人工智能领域的发展。