机器学习&数据挖掘笔记_20(PGM练习四：图模型的精确推理)

格式：doc
大小：159.00 KB
文档页数：10

下载文档原格式

/ 10

什么是机器学习

什么是机器学习1.1 什么是机器学习？机器学习是一门人工智能领域的重要分支，它使计算机系统能够从数据中学习并自动改进性能，而无需明确的编程。

机器学习的目标是开发算法和模型，使计算机能够发现数据中的模式、关联和规律，并利用这些信息做出预测或决策。

与传统编程不同，机器学习侧重于从经验中学习，而不是依赖于人类明确规定的规则。

这种能力使机器学习在各种应用领域大放异彩，包括自然语言处理、计算机视觉、医疗诊断、金融预测等等。

机器学习的关键特征包括数据驱动、自动化学习和泛化能力。

数据驱动意味着机器学习模型从大量数据中提取信息和知识，自动化学习意味着模型可以自行调整以提高性能，泛化能力意味着模型可以适应新的、以前未见过的数据。

这些特征使得机器学习成为解决复杂问题和实现人工智能的有力工具。

1.2 为什么机器学习如此重要？机器学习的重要性不断增加，原因有多种。

首先，数据的爆炸性增长使得我们面临着大量的信息和挑战，机器学习能够帮助我们从这些数据中提取有价值的见解。

其次，机器学习在自动化任务和流程方面具有巨大潜力，可以提高效率并减少人工干预。

第三，机器学习在许多领域，包括医疗保健、交通、金融和娱乐等，都有广泛的应用，有助于改善生活质量和解决社会问题。

此外，机器学习还推动了人工智能的发展。

深度学习、神经网络和自然语言处理等领域的进步，部分归功于机器学习技术的创新。

这些技术已经在语音识别、图像识别、自动翻译等方面取得了显著的突破，为我们创造了更智能的计算机系统。

总之，机器学习不仅改变着我们对计算机和数据的看法，还为未来的科技和社会进步提供了无限可能。

1.3 机器学习包括那些内容机器学习的基础包括数据和特征的概念，监督学习、无监督学习和强化学习的区别，以及如何构建、训练和评估机器学习模型的方法。

监督学习方法，包括线性回归、逻辑回归、决策树、随机森林、支持向量机和k-最近邻算法。

无监督学习方法，包括聚类算法和降维技术。

具体有K均值聚类、层次聚类、主成分分析（PCA）和t-分布随机邻域嵌入（t-SNE）等方法的原理和用途。

什么是机器学习？

什么是机器学习？1.机器学习的定义机器学习是一种人工智能的分支，是利用计算机算法从数据中自动分析和学习规律，从而使计算机能够自动获取新知识和能力。

它可以处理大量的复杂数据并从中提取出有用的信息，其理念是让计算机自己从数据中学习，并根据不断的经验改善自身的性能。

2.机器学习的应用机器学习的应用非常广泛，在许多领域都有着重要的作用。

例如在医学领域，机器学习可以帮助医生诊断疾病并制定治疗方案；在金融领域，机器学习可以用于金融风险管理、投资组合优化等方面；在自然语言处理领域，机器学习可以实现文本分类、机器翻译等功能。

3.机器学习的分类机器学习可以分为监督学习、无监督学习和强化学习三种类型。

（1）监督学习指利用已有的标记数据训练模型，然后使用该模型对未知数据进行预测或分类。

常见的监督学习算法包括决策树、支持向量机和神经网络等。

（2）无监督学习指在没有标记数据的情况下训练模型。

无监督学习的目的是发现数据中的模式和结构，从而能够更好地了解和分析数据的特征和属性。

常见的无监督学习算法包括聚类、关联规则挖掘和降维等。

（3）强化学习指在试错过程中学习最优策略的一种学习方式。

在强化学习中，计算机会采取一些行动来达到某个目标，并从环境中获得奖励或惩罚。

通过这个过程，计算机可以学习最优策略，并不断提高自己的表现。

4.机器学习的局限性尽管机器学习在许多领域都有着广泛的应用，但它也存在一些局限性。

例如在数据缺失或数据质量差的情况下，机器学习可能会失效；另外，机器学习还存在过拟合和欠拟合的问题，需要通过合适的算法来解决。

5.机器学习的未来随着数据量的不断增长和计算机性能的提升，机器学习在未来将会有更广泛的应用。

人们可以通过机器学习技术，更好地了解和利用数据，从而创造出更多的价值和创新。

机器学习基础课件

结果作为新的特征，再训练一个元模型进行最终预测。
模型诊断与改进策略
残差分析（Residual Analys…
通过检查模型的残差图，识别模型是否存在异方差性、非线性等问题。
特征重要性分析（Feature Impo…
通过分析模型中各个特征对预测结果的贡献程度，识别关键特征和冗余特征。
案例五：使用神经网络进行手写数字识别
使用卷积神经网络等算法提取图像特征，以便输入到神经网络模型中。
使用准确率、混淆矩阵等指标对模型进行评估，调整模型参数以优化识别性能。
数据准备
特征提取
模型训练
模型评估
收集手写数字图像数据集，包括训练集和测试集，对数据进行预处理和增强。
构建神经网络模型，对提取的特征进行训练和学习，得到手写数字识别模型。
遗传算法（Genetic Algorit…
模拟自然选择和遗传机制，在指定的超参数空间内进行搜索。
模型集成方法
装袋（Bagging）
通过自助采样法得到多个训练集，分别训练基模型，然后将基模型的预测结果进行平均或投票得到最终预测结果。
提升（Boosting）
通过迭代地训练基模型，每次迭代时调整样本权重，使得之前被错误分类的样本得到更多的关注。
决策树、神经网络、支持向量机等。
近年来，随着大数据和深度学习技术的快速发展，机器学习在图像识别、语音识别、自然语言处理等领域
取得了突破性进展。
机器学习的应用领域
计算机视觉
通过训练图像识别模型，实现对图像中物体、场景、文字等信息的自动识别和理解。
自然语言处理
利用机器学习技术，实现对文本数据的自动分析、理解和生成，如情感分析、机器翻译等。
模型复杂度分析（Model Comple…

机器学习课件ppt

详细描写
逻辑回归通过将输入变量映射到概率值来工作，然后使用阈值将概率值转换为二进制类别。它通常用于二元分类问题，如点击率猜测或敲诈检测。
决策树
总结词
决策树是一种监督学习算法，它通过树形结构进行决策和分类。
详细描写
决策树通过递归地将数据集划分为更小的子集来工作，直到到达终止条件。每个内部节点表示一个特征的测试，每个分支表示测试的一个结果，每个叶节点表示一个类标签。
深度学习的应用场景包括图像辨认、语音辨认、自然语言处理和推举系统等。
强化学习
01
强化学习是机器学习的一个分支，通过让智能体与环境交互来学习最优的行为策略。
02
强化学习的特点是基于环境的反馈来不断优化行为，以到达最终
的目标。
常见的强化学习算法包括Qlearning、SARSA和Deep Qnetwork等。
计算机视觉
机器学习在计算机视觉领域的应用包括图像分类、目标检测、人脸辨认等。
推举系统
机器学习在推举系统中的应用是通过分析用户行为和偏好来推举相关的内容或产品。
语音助手
机器学习在语音助手中的应用是通过语音辨认和自然语言处理技术来理解用户意图并作出相应回应。
02
机器学习基础
线性回归
总结词
线性回归是一种通过拟合数据点来猜测连续值的算法。
详细描写
线性回归通过找到最佳拟合直线来猜测因变量的值，该直线基于自变量和因变量之间的关系。它使用最小二乘法来拟合数据，并输出一个线性方程，可以用来进行猜测。
逻辑回归
总结词
逻辑回归是一种用于分类问题的算法，它将连续的输入变量转换为二进制的输出变量。
数据清洗
去除特殊值、缺失值和重复数据，确保数据质量。

机器学习精选ppt精选全文

人工神经网络
人工神经网络
1 生物神经元及人工神经元的组成2 人工神经网络的模型 2 .1 人工神经元的模型 2 .2 常用的激活转移函数 2 .3 MP模型神经元
1、生物神经元及人工神经元的组成
神经元也称神经细胞，它是生物神经系统的最基本单元，它和人体中其他细胞的关键区别在于具有产生、处理和传递信号的功能。每个神经元都包括三个主要部分：细胞体、树突和轴突，见图5（a）。
5
监督学习
决策树（简单问题）人工神经网络（大量样本）支持向量机（小样本）
决策树学习
决策树学习 1．什么是决策树决策树(decision tree)也称判定树，它是由对象的若干属性、属性值和有关决策组成的一棵树。其中的节点为属性（一般为语言变量），分枝为相应的属性值（一般为语言值）。从同一节点出发的各个分枝之间是逻辑“或”关系；根节点为对象的某一个属性；从根节点到每一个叶子节点的所有节点和边，按顺序串连成一条分枝路径，位于同一条分枝路径上的各个“属性-值”对之间是逻辑“与”关系，叶子节点为这个与关系的对应结果，即决策。例如图1就是一棵决策树。其中，A, B, C代表属性，ai, bj, ck代表属性值，dl代表对应的决策。处于同一层的属性（如图中的B, C）可能相同，也可能不相同，所有叶子节点（如图中的dl ，l=1,2,…, 6）所表示的决策中也可能有相同者。
由图1不难看出，一棵决策树上从根节点到每一个叶子节点的分枝路径上的诸“属性-值”对和对应叶子节点的决策，刚好就构成一个产生式规则：诸“属性-值”对的合取构成规则的前提，叶子节点的决策就是规则的结论。例如，图1中从根节点A到叶子节点d2的这一条分枝路径就构成规则：(A= a1)∧(B = b2) => d2而不同分枝路径所表示的规则之间为析取关系。

机器学习是什么？

机器学习是什么？机器学习是一种通过计算机算法和数学模型训练机器能够自主学习并提高性能的技术。

在过去的几年，机器学习技术已经成为了人工智能领域的重要研究方向，并且在语音识别、图像识别、自然语言处理、推荐系统、智能交互等领域已经有了广泛的应用。

1. 机器学习的基础机器学习是基于数据挖掘、人工智能、统计学、优化学习等多个学科交叉形成的一个系统化的学科。

机器学习的算法可以分为有监督学习、无监督学习、半监督学习和增强学习。

其中，有监督学习是指已知输入和输出，训练模型来预测未知的输出，如分类和回归。

无监督学习是指只知道输入，没有输出标签，通过训练模型发现数据本身的结构和规律，如聚类和降维。

半监督学习是指既有有标签数据又有无标签数据，通过利用无标签数据来增强模型的性能。

增强学习是指模型不断与环境进行交互，通过试错来提高模型性能。

2. 机器学习的应用随着机器学习算法的发展以及计算能力的提升，机器学习在各个应用场景中都发挥着重要作用。

在自然语言处理领域中，机器学习被广泛应用于机器翻译、文本分类、情感分析等任务。

在图像识别领域中，机器学习被广泛应用于人脸识别、目标检测、图像分割等任务。

在医疗领域中，机器学习被广泛应用于疾病预测、药物研发等任务。

在金融领域中，机器学习被广泛应用于风险评估、投资分析等任务。

此外，机器学习还在自动驾驶、智能家居、工业自动化等领域中发挥着重要作用。

3. 机器学习的未来随着人工智能技术的不断发展，在未来，机器学习将继续成为人工智能领域的核心技术之一。

随着数据的爆炸式增长，更加丰富、更加多样化的数据对机器学习提出了更高的要求。

此外，随着深度学习等新的机器学习算法的发展，机器学习模型的实时性、灵活性和可解释性将得到进一步提升。

未来的机器学习也将不仅仅是面向企业和开发者，而是将普及到普通用户和消费者终端，为日常生活提供更多便利。

总之，机器学习的发展离不开交叉学科合作和技术创新，它为人工智能的发展奠定了坚实的基础。

机器学习(完整版课件)

• 聚类模型评估指标：轮廓系数、CalinskiHarabasz指数等。
模型评估与选择
交叉验证
通过多次划分训练集和验证集来评估模型的性能。
网格搜索
对不同的超参数组合进行穷举搜索，以找到最优的模型参数。
随机搜索
在指定的超参数范围内进行随机采样，以找到较好的模型参数。
03
监督学习
线性回归与逻辑回归
励。
马尔可夫决策过程
强化学习任务通常建模为马尔可夫决策过程（MDP），包括状态、动作、转移概率和奖励等要素。
值函数与策略函数
强化学习通过估计值函数（状态值函数或动作值函数）来评估不同行为的好坏，并根据策略函数来选择动作。
Q-learning与Sarsa算法
01
Q-learning算法
Q-learning是一种基于值迭代的强化学习算法，通过不断更新Q值表来
线性回归
一种通过最小化预测值与真实值之间的均方误差来拟合数据的统计方法。它假设因变量和自变量之间存在线性关系，并通过梯度下降等优化算法求解模型参数。
逻辑回归
一种用于解决二分类问题的广义线性模型。它使用sigmoid 函数将线性回归的输出映射到[0,1]区间，表示样本属于正类的概率。逻辑回归通过最大似然估计求解模型参数，并使用交叉熵作为损失函数。
• 嵌入法：在模型训练过程中进行特征选择。
特征选择与特征提取
根据领域知识提取有效特征。
自定义特征提取
卷积神经网络等。
图像特征提取
词袋模型、TF-IDF等。
文本特征提取
模型评估与选择
分类模型评估指标
准确率、精确率、召回率、F1分数等。
回归模型评估指标
均方误差、均方根误差、平均绝对误差等。

人工智能机器学习课件

20世纪80年代，机器学习成为了一个独立的学科领域，并出现了许多经典的机器学习算法，如决策树、支持向量机、朴素贝叶斯等。
进入21世纪后，随着大数据和深度学习技术的快速发展，机器学习得到了广泛的应用和推广，成为了人工
智能领域最热门的研究方向之一。
机器学习的应用领域
计算机视觉
自然语言处理
数据挖掘
医学诊断
机器学习在计算机视觉领域有着广泛的应用，如图像分类、目标检测、人脸识别等。
机器学习也被广泛应用于自然语言处理领域，如机器翻译、情感分析、智能问答等。
机器学习可以帮助企业从海量数据中挖掘出有价值的信息，如用户行为分析、市场趋势预测等。
机器学习在医学领域也得到了广泛的应用，如疾病预测、医学影像分析等。此外，机器学习还可以应用于金融风控、智能推荐、农业智能化等领域。
模型鲁棒性
模型对输入数据的微小变化应具有一定的稳定性，以保证泛化能力。
迁移学习能力
将在一个任务上学到的知识迁移到其他相关任务上的能力，有助于提高模型泛化性。
计算资源与效率问题
计算资源需求
深度学习模型通常需要大量的计算资源，包括高性能计算机、 GPU和TPU等。
模型训练时间
大型模型训练时间长，需要优化算法和分布式计算等技术来提高效率。
详细讲解协同过滤、内容推荐、混合推荐等推荐算法的原理和实
现。
实例分析
阐述用户画像的构建方法和精准营销的策略，包括用户分群、个
性化推荐等。
用户画像与精准营销
介绍推荐系统的评估指标和优化方法，如准确率、召回率、F1值等，以及A/B测试等实验设计方法。
推荐系统评估与优化
通过具体案例，如电商推荐系统、广告投放系统等，展示机器学习在推荐系统与精准营销领域的实践应用。

机器学习

第二阶段从20世纪60年代中叶到70年代中叶，这个时期主要研究将各个领域的知识植入到系统里，在本阶段的目的是通过机器模拟人类学习的过程。
研究现状
传统的研究现状
大数据环境下的研究现状
传统机器学习的研究方向主要包括决策树、随机森林、人工神经络、贝叶斯学习等方面的研究。
决策树是机器学习常见的一种方法。20世纪末期，机器学习研究者J.Ross Quinlan将Shannon的信息论引入到了决策树算法中，提出了ID3算法。1984年I.Kononenko、E.Roskar和I.Bratko在ID3算法的基础上提出了ASSISTANTAlgorithm，这种算法允许类别的取值之间有交集。同年，A.Hart提出了Chi-Squa统计算法，该算法采用了一种基于属性与类别关联程度的统计量。1984年L.Breiman、C.Ttone、R.Olshen和J.Freidman提出了决策树剪枝概念，极大地改善了决策树的性能。1993年，Quinlan在ID3算法的基础上提出了一种改进算法，即C4.5 算法。C4.5算法克服了ID3算法属性偏向的问题增加了对连续属性的处理通过剪枝，在一定程度上避免了“过度适合”现象。但是该算法将连续属性离散化时，需要遍历该属性的所有值，降低了效率，并且要求训练样本集驻留在内存，不适合处理大规模数据集。2010年Xie提出一种CART算法，该算法是描述给定预测向量X条件分布变量 Y的一个灵活方法，已经在许多领域得到了应用。CART算法可以处理无序的数据，采用基尼系数作为测试属性的选择标准。CART算法生成的决策树精确度较高，但是当其生成的决策树复杂度超过一定程度后，随着复杂度的提高，分类精确度会降低，所以该算法建立的决策树不宜太复杂。2007年房祥飞表述了一种叫SLIQ（决策树分类）算法，这种算法的分类精度与其他决策树算法不相上下，但其执行的速度比其他决策树算法快，它对训练样本集的样本数量以及属性的数量没有限制。SLIQ算法能够处理大规模的训练样本集，具有较好的伸缩性；执行速度快而且能生成较小的二叉决策树。SLIQ算法允许多个处理器同时处理属性表，从而实现了并行性。但是SLIQ算法依然不能摆脱主存容量的限制。

什么是机器学习？

什么是机器学习？机器学习是一种人工智能的分支技术，在这种技术中，计算机可以学习并进行决策，而无需明确的程序。

该技术可以通过分析数据集来提高计算机的性能和准确性。

以下是机器学习的详细介绍：一、机器学习的基本定义机器学习是指让计算机系统能够根据数据集自动进行学习和优化，而不是固定的算法。

与传统的计算机系统不同，机器学习的算法可以更好地适应和理解数据。

二、机器学习的类型1. 监督学习监督学习是指训练模型来预测特定输出值的一种方法。

在这种方法中，模型需要使用带有标签的数据集，并根据观察数据的结果进行训练，以便能够很好地匹配输入和输出。

2. 无监督学习无监督学习是一种机器学习的类型，其中模型不需要知道输出值。

相反，它只考虑输入数据和它的属性，从数据中识别出相似的联系和模式。

3. 增强学习增强学习是一种机器学习技术，其中计算机通过在一系列任务中学习来提高性能。

该算法通常被用于游戏中，以及其他需要决策的问题。

三、机器学习的应用1. 图像分类图像分类是机器学习的一种重要应用，包括对照片等图像进行分类。

该技术可以帮助计算机在不同的环境下自动进行分类，用于实现自动化的图像分类，节省了许多人力和时间成本。

2. 语言识别语言识别是一种机器学习的应用，可以帮助计算机界定一种语言的规则和模式，并且实现自然语言处理的自动化处理。

该技术被广泛地应用于聊天机器人、自然语言翻译和其他技术。

3. 健康监测机器学习还被用于健康监测领域，包括对医疗图像进行识别、监测健康状况和疾病预测等。

通过使用机器学习来识别关键指标，可以使得对健康情况的监测更加准确和方便。

结论机器学习是一种重要的技术，可以帮助计算机更好地理解、分析和应用数据。

通过使用机器学习技术，具有高度自适应性，可靠性和进展性，便可以让计算机系统更好地适应软件、硬件等不同的层面，提高它们的性能和应用范围。

机器学习的广泛普及，必将迎来更广阔的发展前景，为不同领域的专业人士提供更多更有用的技术支持。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

前言：这次实验完成的是图模型的精确推理。

exact inference分为2种，求边缘概率和求MAP，分布对应sum-product和max-sum算法。

这次实验涉及到的知识点很多，不仅需要熟悉图模型的representation，而且还需明白图模型的inference理论，大家可参考coursera课程：Probabilistic Graphical Models 的课件和视频。

多花点功夫去理解每行代码，无形之中会收获不少。

新年第一篇博客，继续加油！算法流程：Sum-product求条件概率过程为(inference I)：(a):输入factor list F、观察到的变量E(b):由F中的factor得到graph所对应的skeleton C.(c):依次进行变量消除，首先在图C中采用min-neighbors方法找到需要消除的变量。

然后进行消除(其实就是factor的求和积分)，消除过程中会用掉一些factor，同时也会生成一个新的factor(注意对新的factor补全各节点之间的边)。

每消除一个变量就会得到一个clique，同时更新该clique与前面已得clique之间的edge情况。

步骤c一直进行直到所有的变量都被消除掉。

结束后得到一棵clique tree.(d):由于上面的tree中有冗余的clique(即某个clique可能是其相邻clique的子集)。

这时需将这2个clique合并，该过程也称为树的剪枝：首先去点冗余的clique节点，然后将其sepset节点与该冗余节点其它所有邻节点都连接上边。

(e):前面步骤得到的是clique tree skeleton，还需要对每个clique算出其factor表格，由于clique中对应的子factor信息已掌握，所以直接factor相乘即可(注意观察变量E).该步骤完成后就真正得到了一棵clique tree了。

(f):接着对上面的clique tree进行message passing. 首先选出一个message通道，即找到那些clique i，和其连接的cliques中，只剩下一个clique j没有与之传递消息了，那么(I-->j即为通道)。

不过这还是得按照某种节点顺序进行。

(g):计算clique i发射到clique j的message,采用的方法是求和积分掉非公共元素。

(h):当clique tree中所有的message都传递完成后，clique tree就变成calibrate了，而calibrate具有很多良好的性质，首先可以获得calibrate时每个clique的belief.(i):如果要求某个变量的边缘概率，则找到包含该变量的一个clique(随便哪个都行)，在该clique上，对其belief求和积分掉其它所有变量，然后归一化即可。

Max-sum求概率最大时的assignment过程为(inference II)：(a)~(e):和sum-product过程一样。

(f):将factorlist中的val都取log值。

因为需要将max-product转换成对应的max-sum问题。

(g):和sum-product一样，对clique tree进行message passing. 首先选出一个message通道(I→j).(h):计算(I→j)之间的message. 采用的方法是max掉非公共元素。

(i):当clique tree中所有的message都传递完成后，clique tree就变成calibrate了，采用factorsum计算每个clique的belief.(j):如果要求某个变量的max-marginal，则找到包含该变量的一个clique(随便哪个都行)，在该clique上， max掉其belief 上其它所有变量，此时不需要归一化。

(k):通过步骤j，可以得到每个变量的max-marginal factor，找到需要assigment中元素对应的factor，取出其val中最大概率值对应的var，组合在一起为最终的结果。

Belief propagation流程如下：matlab知识：C = unique(A):如果A是向量，则C表示去掉了A中重复的元素(只保留1个)。

C = union(A,B):如果A和B是向量，则C为A和B的并集，且去掉了重复的元素(只保留1个)。

在matlab中，true只表示数字1,其它非1的数都不能表示，而false只表示0.所以其它整数既等于false也不等于true.实验code中一些函数简单说明：P = ComputeInitialPotentials(C):练习1所需完成的内容。

该函数的作用是计算clique tree P的初始势能。

其中C是P的骨架部分(骨架的意思是有clique节点，但是没有clique对应的factor，而这个函数的主要功能就是给每个clique都弄一个factor表)，C结构体包括节点nodes(每个node都是一个clique)，边之间的关系edges, 以及factor集合factorList. 返回的P结构包含2部分，clique tree节点之间边的edges, 以及clique集合cliqueList, 该集合的每个clique形式和factor 是一样的，其计算方法是：计算factorList中属于同一个clique的factor的乘积，并将新factor 中的assignment按照var按升序一一整理。

[i, j] = GetNextCliques(P, messages):练习2所需完成的内容。

该函数返回一个矩阵的下标索引i和j，意思是选择从clique i到clique j的消息用于下一次传递。

选择这个消息的依据是：与clique i连接的所有cliques中，只剩下一个clique j没有与之传递消息了，则(I,j)就是下一次所需传递的。

P = CliqueTreeCalibrate(P, isMax):实验3和实验6的内容。

其中P是clique tree，isMax如果为1，则置信传播时采用max-sum,,否则采用sum-product. 该函数的作用是对tree进行calibrate.[newF C E] = EliminateVar(F, C, E, Z):F为factorList, C为clique tree的骨架，E为factorList中factor edge的连接关系。

该函数作用是对F进行变量消除，消除的变量为Z。

newF为变量消除后得到的factorList. 返回的C中多了一个edge项和factorInds项，该edge表示两个clique之间的连接情况，而factorInds表示产生新的factor后还剩多少个factor(这个参数只在本函数内部使用，用来计算edge矩阵的，对外没作用)。

大概的实现思想为：将含有需消除变量的factor相乘得到一个新的factor，并对这个factor进行Z边缘化(积分掉Z)后得到更新的factor。

最新的factor和剩余暂时没有进行变量消除的factor放在一起，构成newF.C = PruneTree(C):C依旧为clique tree skeleton. 该函数是对C进行剪枝，依次扫描C的node i，如果某个node是它邻居node k的子集，则将i与k之间的边去掉，且将k与i的其它所有邻居node 相连接。

该处理的目的是为了维持RIP特性，获得更紧凑的clique tree.F = ObserveEvidence(F, E):F为一个factor的容器。

E为一个2列的矩阵，每1行代表1对观察值，其中第1个元素为变量名称v，第2个元素为该变量对应的值，假设为x。

作用是在F的每个factor中，只保留变量v等于x时对应assignment的值，而变量v等于其它值的assignment值都清0。

但不改变每个factor表格的大小，只是有很多0值的行而已。

P = CreateCliqueTree(F, Evidence):F为factorList，P为clique tree, Evidence为观察到的变量。

该函数是用F来构造P。

其大概过程为：用F构造骨架C，对C使用EliminateVar()进行变量消除，得到冗余的clique tree，接着调用pruneTree()对clique tree剪枝，去掉冗余的cliuqe。

最用调用ObserveEvidence()进行factor reduce, 同时函数ComputeInitialPotentials()获得clique 对应的table.B = FactorMarginalization(A, V):A，B为factor，V为变量的集合。

该函数的作用是在factor A上求和积分掉V中的元素，得到新的factor B.M = ComputeExactMarginalsBP(F, E, isMax):实验4和实验7的内容。

F为factorList，E为Evidence. 先调用CreateCliqueTree()创建clique tree, 然后调用CliqueTreeCalibrate()对树进行校正。

当isMax为0时，调用FactorMarginalization()计算边缘概率，否则用FactorMaxMarginalization()来计算。

B = FactorMaxMarginalization(A, V)：实验5的内容。

边缘化factor表，不过这时不是对V变量求和，而是求其中的最大值。

和函数FactorMarginalization()基本一样，需将sum改成max. 同时需要考虑当factor中val 值为负数的情况，如果所有这些值都为负数，则max后应该也为负数，而我们初始化时一开始B.val为0,要小心（加一个if语句判断即可）。

A = MaxDecoding( M ):实验8的内容。

找到M中每个元素的val向量值最大的那个所对应的var，并将该var赋给对应的A. 这就是max-decoding过程。

相关的理论知识点：主要参考Daphne Koller的PGM教材和courera教程，还有网友的PGM笔记。

factor的其它名字：affinity(密切关系), compatibility(兼容性),soft constraints. factor 与联合概率没有直接关系，还需考虑其它的factor.一个图G是一个分布P的I-map是指图G所诱导出的独立性断言是P独立性断言的子集。

如果图G是分布P的I-map,则分布P可以按照图G来分解。

机器学习&数据挖掘笔记_20(PGM练习四：图模型的精确推理)

合集下载

什么是机器学习

什么是机器学习？

机器学习基础课件

机器学习课件ppt

机器学习精选ppt精选全文

机器学习是什么？

机器学习(完整版课件)

人工智能机器学习课件

机器学习

什么是机器学习？

文档推荐

最新文档