最大熵模型及其在自然语言处理中的应用

格式：ppt
大小：1.08 MB
文档页数：39

下载文档原格式

平滑的最大熵模型在汉语词性自动标注中的应用

１最大熵模型
最大熵的主要思想是，只掌握关于未知分在布的部分知识时，该选取符合这些知识且熵值应
（）尔科夫的关于独立性假设（定第＋３马假
１个符号出现这个事件的概率只跟其前的个符
收稿日期：０６０ —８２０ —７１基金项目：吉林省科技厅平台建设基金资助项目（吉科合字２００１０３０６号）作者简介：￣Ｉ（９５）男，１７－，汉族，山东荷泽人，长春工业大学硕士研究生，要从事人工智能方向研究．＊联系人：主赵伟（９７）男，１６－，汉族，吉林长春人，春工业大学副教授，学硕士，长工主要从事人工智能、Ａｇｎ多ｅｔ系统、软件自动化与程序分析研究，Ｅｍａｌｐｉｃ１０＠１３ｔｍ．－ｉｒｎｅ２５６．ｏ：
另一个优点是，以有效地利用自然语言中存在可
的一些非连续特征。由于最大熵的这些优点，使
其成）元模型处理的文本，个单词只能２由某
跟前几个词有关；
ＺＨＡＯ — ｉｇ，ＺＨＡＯｅＦａｘｎＷｉ
（ｃｏｆＣＳｈｏｌｏｏｍｐｔｒＡｐｉａｉｎＴｅｈｏｏｙ，ＣｈｎｃｕｉｅｓｔｆＴｅｈｎｌｇｕｅｐｌｔｏｃｎｌｇｃａｇｈｎＵｎｖｒｉｙｏｃｏｏｙ，Ｃｈａｃｕ３０２，Ｃｈｉａｎｇｈｎ１０１ｎ）

最大熵模型简介

P {p | Ep( f j ) E~p( f j ),1 j k}
H ( p) p(x) log2 p(x)
x
p* arg max H ( p)
最大熵模型
❖ 例如：给定一个词
假定已知存在四种词性：名词、动词、介词、指代词 ❖ 如果该词在语料库中出现过，并且属于名词的概率为70%，则判断
Generative Model vs. Discriminative Model
❖ Generative Model (GM): P(Y|X)=P(X|Y)P(Y)/P(X)，通过求解P(X|Y)和P(Y)来求解P(Y|X)
❖ Discriminative Model (DM): 对P(Y|X)直接建模
纲要
❖ 最大熵原理 ❖ 最大熵模型定义 ❖ 最大熵模型中的一些算法 ❖ 最大熵模型的应用 ❖ 总结 ❖ 思考题
最大熵模型(Maximum Entropy
Model)
❖
假设有一个样本集合 (x1, x2 ,... xn )
特征(j对f1, pf2的...制fk )约可以表示为
，我们给出k个特征 , Ep( f j ) E~p( f j )
p(X=3)=p(X=4)=p(X=5)=p(X=6)=0.1
最大熵原理
❖ 最大熵原理：1957 年由E.T.Jaynes 提出。 ❖ 主要思想：
在只掌握关于未知分布的部分知识时，应该选取符合这些知识但熵值最大的概率分布。
❖ 原理的实质：
前提：已知部分知识关于未知分布最合理的推断＝符合已知知识最不确定或最随机的推断。这是我们可以作出的唯一不偏不倚的选择，任何其它的选择都意味着我们增加了其它的约束和假设，这些约束和假设根据我们掌握的信息无法作出。

自然语言处理中常见的命名实体识别工具(Ⅲ)

自然语言处理中常见的命名实体识别工具自然语言处理（NLP）是一门涉及计算机和人类语言之间交互的学科，它涉及语音识别、语言理解、语言生成等一系列技术。

在NLP的研究和应用中，命名实体识别（NER）是一个非常重要的任务。

它指的是在文本中识别并定位出指定类别的实体，比如人名、地名、组织机构名等。

在这篇文章中，我将会介绍一些常见的命名实体识别工具，并分析它们的优缺点。

1. Stanford NERStanford NER是斯坦福大学自然语言处理组开发的一款命名实体识别工具。

它基于条件随机场（CRF）算法，可以识别出包括人名、地名、组织机构名在内的多种实体。

Stanford NER在准确性和性能上都有很高的表现，特别是对于英文文本的处理效果非常出色。

然而，Stanford NER也存在一些缺点，比如对于一些特定领域或者非英文文本的处理能力不足。

2. NLTKNLTK是自然语言处理领域非常知名的工具包，它提供了丰富的文本处理功能，包括命名实体识别。

NLTK中的命名实体识别模块使用了最大熵模型（MaxEnt）和支持向量机（SVM）等算法，可以对不同类型的实体进行准确识别。

此外，NLTK还支持多种语言的文本处理，对于跨语言的NLP任务有很好的适应性。

然而，NLTK的性能并不是特别突出，尤其是在处理大规模文本时可能会出现效率较低的情况。

3. SpacySpacy是一款流行的NLP工具包，它不仅提供了命名实体识别功能，还包括分词、词性标注、句法分析等一系列功能。

Spacy的命名实体识别模块基于卷积神经网络（CNN）和递归神经网络（RNN）等深度学习模型，因此在实体识别的准确性和泛化能力上有一定优势。

此外，Spacy还提供了多语言支持和自定义实体类型的功能，可以满足不同应用场景的需求。

然而，Spacy也存在一些局限性，比如对于一些特定领域的实体识别效果可能不够理想。

4. LTPLTP（Language Technology Platform）是一款由哈尔滨工业大学开发的自然语言处理工具包，它提供了包括分词、词性标注、命名实体识别等多种功能。

基于最大熵模型的中文姓名识别

建立统计模型，并运用该模型计算姓名概率。系统采用真实语料进行开放测试的结果表明，在保证一定准确率的情况下，系统召回率可达
９％以上。Ｏ
关健诃：中文姓名识别；最大熵；特征函数
Ｉｅｔｆａｉｎ０ｉｅｅＮａｅｓｄ０ａｉｕＥｎｒｐｏｅｄｎｉｃｔｏｆＣｈｎｓｍｓＢａｅｎＭｘｍｍｔｏｙＭｄｌｉ
最大熵的概念反映了人类对世界的一个朴素的认识原
基于规则的方法通过对中文姓名的构成及上卜文信息进行分析归纳，建立起规则集，纯粹采用规则方法的模型比较少，一般要结合统计方法来进行识别。基于统计的方法统计姓名样本库或真实文本语料库得到训练统计模型所需的统计信息，并通过建立统计模型对姓名进行识别。文献【】４的方法使用统计语料库获得的概率信息计算姓名用字可信度、构词
方法。Ｊ
采用真实语料进行开放测试的结果表明，在保证一定准确率
的情况下，召回率可达９％以上。０
２最大熵模型
最大熵模型是一种性能良好且适应性、灵活性极好的统
计模型，它可以从数据中提取各种相关或不相关的特征并进
行综合处理，对许多问题的处理结果都达到或超过了其它方法。近些年来，最大熵模型被广泛地应用于自然语言处理中，包括分词、词性标注、词义排歧、机器翻译、文本分类等。
则：知之为知之，不知为不知。具体来说，对于一个事件，往往只了解它的部分情况，对于其它情况则一无所知。那么对这个事件建立模型时，对于已知的部分要尽量地拟合，使模型符合已知的情况。对于未知的情况，则保持均匀分布，即保持未知状态。

最大熵正态分布

最大熵正态分布摘要：一、最大熵原理简介1.最大熵的提出背景2.最大熵的基本概念二、最大熵与正态分布的关系1.正态分布的特性2.最大熵在正态分布中的应用三、最大熵正态分布的实战应用1.数据建模2.机器学习3.信息论四、最大熵正态分布的优缺点1.优点2.缺点五、总结与展望1.最大熵正态分布的重要性2.未来研究方向与发展前景正文：一、最大熵原理简介1.最大熵的提出背景最大熵原理起源于信息论领域，是由克劳德·香农（Claude Shannon）在1948年提出的一种熵最大化原则。

在当时，香农致力于研究通信系统中的信源编码问题，即在有限的带宽条件下，如何高效地传输信息。

最大熵原理为解决这个问题提供了一个理论依据。

2.最大熵的基本概念最大熵原理主张在所有可能的概率分布中，选择具有最大熵的分布作为最优解。

熵是信息论中衡量信息不确定性的量度，最大熵原则就是要求在传输信息时，不确定性越大，信息传输的效率越高。

二、最大熵与正态分布的关系1.正态分布的特性正态分布（Normal Distribution）是一种在自然界和科学技术领域中广泛存在的概率分布。

它的特点是，随着自变量x的变化，概率密度函数呈钟形曲线分布，具有均值μ和标准差σ的两个参数。

2.最大熵在正态分布中的应用在许多实际问题中，最大熵正态分布可以用来描述数据的不确定性。

由于正态分布具有自然的钟形曲线特征，它可以很好地反映数据的中庸趋势。

在最大熵原理的指导下，我们可以根据实际数据来确定正态分布的参数，从而实现对数据的不确定性描述。

三、最大熵正态分布的实战应用1.数据建模最大熵正态分布可以用于数据建模，例如在自然语言处理领域，我们可以用最大熵正态分布来描述词义消歧、语义角色标注等问题。

通过最大熵正态分布，我们可以更好地捕捉到文本中的不确定性，从而提高模型预测的准确性。

2.机器学习在机器学习领域，最大熵正态分布可以用于生成模型。

例如，在语音识别中，最大熵正态分布可以用于生成语音信号的频谱图，从而实现对语音信号的建模。

最大摩尔熵

最大摩尔熵什么是最大摩尔熵？最大摩尔熵（Maximum Entropy，简称MaxEnt）是一种统计学和信息论的方法，它用于识别和建模不确定性系统，以解决许多统计学问题。

它的核心理念是“越不确定，越有可能正确”。

也就是说，最大摩尔熵的假设是，给定一些约束条件，越不确定的模型更可能正确地预测结果。

最大摩尔熵方法可以用来确定模型的参数。

首先，最大摩尔熵有其基本定义，即将熵定义为熵函数：S（P）= - Σi pi log pi，其中pi是模型在状态i上的概率。

熵函数表示系统的不确定性，因此最大摩尔熵的目标是最大化熵函数，以表示最大的不确定性。

其次，最大摩尔熵的最大化过程可以用来提取和学习模型参数。

在这种情况下，我们需要确定模型的参数以使模型的熵函数最大化，即使得模型的不确定性最大。

最大摩尔熵的最大化可以通过极大似然估计（MLE）来实现，MLE可以用来估计模型的参数，使得模型与观测数据尽可能接近，从而最大化模型的熵函数。

此外，最大摩尔熵还有一个重要的应用，即在机器学习和自然语言处理中，最大摩尔熵可以用来评估不同模型的性能。

在机器学习中，模型的性能可以通过比较它们的熵值来评估，熵越大，模型的性能越好。

因此，最大摩尔熵方法可以帮助我们识别和选择最佳模型，以便有效地解决实际问题。

最后，最大摩尔熵方法在很多领域都有广泛的应用。

例如，它可以应用于统计学、计算机视觉、自然语言处理、金融风险模型、分类器训练、社会网络分析等。

总之，最大摩尔熵是一种统计学和信息论的方法，它的核心理念是“越不确定，越有可能正确”，其目标是最大化熵函数以表示最大的不确定性，可以用来提取和学习模型参数，评估不同模型的性能，以及在许多领域中有着广泛的应用。

因此，最大摩尔熵方法是一种有效的解决实际问题的重要方法。

自然语言处理常见算法

自然语言处理常见算法自然语言处理(Natural Language Processing,简称NLP)是计算机科学、人工智能、语言学等领域的交叉学科。

它主要研究基于计算机的自然语言处理，即使计算机能够与人在自然语言环境中进行有效的交流。

在研究NLP的过程中，需要利用一些常见的算法来实现自然语言处理的功能。

本文将介绍一些常用的自然语言处理算法。

1. 分词算法分词（Tokenization）是将一段自然语言文本按照定义好的规则进行分割，将其分割成一个个有意义的小段。

分词算法是NLP中最基础的算法之一，它将输入文本分割成一个个词语，即所谓的token。

常见的分词算法有：1.1 最大正向匹配算法最大正向匹配算法指从文本开始位置开始，尽量把长词语分出来，匹配成功后从该词语后开始新词的匹配，直到整个文本处理完成。

这个算法的缺点是它无法处理未登录词（即没有出现在词典里的词）。

最大逆向匹配算法与最大正向匹配算法类似，只不过是从文本末尾开始向前匹配。

最大双向匹配算法是将最大正向匹配算法和最大逆向匹配算法结合起来使用。

具体来说，它先使用最大正向匹配算法对文本进行分词，然后再使用最大逆向匹配算法，对切分后的结果进行确认和修正。

词性标注（Part-of-Speech Tagging，简称POS Tagging）,也叫词类标注、词性标定，是标注文本中的每个词汇的词性的过程。

它是自然语言处理的一个重要步骤，它基于文本内容为每个单词推断词性，并建立词性标注体系。

常见的词性标注算法包括：2.1 隐马尔可夫模型(Hidden Markov Model,简称HMM)隐马尔可夫模型是以马尔可夫链为基础的统计模型，它通过词性转移概率和观测概率来对文本进行词性标注。

2.2 递归神经网络(Recurrent Neural Networks, 简称RNN)递归神经网络是一种可以自动处理序列数据的神经网络体系结构。

在NLP中，RNN被广泛用于自然语言处理任务中，如词性标注、命名实体识别和语言翻译。

C语言编程中的自然语言处理与机器翻译

C语言编程中的自然语言处理与机器翻译随着人工智能的快速发展，自然语言处理和机器翻译成为了计算机科学领域中的热门话题。

在C语言编程中，也有很多涉及自然语言处理和机器翻译的应用。

本文将介绍C语言编程中的自然语言处理和机器翻译相关知识，并通过实例讲解其实现方法。

一、自然语言处理（Natural Language Processing）自然语言处理（NLP）是计算机科学和人工智能领域中的一个重要研究方向，旨在帮助计算机理解和处理人类语言。

在C语言编程中，我们可以利用NLP技术来处理文本数据、语音数据等。

1. 文本分词（Text Segmentation）文本分词是NLP中的一个基础任务，它将一段连续的文本划分成若干个词语或者单词。

在C语言编程中，我们可以使用分词算法来实现文本分词的功能。

常见的分词算法有最大匹配法、正向最大匹配法、逆向最大匹配法等。

2. 词性标注（Part-of-Speech Tagging）词性标注是NLP中的一个重要任务，它将一个句子中的每个词语标注为相应的词性。

在C语言编程中，我们可以使用词性标注模型来实现词性标注的功能。

常见的词性标注模型有隐马尔可夫模型、最大熵模型等。

3. 句法分析（Syntactic Parsing）句法分析是NLP中另一个重要任务，它分析句子的语法结构。

在C 语言编程中，我们可以使用句法分析算法来实现句法分析的功能。

常见的句法分析算法有基于规则的句法分析算法、统计句法分析算法等。

二、机器翻译（Machine Translation）机器翻译（MT）是将一种自然语言文本自动翻译成另一种自然语言文本的技术。

在C语言编程中，我们可以使用机器学习算法来实现机器翻译的功能。

1. 统计机器翻译（Statistical Machine Translation）统计机器翻译是机器翻译中的一种主流方法，它基于大量的双语语料库进行训练，通过统计模型来预测句子的翻译结果。

在C语言编程中，我们可以使用统计机器翻译算法来实现机器翻译的功能。

基于最大熵方法的统计语言模型

擅
要
针时现有统计语言模型中存在计算量过走和系统负担过重的问题，谊支提出了一种基于最走埔方法的境计语
言模型。模型在参数估计阶较，引入约束最恍化理论中拉格朗日乘数定理扣牛顿选代算法，以确保模型在多个约束条件中可豢出最恍化参叛值；在特征选择降收．采用计算近似增益的平行算法，解块模型计算量过大扣系境开锖问题。将馥模
（ｅａｔｎｏｕｏｔｎＮｎｉｇＵｉｅｓｙｏｃｎｅａｄＴｃｎｌｙＮｎｉ１０４Ｄｐｒｔｆａｔｉ，ａｊｎｖｒｉｆＳｉｃｎｅｈｏｏ，ａｊｇ２０９）ｍｅｍａｏｎｔｅｇｎ
ＡｂｔａｔＴｏｖｈｒｂｅｏｏｕａｉｎｌｅｐｎｉｅｅｓａｄｓｓｍｓｎｉｇｏｈｔｔｔｓｌｎｕｇｄｌｉｓｒｃ：ｏｓｌｅｔｅｐｌｍｆｃｍｐｔｔａｘｅｓｖｎｓｎｙｔｐｄｎｆｔｅｓｉｉａｇａｅｍｏｅｎｏｏｅｅａｓｃ
型用于汉语甸子分析的软件实驻中表明：型具有较高的计算效率扣鲁棒性。模
美 ■ 词自然语言处理统计语言模型最走墒方法
文章鳙号１０ — ３１（０２０ — ０３０文献标识码Ａ０２８３一２０）５０５－３中图分类号ＴＩＰ８
ｅｉｔｎｅ，ｏｔｆｍａｈｍａｃｌｏｔｍｓｆｔｅｓａｉｔｓｌｎｕｇｍｏｅａｅｉｔｅｍａｉｍｎｒｐａｐｏｃｉｘｓｃａｓｒｅｏｔｅｔａｇｒｈｏｈｔｔｉａｇａｅｉｉｓｃｄｌｂｓｄＯｌｈｘｍｕｅｔｙｐｒａｈｓｏ

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

最大熵模型建模框架图
训练样例
例子：我们的任务是为词“打”的词性标注过程建立
模型，标注模型为p，每个可能的词性为p(t)。
“打”的可能词性：{动词，量词，介词}
由此，模型p的第一个约束：
p(动词)+p(量词)+p(介词)=1
训练样例

在训练最大熵模型时，任务选连系统通过数据转换程序或者模式识别中通常所说的特征抽取器，把真实世界的，原始训练数据通过特定的方法或者算法转化为多维特征或属性表示的训练样例。条件最大熵方法是一种有监督的机器学习方法，所以每个训练样例由一个实例x以及他的目标概念类y组成。
基于最大熵的统计建模：建模理论

最大熵统计模型需要解决的问题：
特征空间的确定——问题域特征选择——寻找约束条件建立统计模型——基于最大熵理论建立熵最大的模型
基于最大熵的统计建模：数学描述

问题描述：设最终输出值构成的语言学类别有限集为 Y，对于每个 y∈Y，其生成均受上下文信息 x的影响和约束。已知与y有关的所有上下文信息组成的集合为X，则模型的目标是：给定上下文x∈X，计算输出为y∈Y的条件概率p(y|x)。
（
2）从训练样例中得到经验概率分布：其中 Count(x,y)是(x,y)在语料中出现的次数，N为总词数。则
基于最大熵的统计建模：数学推导
（ 3 ）特征 f 是指 x 与 y 之间存在的某种特定的关系，用
二值函数表示：
（4）特征的经验概率期望值是所有满足特征要求的的
经验概率之和，即：
引入特征：例子

2018/10/8
对熵的感性认识

熵就是不确定性的变化程度。熵与变量本身含义或值无关，只和变量的可能取值范围有关。
例子

举个例子，一个快餐店提供 3 种食品：汉堡(B)、鸡肉(C)、鱼(F)。价格分别是 1元、2元、3元。已知人们在这家店的平均消费是 1.75元，求顾客购买这 3 种食品的概率。如果你假设一半人买鱼另一半人买鸡肉，那么根据熵公式，这不确定性就是1位（熵等于1）。但是这个假设很不合适，因为它超过了你所知道的事情。我们已知的信息是： p(B)+p(C)+p(F)=1 1p(B)+2p(C)+3p(F)=1.75

训练样例：例子
每个样例将包含“打”周围的词语x，如图，以及在此
场合下“打”的词性y。
基于最大熵的统计建模：数学推导
（1）模型输入：从人工标注的训练数据中抽取的训练
样本集T={(x1, y1)，(x2, y2)，……，(xn, yn)}，(xi, yi) 表示在语料库中出现yi时其上下文信息为xi。
最大熵方法及其在自然语言处理中的应用
吕先超 2015年1月21日
最大熵理论

熵信息熵最大熵理论最大熵模型参数估计特征选择最大熵模型的应用

2018/10/8
2
熵：物理学中的熵

物理学概念：
宏观上：热力学定律——体系的熵变等于可逆过程吸收或耗散的热量除以它的绝对温度（克劳修斯， 1865）

2018/10/8
熵：信息熵

和熵的联系 —— 熵是描述客观事物无序性的参数。香农认为信息是人们对事物了解的不确定性的消除或减少，他把不确定的程度称为信息熵（香农，1948）随机事件的信息熵：设随机变量ξ，他有A1,A2,…,An共n种可能的结局每个结局出现的概率分别为 p1,p2,…,pn，则其不确定程度，即信息熵为:

总结一下。以上，我们根据未知的概率分布表示了约束条
件，用这些约束条件消去了两个变量，用剩下的变量表示
熵，最后求出了熵最大时剩余变量的值，结果就求出了一个符合约束条件的概率分布，它有最大不确定性，我们在概率估计中没有引入任何偏差。
熵公式的理解：熵的性质

0≤H(X) ≤log|X|
第一个等号在X为确定值的时候成立（没有变化的可能）

以及关于对概率分布的不确定性度量，熵： H=-p(B)log(p(B))-p(C)log(p(C))-p(F)log(p(F)) 对前两个约束，两个未知概率可以由第三个量来表示，可以得到： p(C)=0.75-2p(F) p(B)=0.25+p(F) 把上式代入熵的表达式中，熵就可以用单个概率 p(F)来表示,对这个单变量优化问题，很容易求出当p(F)=0.216时，有最大熵H=1.517

微观上：熵是大量微观粒子的位置和速度的分布概率的函数，是描述系统中大量微观粒子的无序性的宏观参数（波尔兹曼，1872）
结论：熵是描述事物无序性的参数，熵越大则无序性越强。

2018/10/8
熵：自然界中的熵增原理

熵增原理是熵在自然界的变化规律一个孤立系统的熵，自发性地趋于极大，随着熵的增加，有序状态逐步变为混沌状态，不可能自发的产生新的有序结构。当熵处于最小值，即能量集中程度最高、有效能量处于最大值时，那么整个系统也处于最有序的状态，相反为最无序状态。熵增原理预示着自然界越变越无序。
第二个等号在X均匀分布的时候成立

最大熵理论：熵增原理

在无外力作用下，事物总是朝着最混乱的方向发展事物是约束和自由的统一体事物总是在约束下争取最大的自由权，这其实也是自然界的根本原则在已知条件下，熵最大的事物，最可能接近它的真实状态

最大熵原则下点的分布：
对一随机过程，如果没有任何观测量，即没有任增加约束条件继续增加约束条件何约束，则解为均匀分布。
引入1个特征：
基于最大熵的统计建模：数学推导
（5）特征的期望概率是特征在所学习的随机事件中的
真实分布为：

其中，(y|x)是指x出现的情况下，y的经验概率 p(y|x) 是指 x 出现的情况下， y 的真实概
基ห้องสมุดไป่ตู้最大熵的统计建模：建模理论

以最大熵理论为基础的统计建模

为什么可以基于最大熵建模呢？
Jaynes证明：对随机事件的所有相容的预测中，熵最大的预测出现的概率占绝对优势 Tribus 证明，正态分布、伽玛分布、指数分布等，都是最大熵原理的特殊情况。

基于最大熵的统计建模：建模理论

结论：最大熵统计建模是以最大熵理论为基础的一种选择模型的方法，即从符合条件的分布中选择熵最大的分布作为最优的分布

最大熵模型及其在自然语言处理中的应用

合集下载

平滑的最大熵模型在汉语词性自动标注中的应用

最大熵模型简介

自然语言处理中常见的命名实体识别工具(Ⅲ)

基于最大熵模型的中文姓名识别

最大熵正态分布

最大摩尔熵

自然语言处理常见算法

C语言编程中的自然语言处理与机器翻译

基于最大熵方法的统计语言模型

文档推荐

最新文档

最大熵模型及其在自然语言处理中的应用

合集下载

平滑的最大熵模型在汉语词性自动标注中的应用

最大熵模型简介

自然语言处理中常见的命名实体识别工具(Ⅲ)

基于最大熵模型的中文姓名识别

最大熵 正态分布

最大摩尔熵

自然语言处理 常见算法

C语言编程中的自然语言处理与机器翻译

基于最大熵方法的统计语言模型

文档推荐

最新文档

最大熵正态分布

自然语言处理常见算法