当前位置:文档之家› 自然语言处理导论课程讲义

自然语言处理导论课程讲义

第一讲绪论

https://www.doczj.com/doc/9212290021.html,/alcourse/nlp

自然语言处理导论课程讲义

0 引子

我们可以期待,总有一天机器会同人在所有的智能领域里竞争起来。但是,如何开始呢?这是一个很难决定的问题。许多人以为可以把下棋之类的极为抽象的活动作为最好的出发点,不过,还有一种办法也应加以考虑,就是为机器配备具有智能的、可用钱买到的意识器官,然后,教这种机器理解并且说英语。这个过程可以仿效通常小孩子学话的方式进行。我不能确定到底哪个出发点更好,但应该都值得一试。

——A. M. Turing, Computing Machinery and Intelligence,

Mind Vol.59, 1950.

交谈

甲:听说吴妈打赢了阿Q。

乙:不错,阿Q确实被吴妈打败了。甲:这个结果有些出人意料。

乙:阿Q是大意失荆州,怪不得别人。

图灵测试(Turing Test)

一个封闭的小屋里面有两间房A和B,其中一间房中是人,一间是机器

屋外有一个人H

H向A,B房内的实体提出各种问题

H根据来自A,B的回答判断A,B中谁是计算机,谁是人

如果H无法判断,则证明计算机具有人的智能

Eliza问答系统

(by Joseph Weizenbaum, MIT, early 1960s)

Young woman: Men are all alike.

Eliza: In what way?

Young woman: They're always bugging us about something specific or other. Eliza: Can you think of a specific example?

Young woman: Well, my boyfriend made me come here.

Eliza: Your boyfriend made you come here?

Young woman: He says I'm depressed much of the time.

Eliza: I am sorry to hear you are depressed.

Young woman: It's true. I'm unhappy.

Eliza: Do you think coming here will help you not to be unhappy?

Young woman: I need some help, that much seems certain.

Eliza: What would it mean to you if you got some help?

Young woman: Perhaps I could learn to get along with my mother.

Eliza: Tell me more about your family.

Young woman: My mother takes care of me.

Eliza: Who else in your family takes care of you?

Young woman: My father.

Eliza: Your father.

Young woman: You are like my father in some ways.

Eliza: What resemblance do you see?

Searle的“Chinese Room”

哲学家约翰·西尔勒(John R. Searle)否认可以模拟大脑算法的计算机具有意识,他在上个世纪80年代给出了一个著名的理想实验“西尔勒的中文屋子”来支持他的论点。

实验(改编版)的要旨是这样的:

一个用中文讲的笑话,中国人听了会哈哈大笑。如果用一台可以执行复杂算法的计算机根据这个笑话的词句进行一系列运算,得出的结果正确,也是“哈哈大笑”,于是计算机用它自己的方式笑了几声,我们是否可以认为这台计算机“理解”了这个笑话呢?

类似的,用一大群不懂中文的美国人取代计算机,他们拿着铅笔和纸重复计算机所做的一切,因为算法很复杂,可能要全美不懂中文的美国人算上一年才得到了结果“哈哈大笑”,他们派一个代表出来笑了几声。虽然反应很慢,但他们和一个中国人做得一样好,不过,这样仍然无法认定这群美国人“理解”了这个中文笑话。

Searle, John. R. (1980) Minds, brains, and programs. In

Behavioral and Brain Sciences3 (3): 417-457

关于语言,我们了解多少?

(1)人用来交际的“语言”具有什么样的性质?这些性质又是如何影响交际过程的?

(2)人用来交际的“语言”跟机器可以“理解”的语言有什么样的关系(相同和不同)?

(3)人是如何运用“语言”进行交际的?

(4)人运用语言进行交际的过程是否可以描述为一个机械的过程?

(5)什么叫做“理解”一种语言?

……

机器语言

定义

计算语言学(Computational Linguistics)指的是这样一门学科,它通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的。

1 计算语言学的研究内容

从计算的角度来研究语言的性质

将语言作为计算对象来研究相应的算法

1.1 从计算角度研究语言

所谓从计算的角度来看语言的性质,就是要求将人们对语言的结构规律的认识以精确的、形式化的、可计算的方式呈现出来,而不是像其他语言学研究那样,在表述语言的结构规律时一般采用非形式化的表达形式。

例子

2a 吴妈以前很喜欢阿Q 的理论

2b * 吴妈以前把阿Q 的理论很喜欢

2c * 阿Q 的理论以前被吴妈很喜欢

1a 张三已经赶跑了李四

1b 张三已经把李四赶跑了

1c 李四已经被张三赶跑了

语法规律

1)汉语中的一个基本句型是:

P0: X +动词+Y

2)P0可以变换为“把”字句或“被”字句

P1: X+把+Y+动词

P2: Y+被+X+动词

3)P0满足条件C1,C2,…C i时可以变换为P1,P2;

否则,不可以变换为P1,P2;

1.2 将语言作为计算对象

所谓将语言作为计算对象来研究相应的算法,是研究如何以机械的、规定了

严格操作步骤的程序来处理语言对象(主要是自然语言对象,当然也可以是形式语言对象),包括一个语言片断(比如词组、句子或篇章)中大小语言单位的识别,该语言片断的结构和意义的分析(自然语言理解),以及如何生成一个语言片断来表达确定的意思(自然语言生成),等等

算法(algorithm)

(1)通用性:算法是针对一类问题的,

而不仅仅是用于解决某

一个具体问题。

(2)机械性:算法的每一个步骤都是机械

的,确定的。

(3)有限性:算法必须在有限步内结束。(4)离散性:算法的输入数据及输出数据

都是离散的符号。

算法实例(2):求最佳路径HI=5

GI=2FH=4FG=6EH=5EG=7DH=4DG=3CF=10CE=8CD=7BF=8BE=11BD=9AC=3AB=2

从A 到I 的最佳路径是哪一条?

动态视角(流程)

S1:研究者以特定的方式对自然语言(NL0)的规律进行抽象,以计算机能够处理的形式来表述关于自然语言的规律——得到语言知识K;

S2:针对特定的语言知识表示形式,研制适合的分析和处理算法;S3:根据算法编制计算机可执行的自然语言处理程序P。这样的程序加上语言知识,加上计算机硬件系统,共同构成一个自然语言处理系统(NLPs);

S4:用这样一个自然语言处理系统对自然语言NL0进行分析处理,根据反馈的结果调整原来的设计,改进NLPs。

人工智能教案,07章 自然语言处理7.1 概述

7.1 概述 自然语言是指人类语言集团的本族语,如汉语、英语、日语等,以及人类用与交流的非发声语言,如手语、旗语等。自然语言是相对于人造语言而言的。人造语言是指世界语或计算机的各种程序设计语言。 众所周知,语言是思维的载体,是人际交流的最重要工具。 在人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机的应用而言,据统计用于数学计算的仅占10%,用于过程控制的不到5%,其余85%左右都是用于语言文字的信息处理。在信息化社会中,语言信息处理的技术水平和每年所处理的信息总量已成为衡量一个国家现代化水平的重要标志之一。 在社会发展需求下,自然语言理解作为语言信息处理技术的一个高层次的重要方向,一直是人工智能界所关注的核心课题之一。显然,如果计算机能够理解自然语言,人-机间的信息交流能够以人们所熟悉的本族语言来进行,那将是计算技术的一项重大突破。另一方面,由于创造和使用自然语言是人类高度智能的表现,因此对自然语言理解的研究也有助于揭开人类智能的奥秘,深化我们对语言能力和思维本质的认识。 那么什么叫"自然语言理解"?正如什么是"智能"一样,对于"理解"这个术语也存在着各式各样的认识。在人工智能界,或者语言信息处理领域中,人们普遍认为可以采用著名的图灵

(Turing)试验来判断计算机是否"理解"了某种自然语言。 相比较人工智能其它领域,自然语言理解是难度大,进展小的。至今为止未能达到很高的水平。 Turing提出的智能实验,参加者是计算机、被实验的人以及主持实验的人。由主持人提出问题,计算机和被实验的人来回答,被实验者在回答问题时尽可能的向主持人表示他是"真正"的人,计算机也尽可能逼真的模仿人的思维。如果主持人通过听取对问题的回答分辨不出哪个是人的回答,哪个是机器的回答时,便可认为被试验的计算机是有智能的了。有人对这样设计的实验提出了疑义,他们认为这种实验只反映了结果的比较而没有涉及思维的过程,而且也没明确此人是个孩子还是有良好素质的成年人参加了实验。当一个计算机系统能给出有关问题的正确答案或有用的建议、而解决问题所用的概念和推理与人相当、还能解释推理过程时,便可说这样的计算机系统是有智能的了。 本章将讨论自然语言理解的概念、发展简史以及系统组成与模型等;然后,逐一研究语言的自动分析、句子的自动理解、语言的自动生成和机器翻译等重要问题。 7.1.1 自然语言理解 怎样判断一个机器对人类的自然语言是理解了?没有通用的答案。通常我们同样可以用"图灵"实验来得到结论。判断"自然语言理解"的主要方面有如右页所示: ·问题应答:机器能正确的回答输入文本的有关问题。

《大数据技术原理与应用》课程标准

《大数据技术原理与应用》课程标准 一、课程信息 课程名称:大数据技术原理与应用课程类型:考查课 课程代码:授课对象:物联网工程专业本科班,物联网创新班 学分:先修课:物联网导论、操作系统教程、编程 学时:后续课:智能家居、智能物流、云计算 制定人:理艳荣、张海兰制定时间: 二、课程性质 《大数据技术》是一门专业选修课,大数据技术入门课程,为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。 课程将系统讲授大数据的基本概念、大数据处理架构、分布式文件系统、分布式数据库、数据库、云数据库、分布式并行编程模型、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在、、和等重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技术。 三、课程设计 1.课程目标设计 (1)能力目标 总体目标:通过学习大数据相关理论知识,掌握大数据的系统架构及关键技术以及具体应用场景,并结合具体设计实例,培养学生创新意识和实践能力。 件系统的重要概念、体系结构、存储原理和读写过程,并熟练掌握分布式文件系统的使用方法; ()能够了解分布式数据库的访问接口、数据模型、实现原理和运行机制,并熟练掌握的使用方法; ()能够了解数据库与传统的关系数据库的差异、数据库的四大类型以及数据库的三大基石;基本掌握、等数据库的使用方法; 具体目标:

序号单项能力目标 能够掌握大数据的基本概念 能够掌握相关的数据管理、存储、分析计算等的技术基础 能够掌握的相关知识 通过对数据库的学习和编程设计,掌握的使用方法 掌握大数据知识体系的系统架构 (2)知识目标 序号知识目标 了解分布式文件系统的基本概念、结构和设计需求,掌握的概念 了解布式数据库的访问接口、数据模型、实现原理和运行机制 了解数据库与传统的关系数据库的差异、数据库的四大类型以及数据库的三大基石 了解云数据库的概念、基本原理和代表性产品的使用方法 2.课程内容设计 ()设计的整体思路:面向实践,以理论知识与具体应用相结合的方式介绍大市聚。理 论结合实际,由浅入深,加强对大数据概念及技术的理解与巩固。此课程划分为下列模块。 ()模块设计表: 模块名称学时 介绍大数据的基本概念和应用领域,并阐述大数据、云计 算和物联网的相互关系 介绍大数据处理架构 分布式文件系统的基本原理和使用方法 分布式数据库的基本原理和使用方法 数据库的概念和基本原理 云数据库的概念和基本原理 分布式并行编程模型原理和使用方法 架构再探讨 总复习 合计 3.教学进度表设计

人工智能时代下的自然语言处理技术发展应用

人工智能时代下的自然语言处理技术发展应用 摘要:如今,随着人工智能的迅速发展,自然语言处理技术已经成为互联网应 用中的一个炙手可热的研究方向,各大公司也都投入巨额资金和高端人力。但是,在高速发展过程中的自然语言处理技术仍然面临着巨大挑战。在这样的背景下, 本文主要探讨了人工智能时代下的自然语言处理技术发展应用有关内容,可供参考。 关键词:人工智能;自然语言;处理技术;发展应用 1自然语言处理的概述 自然语言处理是使用计算机对自然语言的音,形,义进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成的操作和加工。主要包括自然 语言理解和自然语言生成两个流程。其中自然语言理解是指计算机能够理解自然 语言的意义。自然语言生成是指计算机能够以自然语言来表达给定的意图。 2自然语言处理的相关技术和应用分析 2.1个性化智能推荐 个性化智能推荐以自然语言文本挖掘为基础,具有信息过滤的作用,能够以 用户档案或者历史行为记录为依据,对用户的兴趣爱好进行学习,进而围绕给定 物品岀发,对用户的偏好或者评分进行预测。电子商务发展过程当中,信息处理 面临着信息过载的问题,用户如何在快速增长的资源中对自己所需信息进行准确 定位,是一个重要的问题,正如同商家需要向用户提供精准恰当的服务一般,都 存在一定难度。推荐系统的诞生极大地缓解了这个困难。通过跟踪用户在商城的 浏览、选购、下单等行为,提供基于用户行为的商品推荐,提高商品曝光率和用 户决策效率。“猜你喜欢”、“购买过此商品的用户还购买过……”对于离不开社交平台、电商、生活服务的现代互联网用户来说,个性化推荐已经不是什么新鲜事儿。它改变了商家与用户的沟通方式,加强了和用户之间的交互性。据报道,推荐系 统给亚马逊带来了35%的销售收入,给Netflix带来了高达75%的消费,而且Youtube主页上60%的浏览来自推荐服务。在新闻服务领域,以细分化的数据分 析为基础的个性化新闻推送已经成为新闻客户端的重要方式。通过用户个人的信 息阅读内容、时长、评论等偏好,以及社交网络甚至所使用的移动终端设备机型等,综合分析用户所关注的信息源与信息核心词汇,进而进行专业的细化分析, 从而进行新闻整理推送,基本实现了新闻的个人定制服务.让平台更“懂”用户,提 升了用户体验和粘性。 2.2语音识别技术 以机器为支持来对过程进行识别和理解,促进语音信号向文本与命令技术的 转变,这就是语音识别技术的整个过程,从本质上来说,就是确保人类的语言能 够为机器所理解,促进人类语音词汇内容向计算机可读数据的转化,从而满足应 用需求。在这一过程当中,需要将连续讲话进行合理分解,建立规则以准确理解 语义。前端降噪、语音切割分帧等都是语音识别技术的重要流程,可将其框架分 为声学模型、语言模型以及解码这三个方面。在智能家居领域,普通家庭都会有 很多需要红外遥控器控制的家电,由于红外线传输会受到空间位置影响,一个可 将多个遥控设备集中于一体并且可以通过声音控制其常用功能的集成设备,能自 动切断电源,调换频道。双手没有空闲的状态下,可以通过语音来与智能音箱进

人工智能期末试题及答案完整版

xx学校 2012—2013学年度第二学期期末试卷 考试课程:《人工智能》考核类型:考试A卷 考试形式:开卷出卷教师: 考试专业:考试班级: 一单项选择题(每小题2分,共10分) 1.首次提出“人工智能”是在(D )年 A.1946 B.1960 C.1916 D.1956 2. 人工智能应用研究的两个最重要最广泛领域为:B A.专家系统、自动规划 B. 专家系统、机器学习 C. 机器学习、智能控制 D. 机器学习、自然语言理解 3. 下列不是知识表示法的是 A 。 A:计算机表示法B:“与/或”图表示法 C:状态空间表示法D:产生式规则表示法 4. 下列关于不确定性知识描述错误的是 C 。 A:不确定性知识是不可以精确表示的 B:专家知识通常属于不确定性知识 C:不确定性知识是经过处理过的知识 D:不确定性知识的事实与结论的关系不是简单的“是”或“不是”。 5. 下图是一个迷宫,S0是入口,S g是出口,把入口作为初始节点,出口作为目标节点,通道作为分支,画出从入口S0出发,寻找出口Sg的状态树。根据深度优先搜索方法搜索的路径是 C 。 A:s0-s4-s5-s6-s9-sg B:s0-s4-s1-s2-s3-s6-s9-sg C:s0-s4-s1-s2-s3-s5-s6-s8-s9-sg D:s0-s4-s7-s5-s6-s9-sg 二填空题(每空2分,共20分) 1.目前人工智能的主要学派有三家:符号主义、进化主义和连接主义。 2. 问题的状态空间包含三种说明的集合,初始状态集合S 、操作符集合F以及目标

状态集合G 。 3、启发式搜索中,利用一些线索来帮助足迹选择搜索方向,这些线索称为启发式(Heuristic)信息。 4、计算智能是人工智能研究的新内容,涉及神经计算、模糊计算和进化计算等。 5、不确定性推理主要有两种不确定性,即关于结论的不确定性和关于证据的不确 定性。 三名称解释(每词4分,共20分) 人工智能专家系统遗传算法机器学习数据挖掘 答:(1)人工智能 人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等 (2)专家系统 专家系统是一个含有大量的某个领域专家水平的知识与经验智能计算机程序系统,能够利用人类专家的知识和解决问题的方法来处理该领域问题.简而言之,专家系统是一种模拟人类专家解决领域问题的计算机程序系统 (3)遗传算法 遗传算法是一种以“电子束搜索”特点抑制搜索空间的计算量爆炸的搜索方法,它能以解空间的多点充分搜索,运用基因算法,反复交叉,以突变方式的操作,模拟事物内部多样性和对环境变化的高度适应性,其特点是操作性强,并能同时避免陷入局部极小点,使问题快速地全局收敛,是一类能将多个信息全局利用的自律分散系统。运用遗传算法(GA)等进化方法制成的可进化硬件(EHW),可产生超出现有模型的技术综合及设计者能力的新颖电路,特别是GA独特的全局优化性能,使其自学习、自适应、自组织、自进化能力获得更充分的发挥,为在无人空间场所进行自动综合、扩展大规模并行处理(MPP)以及实时、灵活地配置、调用基于EPGA的函数级EHW,解决多维空间中不确定性的复杂问题开通了航向 (4)机器学习 机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎 (5)数据挖掘 数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。数据挖掘的

面向大数据时代的专业课程体系建设研究

面向大数据时代的专业课程体系建设 研究

面向大数据时代的专业课程体系建设 1. 大数据时代的特点及其对专业人才的特殊需求分析 重点分析大数据时代特点、大数据技术发展趋势及其对信息技术专业人才的特殊需求。特别是从大数据理念、技术和方法在农业领域的实践,分析农业大数据应用研究。了解涉及到水、土、光、热、气候资源,作物育种、种植、施肥、植保、过程管理、收获、加工、存储、机械化等各环节的农业大数据特征,探索多类型复杂数据采集、挖掘、处理、分析与应用等问题。在此基础上,了解大数据时代对专业人才的特殊需求。 2. 面向大数据需求的我院本科专业设置优化 系统地分析我院本科专业设置及其缺位问题,结合当前中国学科体系及本科专业设置,提出我院面向大数据需求的本科专业调整与优化方案。 (1)我院本科专业设置及其缺位分析:近年来,我院学科建设及本科专业建设取得来显著地发展。学院现在涵盖电气工程与自动化、信息工程与计算机两大学科群,拥有7个本科专业、11个硕士学位授权点和3个博士学位授权点,一个“农业电气化与自动化”国家级重点学科,成为实力雄厚、基础扎实的电气、电子与信息工程学科领域的高级专门人才培养教育基地和科学研究、技术开发与科技成果转化基地。可是,由于受到当前中国学科体系及本科专业设置的限制,面对大数据时

代的特殊人才需求我院本科专业设置表现得特别滞后,本科专业设置与建设存在明显的缺位问题。 (2)当前中国学科体系及本科专业设置分析:专业设置是高等教育部门根据科学分工和产业结构的需要所设置的学科门类。它是人才培养规格的重要标志。在教育部的学科划分中,学科门是最高级别的学科,共有13个:理学、工学、农学、医学、哲学、经济学、法学、教育学、文学、历史学、军事学、管理学、艺术学;比学科门低一级的学科称为学科类,学科类(不含军事学)共有71个;比学科类再低一级的学科称为专业;专业就是高考生填报的志愿,本科专业(不含军事学)共有258个。本科专业设置上由于受到中国学科体系及本科专业设置规范与管理,需要严格遵照相关的要求与规范。可是,国家层面的学科体系及本科专业设置存在滞后问题,因此需要本科专业设置上能够遵循就近的原则。分析当前中国学科体系及本科专业设置,探索面向大数据需求的相近专业及其设置是本部分研究的重要内容。 (3)面向大数据需求的我院本科专业优化:由于农业大数据是由结构化和非结构化数据构成,对大数据分析与处理的技术发生了巨大变化,因此与传统信息学科人才教育内容与培养目标显著不同,大数据时代对专业人才的特殊需求决定了面向大数据需求的我院本科专业设置与优化的方向及其建设内容。经过整合与优化我院本科专业设置,能够为面向大数据需求的专业课程体系建设提供了前提条件与基础支撑。 3. 面向大数据需求的专业课程体系建设

自然语言理解技术

自然语言理解技术,未来人工智能的核动力 摘要:自然语言理解是人工智能研究重要的领域之一,同时也是目前前沿的难题之一。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是未来人工智能的核动力。因此理解自然语言理解以及自然语言理解技术的含义,阐述自然语言理解的研究及其相关应用,综述自然语言理解技术研究方向变化并对自然语言理解的发展前景进行分析和展望,是十分有意义的。 关键词:自然语言理解技术;智能信息服务; 1.引言: 随着计算机科学的不断发展和成熟,计算机应用开始迈人知识处理、语言理解阶段,人们对计算机的智能提出了新的要求随着社会的日益信息化,人们越来越强烈地希望能更好地同计算机交流。自然语言就是这样一个媒介。 2. 1自然语言理解的含义: 广义的“语言”是任何一种有结构的符号系统。其中, 最重要的两类语言,自然语言和形式语言。而狭义的“语言”是人类在社会牛活中发展出来的用来互相交际的声音符号系统,是“自然语言”。 “自然语言理解”即Natural Language Understanding 俗称人机对话,指的就是使计算机来按照这种语言所表达的意义做出相应反应的机制。它主要研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。这在当前新技术革命的浪潮中占有十分重要的地位。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解、分析并回答自然语言(即人们日常使用的各种通俗语言)的结果。2. 1自然语言理解技术的含义: 首先, 自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用自如, 但却无法把自己母语的构成规律、意义的表达规律和语言使用的规律用计算机可以接受的方式彻底说清楚。传统的语言学是在没有计算机参照的条件下发展起来的, 虽然为自然语言理解积累了宝贵的财富, 但那是讲给人的, 真正要让语言学知识变成计算机上可操作的, 绝不是那么简单, 也不能那么模糊。这个目标的实现,需要大量又懂语言学又懂计算机的人在正确的技术路线的指导下一起做非常大规模的基本建设, 绝不是一拍脑袋想出个“绝招”就能解决的。 其次, 自然语言的各个层次上都含有巨大的不确定性。在语音和文字层次上,有一字多

牛津大学社会数据科学授课型研究生申请要求

牛津大学 社会数据科学 授课型研究生申请要求

牛津大学简介 学校名称牛津大学 学校英文名称University of Oxford 学校位置英国 | 英格兰 | 牛津 2020 QS 世界排名4 牛津大学概述 牛津大学(University of Oxford),简称“牛津”(Oxford),位于英国牛津,是世界顶尖的公立研究型大学,采用书院联邦制。截止至2019年3月,牛津大学的校友、教授及研究人员中,共有72位诺贝尔奖得主(世界第九)、3位菲尔兹奖得主(世界第二十)、6位图灵奖得主(世界第九)。 2019- 20年度,牛津大学位列于2020THE世界大学排名世界第1 ,2020QS世界大学排名世界第4 ,2020USNews世界大学排名世界第5 ,2019世界大学学术排名世界第7 ,2019泰晤士高等教育世界大学声誉排名世界第5。特别的是,牛津大学于2017- 2020年连续四年在THE世界大学排名中位列世界第1。 社会数据科学专业简介 社会数据科学中的多学科理科硕士提供了分析有关人类行为的非结构化异构数据所需的社会和技术专业知识,从而有助于我们了解人类世界。 以数字方式生成的社交数据(例如,来自社交媒体,通信平台,物联网(IoT)设备,传感器/可穿戴设备和移动电话)提供了一种积累新的大规模数据的方法,除了现有的具有已转换为数字格式。这些数据可以投入使用,帮助我们了解社会科学,行业和政策制定者至关重要的重大问题,包括社会,经济和政治行为,人际关系,市场设计,群体形成,身份,国际运动,道德和负责任的方式来增强数据的社会价值,以及许多其他主题。 社会数据科学专业相关信息 专业名称社会数据科学 专业英文名称Social Data Science MSc

自然语言处理的关键技术

自然语言处理的关键技术 自然语言处理技术是所有与自然语言的计算机处理有关的技术的统称,其目的是使计算机理解和接受人类用自然语言输入的指令,完成从一种语言到另一种语言的翻译功能。自然语言处理技术的研究,可以丰富计算机知识处理的研究内容,推动人工智能技术的发展。下面我们就来了解和分析自然语言处理的关键技术。 一、常用技术分类 1、模式匹配技术 模式匹配技术主要是计算机将输入的语言内容与其内已设定的单词模式与输入表达式之间的相匹配的技术。例如计算机的辅导答疑系统,当用户输入的问题在计算机的答疑库里找到相匹配的答案时,就会完成自动回答问题的功能。但是不能总是保证用户输入的问题能得到相应的回答,于是很快这种简单匹配式答疑系统有了改进。答疑库中增加了同义词和反义词,当用户输入关键词的同义词或反义词时,计算机同样能完成答疑,这种改进后的系统被称为模糊匹配式答疑系统。 2、语法驱动的分析技术

语法驱动的分析技术是指通过语法规则,如词形词性、句子成分等规则,将输入的自然语言转化为相应的语法结构的一种技术。这种分析技术可分为上下文无关文法、转换文法、ATN文法。上下文无关文法是最简单并且应用最为广泛的语法,其规则产生的语法分析树可以翻译大多数自然语言,但由于其处理的词句无关上下文,所以对于某些自然语言的分析是不合适的。转换文法克服了上下文无关文法中存在的一些缺点,其能够利用转换规则重新安排分析树的结构,即能形成句子的表层结构,又能分析句子的深层结构。但其具有较大的不确定性。ATN文法扩充了转移网络,比其他语法加入了测试集合和寄存器,它比转移文法更能准确地分析输入的自然语言,但也具有复杂性、脆弱性、低效性等缺点。3、语义文法 语义文法的分析原理与语法驱动相似,但其具有更大的优越性。语义文法中是对句子的语法和语义的共同分析,能够解决语法驱动分析中单一对语法分析带来的不足。它能够根据句子的语义,将输入的自然语言更通顺地表达出来,除去一些语法正确但不合语义的翻译。但是语义文法分析仍然有不容忽视的缺点,其分析的语句中有时会出现不合语法的现象,并且这类分析较为复杂,语义类难以确定,语义的规则太多……因此,语义文法技术仍需要改进措施。 4、格框架约束分析技术

自然语言处理

自然语言处理 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、 计算机科学、数学于一体的科学。 因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,包括中文、英文、俄 文、日文、德文、法文等等,所以它与语言学的研究有着密切的联系,但又有重要的区别。 自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机 系统,特别是其中的软件系统。因而它是计算机科学的一部分。 语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类 的多种智能都与语言有着密切的关系。人类的逻辑思维以语言为形式,人类的绝大部分知识 也是以语言文字的形式记载和流传下来的。因而,它也是人工智能的一个重要,甚至核心部 分。 用自然语言与计算机进行通信,这是人们长期以来所追求的。因为它既有明显的实际意 义,同时也有重要的理论意义:人们可以用自己最习惯的语言来使用计算机,而无需再花大

量的时间和精力去学习不很自然和习惯的各种计算机语言;人们也可通过它进一步了解人类 的语言能力和智能的机制。 实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然 语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。因 此,自然语言处理大体包括了自然语言理解和自然语言生成两个部分。历史上对自然语言理 解研究得较多,而对自然语言生成研究得较少。但这种状况近年来已有所改变。 无论实现自然语言理解,还是自然语言生成,都远不如人们原来想象的那么简单,而是 十分困难的。从目前的理论和技术现状看,通用的、高质量的自然语言处理系统,仍然是较 长期的努力目标,但是针对一定应用,具有相当自然语言处理能力的实用系统已经出现,有 些已商品化,甚至开始产业化。典型的例子有:多语种数据库和专家系统的自然语言接口、 各种机器翻译系统、全文信息检索系统、自动文摘系统等。 自然语言处理,即实现人机间自然语言通信,或实现自然语言理解和自然语言生成是十 分困难的。造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的

北大中文系书单

北大中文系有着现代语言学的传统。早在民国初年,钱玄同就已经在所开设的音韵学课上试图给上古韵部拟音;刘半农则在北大建立起中国第一个语音乐律实验室。建国后由于院系调整,中山大学语言学系并入北大中文系语言专业,在高名凯先生主持的语言学教研室的基础上,又增加了王力先生主持的汉语教研室,此时语言学科的格局和语言学的课程体系已基本形成。文革结束后,汉语教研室又一分为二,至此形成语言学、现代汉语、古代汉语三个教研室三分的局面,并保持至今。 现在的中文系本科设中国文学、古典文献学、汉语言学以及应用语言学四个专业。汉语言学专业继承自更早的语言学专业,名称上的一字之差道出了背后的沧桑。语言专业本来是独自设目招生,后来为了宽口径通识教育的需要,与文学、文献专业同时招生,学生在三年级时才真正进入专业学习。因此,本科的语言学专业课程设置中,对一二年级开设的课程较少,三年级开始才丰富起来。 这一系列本科的课程中,多数都有值得纪念的历史。比如现代汉语语法,朱德熙先生讲授的时候,几百人的教室常常爆满;汉语史课最初由王力先生主讲,唐作藩先生和郭锡良先生讲授的时候,虽然有了简单的分工,但是谁有了任务,另一个人都能一口气讲下来。这些佳话,连同语言学的传统一起传承下来。 除了常年开设的课程之外,北大中文系也会经常邀请校外的老师来开课。远的比如50年代吕叔湘先生来讲授《马氏文通》;80年代梅祖麟先生讲授近代汉语、罗杰瑞先生讲授福建方言;最近的有蔡维天老师讲授制图理论,张伯江、方梅两位老师讲授功能语法,等等。不过,综观这一份本科的课程设置,虽然有历史的沉淀,却不能说完备,甚至有一些陈弊。当然这是多方面因素交织的结果,此处按下不表。希望小编的介绍,能够对想来北大中文系读研的同学有所帮助。有的读者可能会问,研究生的课程设置呢不要着急,小编以后还会慢慢介绍的。 中文系外的院系,也有语言学相关的方向,如外国语学院(外国语言学,本科开设普通语言学、语言与认知、英语结构、英语词汇学、英语史及其他具体语言的语言学课程)、计算语言所、心理学系(心理语言学)、哲学系(语言哲学),但在本科阶段很少开设系统的语言学课程,小编这里就不作介绍了。 这里每一门课程,小编都列出课程开设的学期、主要内容以及参考书目。当然,整体设置会随着中文系课程设置的调整而变动,本文列出的是2014年的最新版。每门课程的情况也会随着主讲老师们的变化而调整,仅仅用作参考。限于篇幅,其中语义学、现代汉语句法研究、汉语史、汉语方言等部分课程的书目,小编做了一些删节。相关书目的介绍亦从略,微刊另有专门的“语言学书目”系列文章,敬请关注。 01一年级第一学期必修: 现代汉语(上) 讲授现代汉语的概貌及语音、音系和词汇系统。 教材:《现代汉语》(增订本),北京大学中文系现代汉语教研室编,商务印书馆《现代汉语》,沈阳、郭锐主编,高等教育出版社参考书目:《现代汉语专题教程》,北大中文系现代汉语教研室编《语音学教程》(增订版),林焘、王理嘉著,王理嘉、王韫佳增订,北京大学出版社《音系学基础》,王理嘉,语文出版社 《现代汉语词汇》(增订本),符淮青,北京大学出版社

人工智能期末试题及答案完整版(最新)解读

一单项选择题(每小题2分,共10分) 1.首次提出“人工智能”是在(D )年 A.1946 B.1960 C.1916 D.1956 2. 人工智能应用研究的两个最重要最广泛领域为:B A.专家系统、自动规划 B. 专家系统、机器学习 C. 机器学习、智能控制 D. 机器学习、自然语言理解 3. 下列不是知识表示法的是 A 。 A:计算机表示法B:“与/或”图表示法 C:状态空间表示法D:产生式规则表示法 4. 下列关于不确定性知识描述错误的是 C 。 A:不确定性知识是不可以精确表示的 B:专家知识通常属于不确定性知识 C:不确定性知识是经过处理过的知识 D:不确定性知识的事实与结论的关系不是简单的“是”或“不是”。 5. 下图是一个迷宫,S0是入口,S g是出口,把入口作为初始节点,出口作为目标节点,通道作为分支,画出从入口S0出发,寻找出口Sg的状态树。根据深度优先搜索方法搜索的路径是 C 。 A:s0-s4-s5-s6-s9-sg B:s0-s4-s1-s2-s3-s6-s9-sg C:s0-s4-s1-s2-s3-s5-s6-s8-s9-sg D:s0-s4-s7-s5-s6-s9-sg 二填空题(每空2分,共20分) 1.目前人工智能的主要学派有三家:符号主义、进化主义和连接主义。 2. 问题的状态空间包含三种说明的集合,初始状态集合S 、操作符集合F以及目标状态集合G 。 3、启发式搜索中,利用一些线索来帮助足迹选择搜索方向,这些线索称为启发式(Heuristic)信息。 4、计算智能是人工智能研究的新内容,涉及神经计算、模糊计算和进化计算等。 5、不确定性推理主要有两种不确定性,即关于结论的不确定性和关于证据的不确 定性。 三名称解释(每词4分,共20分) 人工智能专家系统遗传算法机器学习数据挖掘

从语言学到深度学习nlp一文概述自然语言处理

从语言学到深度学习nlp一文概述自然语言处理 自然语言处理(NLP)近来因为人类语言的计算表征和分析而获得越来越多的关注。它已经应用于许多如机器翻译、垃圾邮件检测、信息提取、自动摘要、医疗和问答系统等领域。本论文从历史和发展的角度讨论不同层次的NLP 和自然语言生成(NLG)的不同部分,以呈现NLP 应用的各种最新技术和当前的趋势与挑战。 1 前言 自然语言处理(NLP)是人工智能和语言学的一部分,它致力于使用计算机理解人类语言中的句子或词语。NLP 以降低用户工作量并满足使用自然语言进行人机交互的愿望为目的。因为用户可能不熟悉机器语言,所以NLP 就能帮助这样的用户使用自然语言和机器交流。 语言可以被定义为一组规则或符号。我们会组合符号并用来传递信息或广播信息。NLP 基本上可以分为两个部分,即自然语言理解和自然语言生成,它们演化为理解和生成文本的任务(图1)。 图1:NLP 的粗分类 语言学是语言的科学,它包括代表声音的音系学(Phonology)、代表构词法的词态学(Morphology)、代表语句结构的句法学(Syntax)、代表理解的语义句法学(Semantics

syntax)和语用学(Pragmatics)。 NLP 的研究任务如自动摘要、指代消解(Co-Reference Resolution)、语篇分析、机器翻译、语素切分(Morphological Segmentation)、命名实体识别、光学字符识别和词性标注等。自动摘要即对一组文本的详细信息以一种特定的格式生成 一个摘要。指代消解指的是用句子或更大的一组文本确定哪些词指代的是相同对象。语篇分析指识别连接文本的语篇结构,而机器翻译则指两种或多种语言之间的自动翻译。词素切分表示将词汇分割为词素,并识别词素的类别。命名实体识别(NER)描述了一串文本,并确定哪一个名词指代专有名词。光学字符识别(OCR)给出了打印版文档(如PDF)中间的文字信息。词性标注描述了一个句子及其每个单词的词性。虽然这些NLP 任务看起来彼此不同,但实际上它们经常多个任务协同处理。 2 NLP 的层级 语言的层级是表达NLP 的最具解释性的方法,能通过实现内容规划(Content Planning)、语句规划(Sentence Planning)与表层实现(Surface Realization)三个阶段,帮助NLP 生成文本(图2)。 图2:NLP 架构的阶段 语言学是涉及到语言、语境和各种语言形式的学科。与NLP 相关的重要术语包括:

自然语言处理的单词嵌入及表征方法

自然语言处理的单词嵌入及表征方法 简介 过去几年,深度神经网络在模式识别中占绝对主流。它们在许多计算机视觉任务中完爆之前的顶尖算法。在语音识别上也有这个趋势了。 虽然结果好,我们也必须思考……它们为什么这么好使? 在这篇文章里,我综述一下在自然语言处理(NLP)上应用深度神经网络得到的一些效果极其显著的成果。我希望能提供一个能解释为何深度神经网络好用的理由。我认为这是个非常简练而优美的视角。 单隐层神经网络 单隐层神经网络有一个普适性(universality):给予足够的隐结点,它可以估算任何函数。这是一个经常被引用的理论,它被误解和应用的次数就更多了。 本质上这个理论是正确的,因为隐层可以用来做查询表。 简单点,我们来看一个感知器网络(perceptron network)。感知器(perceptron)是非常简单的神经元,如果超过一个阈值它就会被启动,如果没超过改阈值它就没反应。感知器网络的输入和输出都是是二进制的(0和1)。 注意可能的输入个数是有限的。对每个可能的输入,我们可以在隐层里面构建一个只对这个输入有反应的神经元(见注解1)。然后我们可以利用这个神经元和输出神经元之间的连接来控制这个输入下得到的结果(见注解2)。

这样可以说明单隐层神经网络的确是有普适性的。但是这也没啥了不起的呀。你的模型能干和查询表一样的事并不能说明你的模型有任何优点。这只能说明用你的模型来完成任务并不是不可能的罢了。 普适性的真正意义是:一个网络能适应任何你给它的训练数据。这并不代表插入新的数据点的时候它能表现地很理想。 所以普适性并不能解释为什么神经网络如此好用。真正的原因比这微妙得多…为了理解它,我们需要先理解一些具体的成果。 单词嵌入(Word Embeddings) 我想从深度学习研究的一个非常有意思的部分讲起,它就是:单词嵌入(word embeddings)。在我看来,单词嵌入是目前深度学习最让人兴奋的领域之一,尽

2019人工智能与健康试题及答案

2019人工智能与健康试题及答案 一、单项选择题 1.()是集机械、电子、控制、计算机、传感器、人工智能等多学科先进技术于一体的现代制造业重要的自动化装备。 D.工业机器人 2.()是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。 B.机器翻译 3.()是人工智能的核心,是使计算机具有智能的主要方法,其应用遍及人工智能的各个领域。 B.机器学习 4.()是人以自然语言同计算机进行交互的综合性技术,结合了语言学、心理学、工程、计算机技术等领域的知识。 A.语音交互 5.()是通过建立人工神经网络,用层次化机制来表示客观世界,并解释所获取的知识,例如图像、声音和文本。 A.深度学习 6.()是研究用计算机系统解释图,像实现类似人类视觉系统理解外部世界的一种技术,所讨论的问题是为了完成某一任务需要从图像中获取哪些信息,以及如何利用这些信息获得必要的解释。 B.图像理解 7.()是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。 A.专家系统 8.()是一种处理时序数据的神经网络,常用于语音识别、机器翻译等领域。 C.循环神经网络 9.()是一种基于树结构进行决策的算法。 B.决策树 10.()是用电脑对文本集按照一定的标准进行自动分类标记。

C.文本分类 11.()是指能够按照人的要求,在某一个领域完成一项工作或者一类工作的人工智能。 C.弱人工智能 12.()是指能够自己找出问题、思考问题、解决问题的人工智能。 B.强人工智能 13.()是指在各个领域都比人类要强的人工智能。 A.超人工智能 14.()是指直接通过肢体动作与周边数字设备和环境进行交互。 A.体感交互 15.()是自然语言处理的重要应用,也可以说是最基础的应用。 C.文本分类 16.()宣布启动了“先进制造伙伴计划”“人类连接组计划”“创新神经技术脑研究计划”。 C.美国 17.()中共中央政治局就人工智能发展现状和趋势举行第九次集体学习。 B.2018年10月31日 18.《“健康中国2030”规划纲要》中提到,健康是经济社会发展的() B.基础条件 19.《“健康中国2030”规划纲要》中提到,全民健康是建设健康中国的() D.根本目的 20.1997年,Hochreiter&Schmidhuber提出()。 D.长短期记忆模型 21.2005年,美国一份癌症统计报告表明:在所有死亡原因中,癌症占() A.1/4 22.2012年,Hinton教授小组在ImageNet竞赛中夺冠,降低了几乎()的错误率。 B.50% 23.2017年,卡内基梅隆大学开发的一个人工智能程序在()大赛上战胜了四位人类玩家,这在人工智能发展史上具有里程碑式的意义。 C.德州扑克 24.50年前,人工智能之父们说服了每一个人:“()是智能的钥匙。” B.逻辑 25.癌症的治疗分为手术、放疗、化疗。据WTO统计,有()的肿瘤患者需要接受放疗。

新版自然语言处理导论课复习提纲课件.doc

“自然语言处理导论”课复习提纲 上半部分(参考材料:课程讲义) 第1讲绪论:什么是自然语言处理(NLP) 1.请举例说明自然语言和人工语言有哪些差异。 2.请举例说明语言知识与自然语言处理之间的关系。 第2讲中文文本的自动分词 3.计算机对中文文本进行自动分词的困难主要有哪些? 4.请概括说明最大匹配法分词和最大概率法分词的基本思想。二者是什么关系? 5.分词质量的常用评价指标主要有哪些? 第3讲词性标注方法 6.请举例说明汉语的基本句法结构类型有哪些,各类结构的主要特点是什么。 7.请举例说明汉语的主要词类有哪些,各类词的特点是什么。 8.请概述用隐马尔可夫(HMM)模型进行词性标注的基本思想是什么。 9.请概述韦特比算法(Viterbi)的主要过程。 10.请概述基于转换的错误驱动的词性标注方法的主要思想及其处理流程。 第4讲汉语的句法结构分析(上) 11.什么是有限状态文法,上下文无关文法,两种文法的区别是什么。 12.自底向上的句法分析与自顶向下的句法分析的区别是什么。 13.Earley算法。 14.Tomita算法。Tomita算法对LR算法的主要改进是什么。 第5讲汉语的句法结构分析(下) 15.请举例说明句法结构歧义有哪些不同的类型。 16.什么是特征结构?请举例说明如何运用特征结构表达自然语言知识。 17.什么是合一运算(Unification)?请举例说明如何运用合一运算表达自然语言知识。 18.请概述如何在Earley算法中融入合一运算。 第6讲语义分析* 19.请举例说明自然语言中形式和意义之间的对应关系有哪些情况。 20.义素分析法。 21.配价分析法。 22.请举例说明如何利用语义知识来帮助消除句法结构分析中的歧义。 *不在考题范围内但属于本课程应掌握的知识内容。

人工智能期末试题及答案完整版

人工智能期末试题及答案 完整版 Prepared on 21 November 2021

xx学校 2012—2013学年度第二学期期末试卷考试课程:《人工智能》考核类型:考试A卷 考试形式:开卷出卷教师: 考试专业:考试班级: 一单项选择题(每小题2分,共10分) 1.首次提出“人工智能”是在(D )年 2. 人工智能应用研究的两个最重要最广泛领域为:B A.专家系统、自动规划 B. 专家系统、机器学习 C. 机器学习、智能控制 D. 机器学习、自然语言理解 3. 下列不是知识表示法的是 A 。 A:计算机表示法B:“与/或”图表示法 C:状态空间表示法D:产生式规则表示法 4. 下列关于不确定性知识描述错误的是 C 。 A:不确定性知识是不可以精确表示的 B:专家知识通常属于不确定性知识 C:不确定性知识是经过处理过的知识 D:不确定性知识的事实与结论的关系不是简单的“是”或“不是”。 5. 下图是一个迷宫,S0是入口,S g是出口,把入口作为初始节点,出口作为目标节点,通道作为分支,画出从入口S0出发,寻找出口Sg的状态树。根据深度优先搜索方法搜索的路径是 C 。 A:s0-s4-s5-s6-s9-sg B:s0-s4-s1-s2-s3-s6-s9-sg C:s0-s4-s1-s2-s3-s5-s6-s8-s9-sg D:s0-s4-s7-s5-s6-s9-sg 二填空题(每空2分,共20分) 1.目前人工智能的主要学派有三家:符号主义、进化主义和连接主义。 2. 问题的状态空间包含三种说明的集合,初始状态集合S、操作符集合F以及目标状态集合G 。 3、启发式搜索中,利用一些线索来帮助足迹选择搜索方向,这些线索称为启发式(Heuristic)信息。

北京大学数据科学专业本科生教学大纲草案2015072501

数据科学专业 一、专业简介 数据科学是运用概率统计、分布式计算、现代软件等综合知识探索来自商业贸易,生物医疗,金融证券,社交网络等众多领域的较大规模或结构复杂数据集的高效存储、高效管理、高效概括、深入分析和精准预测的科学和艺术。 二、专业培养要求、目标 运用统计分析、机器学习、分布式处理等技术,能从大量数据中提取对科学研究和生产实践有意义的信息,以可视化等技术通过通俗易懂的形式传达给决策者,并创造出新的数据运用服务的人才。 三、授予学位 理学学士 四、学分要求与课程设置 总学分:134学分,其中: 1.必修课程75学分; 2.选修课程41学分; 3.毕业论文/设计6学分; 4.本科素质教育通选课12学分; 并须同时满足下列选课要求: 1)全校公共必修课程:32学分

2)大类平台课程:43学分,其中非本院系课程不低于8学分 必修:35学分 选修:数学科学学院本科生可以在下面由外院系开设的平台课程中选修8学分,其中在表1中至少选修3学分 表1 表2

3)学院课程41学分必修:8学分

4) 本科素质教育通选课:12学分 A.数学与自然科学类:至少2学分 B.社会科学类:至少2学分 C.哲学与心理学类:至少2学分 D.历史学类:至少2学分 E.语言学、文学、艺术与美育类:至少4学分,其中至少一门是艺术与美育类课程 5)毕业论文和实习实践 6学分 每个学生在第三学年或第四学年里须参加概率统计系开设的毕业论文讨论班或者经批准的其它形式的科研训练,并在导师指导下写出论文、读书报告或实习实践报告,通过考核后获得6学分。 参加毕业论文讨论班的学生须在导师指导下进行科研训练或者到经批准的企事业单位、科研院所或学校实习实践至少100小时。进行科研训练或参加实习实践活动不应影响其它课程的学习。学院鼓励学生利用寒暑假期进行科研训练或实习实践活动。 五、其他 1.保研要求: 以下成绩按学分进行加权平均,作为确定保研资格和各方向招收研究生的参考:大类平台课程中的全部必修课,学院课程中的全部必修课,大类平台课程中的物理类课程中选一门,必选课程以及其它选修课程中选两门。 2.读研准备: 保送为硕士研究生的学生在硕士生入学前的两年内选修的数学学院研究生课程,考试成绩在70分以上,且学分没有计入本科毕业学分的,可以计为研究生阶段成绩,获得相应学分。但需本人申请、导师同意、主管院长批准。这种成绩不能超过9学分。

相关主题
文本预览
相关文档 最新文档