数学建模—高等教育信息推荐模型
- 格式:docx
- 大小:237.73 KB
- 文档页数:17
数学模型与数学建模数学模型数学模型(Mathematical Model)是近些年发展起来的新学科,是数学理论与实际问题相结合的一门科学。
它将现实问题归结为相应的数学问题,并在此基础上利用数学的概念、方法和理论进行深入的分析和研究,从而从定性或定量的角度来刻画实际问题,并为解决现实问题提供精确的数据或可靠的指导。
一、建立数学模型的要求:1、真实完整。
1)真实的、系统的、完整的,形象的映客观现象;2)必须具有代表性;3)具有外推性,即能得到原型客体的信息,在模型的研究实验时,能得到关于原型客体的原因;4)必须反映完成基本任务所达到的各种业绩,而且要与实际情况相符合。
2、简明实用。
在建模过程中,要把本质的东西及其关系反映进去,把非本质的、对反映客观真实程度影响不大的东西去掉,使模型在保证一定精确度的条件下,尽可能的简单和可操作,数据易于采集。
3、适应变化。
随着有关条件的变化和人们认识的发展,通过相关变量及参数的调整,能很好的适应新情况。
根据研究目的,对所研究的过程和现象(称为现实原型或原型)的主要特征、主要关系、采用形式化的数学语言,概括地、近似地表达出来的一种结构,所谓“数学化”,指的就是构造数学模型.通过研究事物的数学模型来认识事物的方法,称为数学模型方法.简称为MM 方法。
数学模型是数学抽象的概括的产物,其原型可以是具体对象及其性质、关系,也可以是数学对象及其性质、关系。
数学模型有广义和狭义两种解释.广义地说,数学概念、如数、集合、向量、方程都可称为数学模型,狭义地说,只有反映特定问题和特定的具体事物系统的数学关系结构方数学模型大致可分为二类:(1)描述客体必然现象的确定性模型,其数学工具一般是代效方程、微分方程、积分方程和差分方程等,(2)描述客体或然现象的随机性模型,其数学模型方法是科学研究相创新的重要方法之一。
在体育实践中常常提到优秀运动员的数学模型。
如经调查统计.现代的世界级短跑运动健将模型为身高1.80米左右、体重70公斤左右,100米成绩10秒左右或更好等。
数学建模中的常见模型数学建模综合评价模型是一种通过对各个评价指标进行量化,并将它们按照权重进行加权,最终得到一个综合评价值的方法。
这个模型可以应用于多指标决策问题,用于对被评价对象进行排名或分类。
常见的数学建模综合评价模型包括模糊综合评价模型、灰色关联分析模型、Topsis(理想解法)、线性加权综合评价模型、熵值法和秩和比法等。
模糊综合评价模型是一种基于模糊数学理论的方法,它将评价指标的模糊程度考虑在内,得到一个模糊评价结果。
该模型的步骤包括确定评价指标及其权重、构建模糊评价矩阵、进行模糊运算、得到模糊评价结果。
灰色关联分析模型是一种用于分析指标间关联性的方法,它可以帮助我们确定各个指标对被评价对象的影响程度。
该模型的步骤包括确定关联度计算方法、计算各个指标的关联度、得到综合关联度。
Topsis(理想解法)是一种基于距离的方法,它通过计算每个评价对象与理想解的距离,得到一个综合评价值。
该模型的步骤包括确定正负理想解、计算距离、得到综合评价值。
线性加权综合评价模型是一种常用的多指标决策方法,它将各个评价指标的权重与指标值线性组合起来,得到一个综合评价值。
该模型的优点是简单易操作,计算方便,可以对各个指标的重要性进行量化,并将其考虑在评价中。
但是,该模型的权重确定较为主观,且假设指标之间相互独立,不考虑相关性。
熵值法是一种基于信息熵理论的方法,它通过计算每个指标的熵值,得到一个综合评价值。
该模型的步骤包括计算指标的熵值、计算权重、得到综合评价值。
秩和比法是一种用于处理多指标决策问题的方法,它通过计算指标的秩和比,得到一个综合评价值。
该模型的步骤包括编秩、计算秩和比、得到综合评价值。
根据具体的评价需求和问题特点,我们可以选择合适的数学建模综合评价模型来进行评价。
每个模型都有其优点和缺点,需要根据具体情况进行选择和应用。
<span class="em">1</span><spanclass="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [数学建模——评价模型]()[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_sourc e":"vip_chatgpt_mon_search_pc_result","utm_medium":"di stribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_itemstyle="max-width: 100%"] [ .reference_list ]。
全国教育数学建模一、数学模型与数学建模数学模型是描述现实世界中某些特定现象的数学结构,它能够通过数学符号、公式和算法来刻画这些现象的内在规律和特征。
数学建模则是通过建立数学模型来解决问题和分析问题的过程。
在教育领域,数学建模可以帮助学生理解数学的本质,培养他们的创新思维和解决问题的能力。
二、建模过程与方法数学建模的过程包括问题分析、模型建立、模型求解和模型验证等步骤。
在建模过程中,需要运用各种数学方法和技巧,如代数、几何、概率统计等。
同时,还需要根据问题的具体情况,选择合适的建模方法,如微分方程、图论、最优化等。
三、数学建模案例下面列举几个数学建模的案例:1.人口增长模型:通过建立微分方程模型,可以预测未来人口数量的变化趋势。
2.传染病传播模型:通过建立微分方程或概率模型,可以预测传染病的传播范围和传播速度。
3.城市规划模型:通过建立图论或最优化模型,可以优化城市交通网络和城市规划。
四、建模论文写作在数学建模比赛中,建模论文是展示建模成果的重要方式。
建模论文需要清晰地阐述问题的背景、模型的建立、模型的求解和模型的验证等过程。
同时,还需要注意论文的格式和排版,确保论文的易读性和美观性。
五、建模比赛与经验分享全国教育数学建模比赛是一项重要的赛事,旨在推动数学建模在教育领域的应用和发展。
在比赛中,学生们需要运用所学的数学知识来解决实际问题,展示自己的建模能力和创新思维。
同时,比赛也是交流经验和分享知识的重要平台,参赛者可以相互学习、共同进步。
六、建模教育与人才培养数学建模教育可以帮助学生提高解决问题的能力、创新思维和团队协作能力等素质。
通过数学建模课程和活动,可以培养学生的数学素养和科学精神,为他们的未来发展打下坚实的基础。
同时,数学建模教育也可以促进其他学科的发展和应用,推动教育领域的创新和发展。
七、建模在教育中的应用数学建模在教育中的应用非常广泛,它可以应用于各个学科的教学中。
例如,在物理教学中,可以通过建立物理模型来帮助学生理解物理现象的本质和规律;在化学教学中,可以通过建立化学反应模型来帮助学生理解化学反应的过程和机理;在生物教学中,可以通过建立生态模型来帮助学生理解生态系统的结构和功能。
常见评价模型简介评价类数学模型是全国数学建模竞赛中经常出现的一类模型,如2005年全国赛A题长江水质的评价问题,2008年B题高校学费标准评价体系问题等。
主要介绍三种比较常用的评价模型:层次分析模型,模糊综合评价模型,灰色关联分析模型,以期帮助大家了解不同背景下不同评价方法的应用。
层次分析模型通过一个具体的例子介绍层次分析模型的应用。
例(选择旅游地决策问题)如何在桂林、黄山、北戴河3个目的地中按照景色、费用、居住条件、饮食、旅途条件等因素进行选择。
步骤1 建立系统的递阶层次结构将决策问题分为3个层次:目标层O,准则层C,方案层P;每层有若干元素,各层元素间的关系用相连的直线表示。
设要比较各准则n C C C ,,,21 对目标O 的重要性,记判断矩阵为A⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=1135131112513131211714155712334211A 显然,A 是正互反阵。
步骤3计算被比较元素对于该准则的相对权重(1)一致阵的定义与性质 一致阵的定义要由A 确定n C C C ,,,21 对目标O 的权向量,我们首先考察一致矩阵的性质。
称满足n k j i a a a ik jk ij ,,2,1,,, ==⋅的正互反阵为一致阵。
例如⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=nn n n n n w w w w w w w w w w w w w w w w w w A212221212111一致矩阵的性质矩阵A 的秩为1,A 的唯一非零特征根为n 。
矩阵A矩阵A⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭11311231211557中,由431==C C 可以得到83223==C Ca ,而事实上723=a 。
因此矩阵A 并不是一致阵,事实上在大多情况下我们构造的成对比较矩阵都不是一致阵。
对于这样的矩阵我们如何来确定权向量呢?我们通常的作法是:对于不一致(但在允许范围内)的成对比较阵A ,建议用对应于最大特征根λ的特征向量作为权向量。
数学建模常用算法模型数学建模是将实际问题抽象为数学模型,并利用数学方法求解问题的过程。
在数学建模中,算法模型是解决问题的关键。
下面介绍一些常用的数学建模算法模型。
1.线性规划模型:线性规划是一种用于求解线性约束下的最优化问题的数学方法。
线性规划模型的目标函数和约束条件均为线性函数。
线性规划广泛应用于供需平衡、生产调度、资源配置等领域。
2.非线性规划模型:非线性规划是一种用于求解非线性目标函数和约束条件的最优化问题的方法。
非线性规划模型在能源优化调度、金融风险管理、工程设计等方面有广泛应用。
3.整数规划模型:整数规划是一种在决策变量取离散值时求解最优化问题的方法。
整数规划模型在网络设计、物流调度、制造安排等领域有广泛应用。
4.动态规划模型:动态规划是一种通过将问题分解为多个阶段来求解最优化问题的方法。
动态规划模型在资源分配、投资决策、路径规划等方面有广泛应用。
5.随机规划模型:随机规划是一种在目标函数和约束条件存在不确定性时求解最优化问题的方法。
随机规划模型在风险管理、投资决策、资源调度等方面有广泛应用。
6.进化算法模型:进化算法是一种通过模拟生物进化过程来求解最优化问题的方法。
进化算法模型包括遗传算法、粒子群算法、蚁群算法等,被广泛应用于参数优化、数据挖掘、机器学习等领域。
7.神经网络模型:神经网络是一种模仿人脑神经元连接和传递信息过程的数学模型。
神经网络模型在模式识别、数据分类、信号处理等领域有广泛应用。
8.模糊数学模型:模糊数学是一种用于处理不确定性和模糊信息的数学模型。
模糊数学模型在风险评估、决策分析、控制系统等方面有广泛应用。
除了以上常用的数学建模算法模型,还有许多其他的算法模型,如图论模型、动力系统模型、马尔科夫链模型等。
不同的问题需要选择合适的算法模型进行建模和求解。
数学建模算法模型的选择和应用需要根据具体的问题和要求进行。
数学建模常用模型及其作用1、蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法)2、数据拟合、参数估计、插值等数据处理算法(比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具)3、线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现)4、图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备)5、动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中)6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用)7、网格算法和穷举法(网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具)8、一些连续离散化方法(很多问题都是实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的)9、数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用)10、图象处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用Matlab进行处理)作用:应用数学去解决各类实际问题时,建立数学模型是十分关键的一步,同时也是十分困难的一步。
参加数学建模国赛需要掌握的模型和算法目录CONTENCT •模型与算法概述•线性规划与整数规划•非线性规划与最优化方法•概率统计与随机过程模型•图论与网络优化算法•机器学习算法在建模中应用•总结与展望01模型与算法概述数学建模国赛背景与意义背景数学建模国赛作为国内最高级别的数学建模竞赛,旨在提高参赛者的数学建模能力和解决实际问题的能力。
意义通过竞赛,参赛者可以接触到实际问题,学习如何将数学知识应用于实际问题中,培养创新思维和团队合作精神。
预测模型优化模型分类与聚类模型仿真模型常见模型与算法分类如时间序列分析、回归分析等,用于预测未来趋势或结果。
如线性规划、整数规划等,用于求解最优解或满意解。
如决策树、支持向量机、K 均值等,用于数据分类和聚类分析。
如蒙特卡罗模拟等,用于模拟实际系统的运行和结果。
01020304明确问题类型数据特点求解效率模型可解释性选用原则及适用场景对于大规模问题或实时性要求较高的场景,需要选择求解效率较高的模型和算法。
考虑数据的规模、维度、分布等特点,选择适合的模型和算法。
根据问题的性质选择合适的模型和算法,如预测问题可选用预测模型。
对于需要解释模型结果或决策依据的场景,需要选择可解释性较强的模型和算法。
02线性规划与整数规划线性规划基本概念及原理线性规划定义线性规划是一种数学优化技术,用于优化一个或多个线性目标函数,同时满足一系列线性约束条件。
线性规划标准形式将实际问题抽象为数学模型,通常表示为最大化或最小化某个线性函数,同时满足一系列线性等式或不等式约束。
线性规划求解方法包括单纯形法、内点法等,通过迭代计算寻找最优解。
整数规划特点及求解方法整数规划特点整数规划的决策变量全部或部分取整数值,这使得问题求解变得更为复杂。
整数规划求解方法包括分支定界法、割平面法等,通过不断缩小可行域范围来寻找整数最优解。
整数规划与线性规划关系整数规划可以看作是线性规划的扩展,当线性规划中的决策变量取整数值时,即转化为整数规划问题。
一、问题重述:二、条件假设:三、符号说明:四、问题分析:五、模型建立:六、模型求解:七、结果分析:八、模型改进:九、模型评价:十、参考文献:数学建模的一般步骤数学模型是一种概念符号模型。
对数学模型可以做两种理解:一种是数理逻辑和数学基础中的;另一种是应用数学中的。
建立数学模型以解决现实问题一般要经过以下几个步骤:首先,要充分搜集现实原型的资料,数据,分析它的状态,性质,变化规律,特征,结构,建立经验定律,提出理论假说。
其次,建立数学模型。
这一过程包括什么是所需要解决的问题的主要方面,什么是次要方面,什么是本质,什么是无关紧要的,以及探寻用什么数学语言,符号,结构来表示所研究的问题或经验定律的结构,即要使数学模型结构(主要是概念,关系,公理等)尽可能与原型的概念,结构相吻合。
第三步,解决数学模型所提出的数学问题。
第四步,以原型的数据检验数学模型并对数学解决做出解释和评价。
一般认为,评价一个数学模型的科学价值取决于该模型的预测与观察数据的一致程度。
应该指出的是,正常情况下,建立模型是一个多次反复的过程,是在不断地根据原型修正模型的过程中使两者趋于一致。
另外,对于同一个客观事物可以有多种数学描述,即可建立不同的数学模型,因此有必要在若干模型中选择一个最简单,最恰当,最易于进行数学处理的模型。
可简写为:数学模型的建立和选择【关键字】【摘要】【正文】一、从信息原型到数学模型二、数学模型的建立§2.1 机理分析法§2.1.1直接建模法§2.1.2套用常用模型法§2.1.3针对修改常用模型法§2.1.4 综合创造法§2.2 统计分析法三、数学模型的选择四、总结【附录】【程序】【参考书目】【关键词】信息原型数学模型数学建模【摘要】本文主要探讨的是信息学竞赛中解题的关键:数学模型的建立和选择。
首先分析了从信息原型到数学模型的重要性,提出了解题的简单过程:现实——理论——现实。
数学建模主要运用的模型
数学建模是一门跨学科的学科,涉及到多个领域和学科的知识。
在数学建模中,模型是非常重要的一部分,它是问题的抽象表现,是对问题的形式化描述。
本文将介绍数学建模主要运用的模型,包括线性规划模型、非线性规划模型、动态规划模型、贝叶斯网络模型、支持向量机模型等。
线性规划模型是数学建模中应用最广泛的一种模型,它适用于各种资源的优化配置问题。
线性规划模型的目标是在一组线性约束条件下,最大化或最小化某一目标函数的值。
其优点在于求解方法简单,计算效率高,适用范围广泛。
非线性规划模型是指目标函数或约束条件中至少有一个是非线
性的规划模型。
非线性规划模型中的问题通常较为复杂,求解难度较大。
但是,非线性规划模型适用范围广泛,可以解决许多线性规划模型无法解决的问题。
动态规划模型是解决最优化问题的一种方法,特别适用于具有重叠子问题和最优子结构的问题。
动态规划模型的优点在于可以减少计算量,提高计算效率,适用于一些复杂的问题。
贝叶斯网络模型是一种概率图模型,用于描述变量之间的条件依赖关系。
贝叶斯网络模型适用于各种领域的问题,包括数据挖掘、机器学习、生物信息学等。
其优点在于可以处理不确定性问题,提高预测的准确性。
支持向量机模型是一种监督学习方法,用于分类和回归分析。
支
持向量机模型的优点在于可以解决高维数据的分类问题,具有较好的泛化能力和鲁棒性。
总之,数学建模主要运用的模型包括线性规划模型、非线性规划模型、动态规划模型、贝叶斯网络模型、支持向量机模型等。
这些模型在不同的问题中都有着广泛的应用,并且不断地得到发展和完善。
数学建模的背景:人们在观察、分析和研究一个现实对象时经常使用模型,如展览馆里的飞机模型、水坝模型,实际上,照片、玩具、地图、电路图等都是模型,它们能概括地、集中地反映现实对象的某些特征,从而帮助人们迅速、有效地了解并掌握那个对象。
数学模型不过是更抽象些的模型。
当需要从定量的角度分析和研究一个实际问题时,人们就要在深入调查研究、了解对象信息、作出简化假设、分析在规律等工作的根底上,用数学的符号和语言,把它表述为数学式子〔称为数学模型〕,然后用通过计算得到的模型结果来解释实际问题,并承受实际的检验。
这个全过程就称为数学建模。
近半个多世纪以来, 随着计算机技术的迅速开展,数学的应用不仅在工程技术、自然科学等领域发挥着越来越重要的作用, 而且以空前的广度和深度向经济、金融、生物、医学、环境、地质、人口、交通等新的领域渗透,所谓数学技术已经成为当代高新技术的重要组成局部。
不管是用数学方法在科技和生产领域解决哪类实际问题,还是与其它学科相结合形成穿插学科,首要的和关键的一步是建立研究对象的数学模型,并计算求解。
人们常常把数学建模和计算机技术在知识经济时代的作用比喻为如虎添翼。
数学建模日益显示其重要作用,已成为现代应用数学的一个重要领域。
为培养高质量、高层次人才,对理工、经济、金融、管理科学等各专业的大学生都提出“数学建模技能和素质方面的要求〞。
数学建模在现代社会的一些作用(1〕在一般工程技术领域,数学建模仍然大有用武之地。
在以声、光、热、力、电这些物理学科为根底的诸如机械、电机、土木、水利等工程技术领域中,数学建模的普遍性和重要性不言而喻,虽然这里的根本模型是已有的,但是由于新技术、新工艺的不断涌现,提出了许多需要用数学方法解决的新问题;高速、大型计算机的飞速开展,使得过去即便有了数学模型也无法求解的课题〔如大型水坝的应力计算,中长期天气预报等〕迎刃而解;建立在数学模型和计算机模拟根底上的CAD技术,以其快速、经济、方便等优势,大量地替代了传统工程设计中的现场实验、物理模拟等手段。
高等教育中的数学建模教学近年来,数学在我国高等教育中的地位越来越受到重视,而数学建模作为数学的一种应用形式,其教学也逐渐成为高等教育的重要组成部分。
数学建模是将数学的概念、方法和技术应用于实际问题的过程,通过建立数学模型来模拟和解决实际问题,是数学与实际问题相结合的重要手段和途径。
如何进行数学建模教学,成为高等教育中的一大难题。
一、数学建模教学的重要性数学建模在现代社会中有着广泛的应用,不仅涉及到科学技术、工程、医学、经济、金融等多个领域,而且已经成为了一种新的思维方式和方法。
数学建模教学能够培养学生的科学素养和创新意识,提高学生的综合能力和实际应用水平,是高等教育中不可忽视的一部分。
二、数学建模教学的难点数学建模教学的难点在于如何将抽象的数学概念和方法应用于实际问题中。
首先,实际问题本身具有复杂性和多变性,需要学生具有扎实的数学知识和分析能力。
其次,数学建模涉及到多个学科领域的知识,需要教师在教学过程中进行跨学科融合。
最后,数学建模教学需要教师掌握一定的教学方法和手段,注重培养学生的动手能力和创新思维能力。
三、数学建模教学的实践探索在实践中,教师可以采取以下方法来进行数学建模教学:1. 强化基础知识教学,提高学生数学素养。
数学建模中要求学生具有扎实的数学基本功,在教学中应注重强化基础知识的教学,培养学生的数学素养。
2.加强实践环节,培养学生动手能力。
数学建模涉及到实际问题,需要学生具有一定的动手能力和实践经验。
在教学中可以增加实践环节和实践机会,让学生通过实践了解问题,培养学生的动手能力和实践经验。
3.跨学科融合,打通学科壁垒。
数学建模需要涉及到多个学科领域的知识,因此在教学中需要打通学科壁垒,进行跨学科融合,建立多学科之间的联系和交流。
4.提高教师教学水平,掌握教学方法和手段。
数学建模教学需要教师掌握一定的教学方法和手段,注重培养学生的动手能力和创新思维能力。
因此,教师需要不断提高自身的教学水平,掌握先进的教学方法和手段,在教学中注重课程设计和教学策略的创新。
竞赛题目(在AB上打勾): A B 竞赛队编号(参赛学生不填写):__________目录问题的提出 (3)问题的分析与假设 (3)模型的建立与求解 (6)效绩评价 (12)预测评估 (13)信息推荐方案 (13)模型的评价与推广 (14)附:给有关部门的信 (15)参考文献 (16)高等院校教育信息化推荐模型摘要本文针对当前我国高等院校教育信息化过程关于信息推荐方面存在的问题,进行了分析研究,建立了包含满意度、准确率、覆盖率、实时性这四个方面的信息推荐评价指标体系,通过问卷调查的方式收集相关数据,确定了各指标的权重因子。
主要利用奇异值分解法和LSA方法建立了信息推荐模型,并利用相关算法对我们设计出的模型的效绩进行检验,最后给出了具体的信息推荐方案,并对我们的模型进行了评价推广。
问题一、我们对不同用户的评测标准进行了问卷调查,通过数据分析,给出了各个指标的权重,满意度是0.243,准确率是0.265,覆盖率是0.238 ,实时性是0.255。
确定了外生变量: 用户个体差异、网站建设。
内生变量:信息资源建设如学术网站、期刊杂志、选修综合课。
问题二、建立信息推荐模型,对奇异值分解后的矩阵进行降维, 构建潜在语义空间。
通过计算得出表面上没有关联的关键词和文章之间的相关性达0.9333,验证了模型的效绩,并对模型进行了优化,给出了信息聚类图。
问题三、提出了我国高等院校教育信息推荐的具体方案。
奇异值分解和LSA方法建立信息推荐模型的优势:1、应用条件易得;2、不在局限于计算方阵,可以适用于任意矩阵,更加具有普适意义。
3、相比传统向量空间,潜在语义空间的维度更小,语义关系更明确。
4、低维空间表示可以刻画同义词,同义词可对应相同或相似的主题。
5、降维可去除部分噪声,使特征更明显。
关键词:教育信息推荐模型、奇异值分解法、LSA方法、Spearman coefficient相关系数一、问题的提出1、问题背景:21世纪是信息时代,随着信息技术越来越广泛的应用,互联网已经成为我们日常生活中必不可少的工具,而传统教育体系所暴露出来的弊端也日益明显,例如严重受到地域限制,教育资源分配不均,相互之间交流不够等,为使之适应信息化社会对教育发展的新要求,建设更好的教育信息平台来满足学生互联网学习的需求,教育体系信息化改革刻不容缓。
由于教育信息化表现出快捷高效、节约成本,不受地域时间限制、资源共享,交流开放等优势,所以在教育教学及管理的各个领域都开始推出各种形式的信息教育平台,例如远程教育,网站管理,网课、论坛等很大程度上促进了教育信息化的发展,然而,目前的教育信息体系还是不够完善的,例如信息推荐体系这一块被严重忽略,而现有的推荐体系仍存在推荐准确率不够高,推荐方式单一等一系列的问题,因此建立出合理的数学模型来完善教育信息推荐体系是一项迫切等待解决的工作。
2、需要解决的问题:(1)建立信息推荐的指标体系,确定信息推荐的变量(2)建立高等学校信息推荐模型(3)就信息推荐模型设计推荐算法(4)给有关部门写一封信,推介你们的信息推荐模型。
二、问题的分析及假设通过读题可知,有效信息推荐是目前教育信息化的重要问题,我们需要明确信息推荐的指标以及其推荐变量,然后为高等院校建立合理有效的信息推荐模型,设计其相应的算法,最后向相关部门推介我们的模型。
1、信息推荐的指标体系为了提高信息推荐模型的准确度,我们的评测指标主要有包含以下四个方面的内容:(1)满意度O:即用户的需求被满足的程度。
满意度是用户的一种心理状态,它能够反映推荐的信息和用户的期望之间的契合程度,用数学式量化表示如下:O= exp(a1*x1+ a2 *x2+ a3 *x3+ a4 *x4)(其中,x1是下载率、x2是点击率、x3是停留时间、x4是分享率,a1,a2,a3,a4分别是各自的权重,令a1=0.4,a2=0.2,a3=0.05,a4=0.35,这里我们假设用户的行为无出错。
)注:O 值越大,用户满意度越高。
(2)准确率:信息推荐的准确性也是评价此体系的一个重要指标,可以有效的提高用户的搜索效率。
我们这里用精确率P 和召回率R 来评测信息推荐的准确性[1]。
假设:系统检索到的相关信息(A )系统检索到的不相关信息(B )相关但是系统没有检索到的信息(C )不相关且没有被系统检索到的信息(D )则:精确率P : P = A / ( A + B ),0<P<1召回率R : R = A / ( A + C ),0<R<1精确率P 越大,说明检索到信息越准确,但检索范围相对较窄;召回率R 越大,说明检索到的信息比较全面,但准确度会降低。
综合考虑,我们用这两个指标进行调和后的指标F 来反映信息推荐的准确率。
F=(α2+1)P∗Rα2∗(P+R) 当α=1时,F=2∗P∗R P+R注:F 越大,准确率越高。
(3)覆盖率:信息的覆盖率可以验证资源是否有效的传送给了用户,我们采用信息熵H 和基尼系数G 来量化这一指标[2]。
假设,信息i 的流行度是已知的。
p(i)=b(i)/ ∑b(i) ,H=-∑p(i) log p(i) ,G=1n−1∑(2j-n-1)p(i j )(b(i)为信息i 的流行度, i j 是按照信息流行度p()从小到大排序的信息列表中的第j 条信息)注:H 和G 越小,覆盖率越高。
(4)实时性T :因信息具有更新速度快的特点,所以信息推荐的实时性更显 得尤为关键。
实时性反映所推荐给用户的信息是否是最新最有参考价值的。
T=vf f=m/n(v 是推荐列表的变化率,m 是新信息的数量,n 是所有推荐信息的总数量) 注:T 越大,实时性越高。
以上的评测指标可以通过在线或离线来计算。
对于以上四个评测指标,我们对不同用户的评测标准进行了问卷调查,通过数据分析,给出了各个指标的权重,满意度是0.243,准确率是0.265,覆盖率是0.238 ,实时性是0.255。
图(一)各指标的平均得分(5分制)图(二)各指标的比例2、信息推荐的变量外生变量: 用户个体差异、网站建设用户个体差异:由于用户个人的文化水平,个人喜好,搜索习惯,对搜索内容的熟悉程度等的差异会对教育推荐的指标体系造成一些影响。
网站建设:现在的浏览器五花八门、种类繁多,其网站建设质量也良莠不齐,有好多网站为了追求商业利益,更是商业捆绑,推荐一些用户不需要的广告娱乐八卦等垃圾推送信息,有些网站甚至其本身就存在着一些系统漏洞等问题,这无疑对用户高校的获取有用推送信息造成干扰,对教育信息推荐的指标体系造成一定负面影响。
内生变量:信息资源建设,如学术网站,期刊杂志,选修综合课(包括校内课程与网络公开课)学术网站:作为用户获取信息的直接来源,其应该保持应有的学术严谨性,直接决定着用户获取信息的满意度、准确率、覆盖率、实时性。
对信息推荐体系起这至关重要的作用。
期刊杂志:市场上形形色色的期刊杂志百花齐放,竞争激烈,彼此之间也拉开了档次,用户的认可度也在很大程度上受到其知名度的影响,然而,无论是哪个档次的期刊,其收纳的文章都是层次不及的,只是比重有差异罢了,而由于认可度所带来的弊端暴露了出来,例如不能以批判理性的思维去辨别认可度高的期刊,更容易对认可度低的期刊产生偏见。
另一方面,当今社会,期刊杂志已经成为了人们茶余饭后,休闲娱乐,候车等人时打发时间的不二之选,而且人们也乐于将自己喜欢的期刊杂志推荐给亲朋好友,或是坚持追某一系列的期刊杂志,所以期刊杂志也是构成信息推荐体系的重要组成部分。
选修综合课:选课系统作为高校教务管理系统中必不可少的一部分,然而,选修综合课推荐系统还不够完善,学生很难高效准确的找到与自己的兴趣安好一致的课程,因此加强选修综合管理系统建设,会显著影响到信息推荐体系的评价指标。
决策变量:用户需求3、确定主要的信息推荐方式:网络信息推荐。
三、 模型的建立与求解(一)理论方法介绍1、奇异值分解法[3]特征值分解是一个有效提取矩阵特征的方法,但是它只是对方阵而言的。
在现实的世界中,我们看到的大部分矩阵都不是方阵,而奇异值分解法能适用于任意的矩阵。
分解方式如下:∑=T V U A (1)假设A 是一个n *m 的矩阵,那么得到的U 是一个n * m 的方阵(U 里面的向量是正交的,称为左奇异向量),Σ是一个n* m 的矩阵(除对角线的元素外都是0,对角线上的元素称为奇异值), V T (V 的转置)是一个n* m 的矩阵(V 里面的向量是正交的,称为右奇异向量),即Tn n n m m m n m V U A ******∑= (2)在很多情况下,前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上了。
所以,我们也可以用前r 个奇异值来近似描述矩阵,这里定义一下部分奇异值分解:n r T rr r m n m V U A ****∑≈ (6)r 是一个远小于m 、n 的数,这样矩阵的乘法形式如下:Tn r rr r m n m V U A ******∑= (7) 右边的三个矩阵相乘的结果将会是一个接近于A 的矩阵,r 越接近于n ,相乘的结果越接近于A 。
2、LSA法[4]LSA(latent semantic analysis)潜在语义分析,也被称为LSI(latent semantic index),是Scott Deerwester, Susan T. Dumais等人在1990年提出来的一种新的索引和检索方法。
该方法和传统向量空间模型一样使用向量来表示词和文章,并通过向量间的关系(如夹角)来判断词及文档间的关系。
(二)模型的建立假设:信息资源系统自动获取。
采用奇异值分解法和LSA方法相结合建立模型,以用户查找文章的行为为例,假设用户需求为“文章”,其输入为“关键词”。
1、分析关键词与文章之间的关联性,建立关键词-文章矩阵X。
假设有m个关键词,n篇文章,X就是一个m*n的矩阵。
其中,第i行、第j列的元素是Xij,是第i个词在第j篇文章中出现的次数。
下边以m=12,n=9为例:X=[1 0 0 1 0 0 0 0 00 1 1 0 1 0 0 0 01 1 0 0 0 0 0 0 0 1 0 1 0 0 02 0 0 0 1 1 2 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 1 1]观察这个矩阵,第一个词(b1)和第二个词(b2),他们没有在某篇文档中共同现过,他们的关系使用Spearman coefficient相关系数来计算。