《Python金融数据挖掘及其应用》教学大纲
- 格式:docx
- 大小:28.38 KB
- 文档页数:4
《金融市场数据分析与数据挖掘》教学大纲课程名称:金融市场数据分析与数据挖掘课程学分:3学分课程介绍:金融市场数据分析与数据挖掘是一门综合性的课程,旨在提供金融市场相关数据的分析与挖掘技术。
通过本课程的学习,学生将获得金融市场数据的收集、整理与处理的能力,以及金融数据分析与挖掘的方法和技巧。
同时,本课程还将介绍相关软件工具和编程语言的应用,以帮助学生提高数据分析与挖掘的实践能力。
课程目标:1.掌握金融市场数据的收集、整理和处理方法。
2.熟悉金融数据分析和挖掘的基本理论和方法。
3.学会使用常用的统计分析工具和编程语言进行金融数据分析与挖掘。
4.培养独立思考和问题解决的能力。
教学内容:1.金融市场数据的特点与获取方法。
2.数据预处理与数据清洗。
3.数据可视化与探索性分析。
4.描述性统计分析。
5.相关性分析与因子分析。
6.时间序列分析与预测。
7.机器学习算法在金融数据挖掘中的应用。
8.金融风险分析与模型构建。
教学方法:1.理论讲授:通过教师讲解金融数据分析和挖掘的基本理论和方法,帮助学生建立相应的基础知识。
2.实例分析:通过案例分析,引导学生运用所学知识分析实际金融市场数据。
3.讨论与交流:组织学生进行讨论和交流,促进学生之间的互动和思维碰撞。
4.实践操作:通过实践操作,帮助学生熟悉常用的统计分析工具和编程语言,提高数据分析与挖掘的实践能力。
评估方式:1.平时成绩:考勤、课堂表现、课堂讨论等。
2.作业成绩:按时完成平时作业并准确无误。
3.期中考试:对课程前半部分内容进行考察。
4.期末考试:对课程全部内容进行考察。
5.课程设计:根据实际金融市场数据进行分析与挖掘,并撰写实验报告。
参考教材:1.李梅,《大数据金融学》,机械工业出版社。
2. Tan, et al., "Introduction to Data Mining", Pearson Education, 2024.。
参考工具:1. Python编程语言及相关库(numpy、pandas、matplotlib、scikit-learn等)。
《数据分析与挖掘》课程名称:数据分析与挖掘建议课时数: 80(其中实践课时数:40 )适用专业:大数据技术与应用一、前言(一)课程的定位1.课程性质:本课程是大数据技术与应用的一门专业核心课程,属于专业必修课程。
2.课程功能:本课程通过对数据中所蕴含的价值进行挖掘,保证生产正常运行,提升经营水平和生产运作效率,具体来说,培养学生数据导入、数据清洗、数据整理、数据分析和数据可视化等方面的能力。
3.相关课程: 本课程是《数据采集和存储》课程的为后置课程,同时也是大数据实训课程的前置课程。
(二)设计思路该课程是依据“大数据技术与应用专业工作任务与职业能力分析表”中数据的过程控制与工作项目设置的。
其总体设计思路是,打破以知识传授为主要特征的传统学科课程模式,转变为以工作任务为中心组织课程内容,并让学生在完成具体项目的过程中学会完成相应工作任务,并构建相关理论知识,发展职业能力。
以就业为导向以能力为本位,对数据导入、数据处理、数据分析、数据可视化等方面进行任务与职业能力分析,通过案例教学、讨论教学、模拟仿真等多种教学方法和手段,培养学生具备基本的职业能力。
项目设计以餐饮数据项目的数据为线索,以数据流的运行为主线,设计数据导入、数据去空去重、数据合并、时间序列处理、常用指标分析、交叉表分析、相关分析项目案例,通过项目分解和任内练习,学生能理解数据分析中各类数据格式的作用,理解数据清洗的含义,理解适用于数据分析各种图形的画法。
该门课程的总学时为80课时,5个学分。
二、课程目标(一)知识目标●掌握各类数据文件的格式特点;●掌握各类数据格式的意义和特点;●理解数据去空去重的含义及处理方法;●理解时间序列处理方法;●理解数据的各种统计指标的作用;●理解适用于数据的相关性及其使用方法。
●理解各种图形的画法。
(二)技能目标●能够利用pandas导入数据、筛选数据;●能够利用pandas对数据进行预处理,比如去除空值和重复值、时间序列处理;●能够利用统计指标对预处理后的数据进行简单分析;●能够运用一些合适的图形挖掘出数据的规律。
《金融数据挖掘》教学大纲注:课程类别是指公共基础课/学科基础课/专业课;课程性质是指必修/限选/任选。
一、课程地位与课程目标(一)课程地位金融实证研究的一个显著特点是数据分析量大、不确定性因素多,面对当今时代的海量金融数据,基于传统统计技术建立的模型假设条件多,实际应用难以奏效。
数据挖掘20世纪90年代中期兴起的新技术,是发现数据中有用模式的过程,其目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果,以人们容易理解的形式提供有用的决策信息。
通过本课程的学习,使学生初步掌握金融数据分析的基本方法,掌握几种重要的数据挖掘方法,掌握如何利用计算软件分析数据、解决问题、完成相关研究。
通过本课程的学习和相关软件的使用,使学生了解数据分析和数据挖掘在金融领域的重要运用,使之能够利用所学到的数据分析与数据挖掘方法开展金融领域的应用研究,并有进一步学习的基础与能力。
(二)课程目标.理解数据挖掘的特点和基本流程,掌握数据挖掘的重要思想;1.掌握不同类别的数据挖掘方法,包括回归、分类、聚类、降维等;.能够运用工具语言,如R、Python等,进行数据挖掘;2.学会运用数据挖掘的方法解决金融研究中的问题。
二、课程目标达成的途径与方法本课程本着学以致用的原则,结合最新的发展,以课堂教学为主,结合实践教学、课堂讨论、课外作业等方式来达成课程的学习目标。
通过讲解数据挖掘的重要思想、建模方法、软件实现的理论教学,使学生理解数据挖掘的建模思想、解决实际问题的办法和思路,掌握数据挖掘的常用工具方法;通过课外实践和课外作业,使学生能够学以致用,学会用数据挖掘的方法解决金融研究中的实际问题,并掌握一门编程语言作为后续学习和研究的工具。
三、课程目标与相关毕业要求的对应关系注:1.支撑强度分别填写H、M或L (其中H表示支撑程度高、M为中等、L为低)。
2.毕业要求须根据课程所在专业培养方案进行描述。
四、课程主要内容与基本要求第一章数据挖掘概述(1)主要内容:数据挖掘的概念,数据挖掘的主要功能,数据挖掘的方法论,软件介绍。
《python数据分析与挖掘基础》课程教学大纲课程代码:学分:4学时:64(其中:讲课学时:42 实践或实验学时:22)先修课程:数学分析、高等代数、概率统计、Python程序设计基础适用专业:信息与计算科学建议教材:黄恒秋主编.Python金融数据分析与挖掘实战[M]. 北京:人民邮电出版社.2019. 开课系部:数学与计算机科学学院一、课程的性质与任务课程性质:专业方向选修课。
课程任务:大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。
通过学习本课程,使得学生能够掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能,能够针对基本的数据挖掘问题与样例数据,调用Python中的第三方扩展包Numpy、Pandas、Matplotlib、Scikit-learn及关联规则算法代码,进行处理、计算与分析,从而为其他的专业领域课程或者复杂应用问题提供基础支撑。
二、课程的基本内容及要求本课程教学时数为64学时,4学分;实验22学时,1.375学分。
第一章Python基础1.课程教学内容:(1)Python及其发行版Anaconda的安装与启动、Spyder开发工具的使用和Python 新库的安装方法;(2)Python基本语法和数据结构。
2.课程的重点、难点:(1)重点:Python基本语法和数据结构的灵活运用;(2)难点:Python数据结构的灵活运用。
3.课程教学要求:(1)了解Python的安装及界面基本使用技能;(2)理解Python基本数据结构及方法的使用;(3)掌握Python基本数据结构的使用技能及循环、条件语句的应用。
第二章科学计算包Numpy1.课程教学内容:(1)导入并使用Numpy创建数组;(2)数组的运算、切片、连接及存取、排序与搜索;数组相关属性与方法;(3)矩阵及线性代数运算。
2.课程的重点、难点:(1)重点:数组的切片、连接、改变形态。
《数据挖掘技术与应用》教学大纲一、课程性质与地位本课程属于专业核心课程,汇集了来自机器学习、模式识别、数据库、统计学、人工智能以及管理信息系统等各学科的成果。
通过该课程学习,使学生掌握数据挖掘的技术与应用,结合实际的操作实验,巩固课堂教学内容,使学生掌握从数据中提取有价值的知识,进一步提高信息量利用率,以自动、智能和快速地分析海量的原始数据,以使数据得以充分利用能力。
二、课程设置知识要求、能力要求及达成目标课程设置知识要求:数据采集集成与预处理,多维数据分析与组织,各种数据挖掘模型的原理、算法步骤与实际应用过程。
课程设置能力要求:建立以及评估模型的预测质量的方法,并且使用数据挖掘工作平台python进行解析,数据挖掘的基本理论与实践方法。
主要内容包括:各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用课程达成目标:培养学生了解数据挖掘产生的背景、技术、多种相关方法及具体应用,能够学会数据挖掘的知识推理,并具备使用数据挖掘算法在传统领域与新领域中实现实现价值的提取与应用。
三、课程教学内容与要求第一章数据挖掘概述教学内容:1.数据挖掘发展简述2.数据挖掘的功能与价值实现3.数据挖掘的典型应用领域4.数据挖掘的研究方向教学要求:1. 学生对数据挖掘有初步的认识2. 学生对数据挖掘可应用领域有认识3. 学生对数据挖掘流程初步掌握第二章Pandas教学内容:1.Pandas入门基础2.股票数据分析教学要求:1.学生对pandas有所认识2.学生能对简单案例进行数据挖掘分析第三章数据挖掘与机器学习教学内容:1.数据挖掘中的机器学习2.机器学习的模型3.模型的评判4.支持向量机5.过拟合问题教学要求:1.学生对机器学习有初步认识2.学生对框架有了解3.学生掌握机器学习在数据挖掘中的运用能力第四章分类分析方法与应用教学内容:1.数据挖掘分类问题2.概论模型3.朴素贝叶斯分类4.空间向量模型5.knn算法6.多类问题教学要求:1.学生对分类分析有初步认识2.学生对分类分析算法原理与结果了解3.学生掌握对数据初步分类挖掘的操作能力第五章无监督学习算法教学内容:1.数据挖掘的聚类问题2.扁平聚类3.k均值算法4.层次聚类5.全链接,组平均,质心聚类6.降维算法教学要求:1.学生对聚类分析有初步认识2.学生对聚类分析算法原理与结果了解3.学生掌握对数据初步聚类挖掘的操作能力第六章回归模型算法与应用教学内容:1.回归预测问题2.线性回归3.多元回归问题4.逻辑回归教学要求:1.学生对回归模型有初步认识2.学生对回归模型算法原理与结果了解3.学生掌握对数据初步的回归模型的操作能力第七章集成学习教学内容:1.数据挖掘中多模型数据挖掘问题2.决策树3.随机森林4.Adaboost算法教学要求:1.学生对多模型算法有初步认识2.学生对多模型算法原理与结果了解3.学生掌握集成学习在数据挖掘中的运用能力第八章关联规则模型及应用教学内容:1.相关规则2.apriori算法3.协同过滤(基于item)4.协同过滤(基于users)教学要求:1.学生对关联规则有初步认识2.学生对关联规则算法原理与结果了解3.学生掌握对数据初步关联规则挖掘的操作能力第九章图像数据分析教学内容:1.图像大数据分析2.图像数据分析案例教学要求:1. 学生对图像数据有初步认识2. 学生对图像数据具备初步分析能力3. 学生对图像数据具备操作能力第十章文本数据分析教学内容:1.文本数据分析2.NLTK的使用3.使用NLTK进行文本分析案例教学要求:1. 学生对文本数据有初步认识2. 学生对文本数据具备初步分析能力3. 学生对文本数据具备操作能力四、课程重点及难点课程重点:1.建立以及评估模型的预测质量的方法2.使用数据挖掘工作平台python进行解析课程难点:1.分类、关联规则、聚类2.数据挖掘的基本理论与实践方法3.各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用五、学时分配表六、课程考核与成绩评定本课程为考查课,考核方式采用笔试,闭卷;总评成绩为:考试成绩(60%)+ 平时成绩(40%);平时成绩主要由学生的出勤(40%)和作业(60%)情况进行评定。
《python金融数据挖掘及其应用》课程教学大纲课程代码:学分:5学时:80(其中:讲课学时:60 实践或实验学时:20 )先修课程:数学分析、高等代数、概率统计、金融基础知识、Python程序设计基础适用专业:信息与计算科学建议教材:黄恒秋主编.Python金融数据分析与挖掘实战[M]. 北京:人民邮电出版社.2019.开课系部:数学与计算机科学学院一、课程的性质与任务课程性质:专业方向选修课。
课程任务:大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。
通过学习本课程,使得学生在掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能基础上,进一步地扩展应用到较为复杂金融数据处理及挖掘分析任务上,最后进行量化投资实战检验。
本课程为Python在金融量化投资领域的具体应用,也是Python 在金融行业应用最为广泛的领域之一,从而使得学生具备一定的行业应用背景及就业技能。
二、课程的基本内容及要求本课程教学时数为80学时,5学分;实验20学时,1.25学分。
第七章基础案例1.课程教学内容:(1)股票价格指数周收益率和月收益率的计算;(2)上市公司净利润增长率的计算;(3)股票价、量走势图绘制;(4)股票价格移动平均线的绘制;(5)沪深300指数走势预测;(6)基于主成分聚类的上市公司盈利能力分析。
2.课程的重点、难点:(1)重点:案例的实现思路、算法及程序具体实现;(2)难点:案例的实现算法、程序实现过程中各类数据结构的相互转换。
3.课程教学要求:(1)了解案例实现的基本思路;(2)理解案例实现的具体算法及程序实现,各种数据结构的相互转换并实现程序计算;(3)掌握案例实现的具体过程,包括思路、算法、数据处理、程序计算及结果展现。
第八章综合案例一:上市公司综合评价1.课程教学内容:(1)上市公司综合评价模型及方法基本介绍;(2)基于投资规模与效率指标的综合评价方法;(3)基于成长与价值指标的综合评价方法;(4)指标数据选取及数据预处理;(5)主成分分析模型及程序实现;(6)量化投资策略设计实现及结果分析。
《python金融数据挖掘及其应用》课程教学大纲
课程代码:
学分:5
学时:80(其中:讲课学时:60 实践或实验学时:20 )
先修课程:数学分析、高等代数、概率统计、金融基础知识、Python程序设计基础
适用专业:信息与计算科学
建议教材:黄恒秋主编.Python金融数据分析与挖掘实战[M]. 北京:人民邮电出版社.2019.
开课系部:数学与计算机科学学院
一、课程的性质与任务
课程性质:专业方向选修课。
课程任务:大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。
通过学习本课程,使得学生在掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能基础上,进一步地扩展应用到较为复杂金融数据处理及挖掘分析任务上,最后进行量化投资实战检验。
本课程为Python在金融量化投资领域的具体应用,也是Python 在金融行业应用最为广泛的领域之一,从而使得学生具备一定的行业应用背景及就业技能。
二、课程的基本内容及要求
本课程教学时数为80学时,5学分;实验20学时,1.25学分。
第七章基础案例
1.课程教学内容:
(1)股票价格指数周收益率和月收益率的计算;
(2)上市公司净利润增长率的计算;
(3)股票价、量走势图绘制;
(4)股票价格移动平均线的绘制;
(5)沪深300指数走势预测;
(6)基于主成分聚类的上市公司盈利能力分析。
2.课程的重点、难点:
(1)重点:案例的实现思路、算法及程序具体实现;
(2)难点:案例的实现算法、程序实现过程中各类数据结构的相互转换。
3.课程教学要求:
(1)了解案例实现的基本思路;
(2)理解案例实现的具体算法及程序实现,各种数据结构的相互转换并实现程序计算;
(3)掌握案例实现的具体过程,包括思路、算法、数据处理、程序计算及结果展现。
第八章综合案例一:上市公司综合评价
1.课程教学内容:
(1)上市公司综合评价模型及方法基本介绍;
(2)基于投资规模与效率指标的综合评价方法;
(3)基于成长与价值指标的综合评价方法;
(4)指标数据选取及数据预处理;
(5)主成分分析模型及程序实现;
(6)量化投资策略设计实现及结果分析。
2.课程的重点、难点:
(1)重点:业务数据理解、指标数据的选择、预处理、程序实现;
(2)难点:业务数据理解、数据预处理、模型的理解。
3.课程教学要求:
(1)了解上市公司综合评价的基本概念及模型;
(2)理解业务数据、指标数据选取、预处理、量化投资设计的基本原理、原则及流程;(3)掌握指标数据选取、预处理、程序实现、量化投资策略设计实现的全部流程。
第九章综合案例二:股票价格涨跌趋势预测
1.课程教学内容:
(1)股票价格涨跌趋势基本概念;
(2)技术分析指标的概念及计算公式;
(3)数据获取及指标计算;
(4)支持向量机模型、逻辑回归模型、神经网络模型实现及验证;
(5)量化投资策略设计实现及结果分析。
2.课程的重点、难点:
(1)重点:业务数据理解、指标概念及公式理解、程序实现及模型检验;
(2)难点:业务数据理解、指标公式理解及量化投资策略设计实现。
3.课程教学要求:
(1)了解股票价格涨跌趋势的基本概念;
(2)理解业务数据、技术分析指标数据计算、模型实现及验证相关原理、方法及流程;(3)掌握技术分析指标数据计算、模型检验、量化投资策略设计实现的全部流程。
第十章综合案例三:股票价格形态聚类与收益分析
1.课程教学内容:
(1)股票价格形态分析的基本概念;
(2)股票关键价格点的概念及提取算法;
(3)形态特征的表示及计算;
(4)K-最频繁值算法及程序实现;
(5)量化投资策略设计实现及结果分析。
2.课程的重点、难点:
(1)重点:业务数据理解、关键价格点提取算法、K-最频繁值聚类算法;
(2)难点:关键价格点提取算法、K-最频繁值聚类算法、量化投资策略设计实现;
3.课程教学要求:
(1)了解股票价格形态分析的基本概念、关键价格点概念;
(2)理解业务数据、关键价格点提取算法、形态特征表示、K-最频繁值聚类算法;
(3)掌握关键价格点提取算法、形态特征表示方法、K-最频繁值聚类算法的基本流程及程序实现,以及量化投资策略设计与实现。
第十一章综合案例四:行业联动与轮动分析
1.课程教学内容:
(1)行业联动与轮动的基本概念;
(2)行业联动与轮动的指标表示与计算;
(3)日、周、月频率的行业联动与轮动关联规则挖掘;
(4)量化投资策略设计实现及结果分析。
2.课程的重点、难点:
(1)重点:业务数据理解、行业轮动规则挖掘及量化投资策略设计实现;
(2)难点:行业轮动关联规则挖掘及量化投资策略设计实现。
3.课程教学要求:
(1)了解行业联动与轮动的基本概念;
(2)理解行业联动与轮动的指标表示、关联规则挖掘算法及量化投资策略设计原理;
(3)掌握行业联动与轮动关联规则挖掘算法及量化投资策略设计实现的全流程。
三、实践教学要求
金融数据挖掘及其应用是一门交叉复合型课程,涉及金融与金融数据、数据挖掘模型与算法、计算机编程技能等,同时也是一门实践性极强的课程。
本课程要求学生理解金融相关业务数据,并进行数据处理、分析与挖掘,同时根据挖掘的结论设计量化投资策略及实现。
本课程要求使用Python作为编程工具,建议使用Python的集成开发平台进行程序编写及教学,比如Anaconda、pycharm等。
四、课程学时分配
五、大纲说明
1.教学手段:
(1)理论与实践相结合,多媒体机房上课,带黑板(方便板书及推导);
(2)讲授课程结束后即开展实验,在机房进行。
2.考核方式建议:
(1)课程论文或者课程设计作品或者参加学科竞赛作品(70%)
(2)实验报告(15%)和实验结果(15%)进行评分
3.教材:
黄恒秋主编.Python金融数据分析与挖掘实战[M]. 北京:人民邮电出版社.2019.;
六、参考书目
[1] 张良均.Python数据分析与挖掘实战[M].北京:机械工业出版社.2016.
[2]王宇韬.Python金融大数据挖掘与分析全流程详解[M]. 北京:机械工业出版社.2019.
七、制定人:黄恒秋审定人:批准人:
2019年11月13日201 年月日201 年月日。