2018年地地研究生神经网络试的题目A卷参考详解
- 格式:doc
- 大小:92.50 KB
- 文档页数:9
1. 神经网络中的激活函数的主要作用是什么?A. 增加网络的复杂性B. 计算损失值C. 引入非线性特性D. 调整权重2. 在卷积神经网络(CNN)中,卷积层的主要功能是什么?A. 降低数据维度B. 提取图像特征C. 增加数据维度D. 计算梯度3. 反向传播算法在神经网络中的作用是什么?A. 初始化权重B. 计算前向传播C. 更新权重D. 选择激活函数4. 下列哪项不是神经网络的常见类型?A. 循环神经网络(RNN)B. 自组织映射(SOM)C. 决策树D. 长短期记忆网络(LSTM)5. 在神经网络训练过程中,什么是过拟合?A. 模型在训练数据上表现不佳B. 模型在测试数据上表现不佳C. 模型在训练数据上表现良好,但在测试数据上表现不佳D. 模型在训练和测试数据上都表现良好6. 下列哪项是防止神经网络过拟合的常用方法?A. 增加网络层数B. 减少训练数据C. 使用正则化D. 增加学习率7. 在神经网络中,什么是梯度消失问题?A. 梯度变得非常大B. 梯度变得非常小C. 梯度保持不变D. 梯度变为零8. 下列哪项是解决梯度消失问题的有效方法?A. 使用Sigmoid激活函数B. 使用ReLU激活函数C. 增加网络层数D. 减少训练数据9. 在神经网络中,什么是批量归一化(Batch Normalization)?A. 一种初始化权重的方法B. 一种正则化技术C. 一种加速训练过程的方法D. 一种计算损失的方法10. 下列哪项是神经网络中的损失函数?A. ReLUB. SigmoidC. Cross-EntropyD. Tanh11. 在神经网络中,什么是交叉熵损失函数?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种用于分类任务的损失函数D. 一种用于回归任务的损失函数12. 下列哪项是神经网络中的优化算法?A. K-meansB. AdamC. PCAD. SVM13. 在神经网络中,什么是Adam优化算法?A. 一种初始化权重的方法B. 一种计算梯度的方法C. 一种自适应学习率的优化算法D. 一种正则化技术14. 在神经网络中,什么是学习率?A. 网络层数B. 权重更新步长C. 激活函数D. 损失函数15. 下列哪项是调整学习率的有效方法?A. 增加网络层数B. 使用学习率衰减C. 减少训练数据D. 增加激活函数16. 在神经网络中,什么是Dropout?A. 一种初始化权重的方法B. 一种正则化技术C. 一种计算梯度的方法D. 一种激活函数17. 下列哪项是神经网络中的正则化技术?A. L1正则化B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数18. 在神经网络中,什么是L2正则化?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种正则化技术D. 一种激活函数19. 下列哪项是神经网络中的初始化方法?A. Xavier初始化B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数20. 在神经网络中,什么是Xavier初始化?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数21. 下列哪项是神经网络中的评估指标?A. 准确率B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数22. 在神经网络中,什么是准确率?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数23. 下列哪项是神经网络中的评估指标?A. 召回率B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数24. 在神经网络中,什么是召回率?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数25. 下列哪项是神经网络中的评估指标?A. F1分数B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数26. 在神经网络中,什么是F1分数?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数27. 下列哪项是神经网络中的评估指标?A. 精确率B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数28. 在神经网络中,什么是精确率?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数29. 下列哪项是神经网络中的评估指标?A. ROC曲线B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数30. 在神经网络中,什么是ROC曲线?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数31. 下列哪项是神经网络中的评估指标?A. AUCB. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数32. 在神经网络中,什么是AUC?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数33. 下列哪项是神经网络中的评估指标?A. 均方误差(MSE)B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数34. 在神经网络中,什么是均方误差(MSE)?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数35. 下列哪项是神经网络中的评估指标?A. 均方根误差(RMSE)B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数36. 在神经网络中,什么是均方根误差(RMSE)?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数37. 下列哪项是神经网络中的评估指标?A. 平均绝对误差(MAE)B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数38. 在神经网络中,什么是平均绝对误差(MAE)?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数39. 下列哪项是神经网络中的评估指标?A. 决定系数(R^2)B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数40. 在神经网络中,什么是决定系数(R^2)?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数41. 下列哪项是神经网络中的评估指标?A. 混淆矩阵B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数42. 在神经网络中,什么是混淆矩阵?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数43. 下列哪项是神经网络中的评估指标?A. 精确召回曲线B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数44. 在神经网络中,什么是精确召回曲线?A. 一种计算梯度的方法B. 一种评估模型性能的方法C. 一种初始化权重的方法D. 一种激活函数45. 下列哪项是神经网络中的评估指标?A. 准确率-召回率曲线B. Sigmoid激活函数C. ReLU激活函数D. Tanh激活函数答案1. C2. B3. C4. C5. C6. C7. B8. B9. C10. C11. C12. B13. C14. B15. B16. B17. A18. C19. A20. C21. A22. B23. A24. B25. A26. B27. A28. B29. A30. B31. A32. B33. A34. B35. A36. B37. A38. B39. A40. B41. A42. B43. A44. B45. A。
研究生神经网络试题A卷参考答案一、简答题1. 神经网络的基本原理是什么?神经网络是一种模仿人脑神经元网络结构和工作方式的计算模型。
它由大量的节点(神经元)和连接它们的边(突触)构成。
每个神经元接收多个输入信号,并通过激活函数进行处理后,将输出信号传递给其他神经元。
通过多层的神经元连接,神经网络能够对复杂的非线性问题进行建模和求解。
2. 神经网络训练的过程及原理是什么?神经网络的训练过程分为前向传播和反向传播两个阶段。
在前向传播过程中,将输入信号通过网络的各层神经元传递,并经过激活函数的作用,最终得到输出结果。
在反向传播过程中,通过与真实输出值的比较,计算网络输出的误差,然后将误差逆向传播回网络,根据误差进行权重和偏置的调整,以减小误差。
反复进行前向传播和反向传播的迭代训练,直到达到预定的训练精度或收敛条件。
3. 神经网络的主要应用领域有哪些?神经网络广泛应用于各个领域,包括图像识别、语音识别、自然语言处理、机器翻译、推荐系统等。
在图像识别领域,卷积神经网络(CNN)被广泛应用于图像分类、目标检测和图像分割等任务。
在自然语言处理领域,循环神经网络(RNN)和长短时记忆网络(LSTM)在语言模型、机器翻译和文本生成等方面表现出色。
此外,神经网络还可以用于金融预测、智能控制和模式识别等其他领域。
4. 神经网络中的激活函数有哪些常用的?它们的作用是什么?常用的激活函数包括sigmoid函数、ReLU函数和tanh函数。
它们的作用是在神经网络中引入非线性,增加网络的表达能力。
sigmoid函数将输入映射到0和1之间,主要用于二分类问题。
ReLU函数在输入大于0时返回该值,否则返回0,可以有效地缓解梯度消失问题,目前在深度学习中得到广泛应用。
tanh函数将输入映射到-1和1之间,具有对称性,使得网络的输出更加均匀。
5. 神经网络中的损失函数有哪些常用的?它们的作用是什么?常用的损失函数包括均方误差损失函数(MSE)、交叉熵损失函数和对数损失函数。
2018下半年网络工程师考试真题及答案-上午卷● 若内存按字节编址,用存储容量为32K X 8 比特的存储器芯片构成地址编号A0000H至DFFFFH的内存空间,则至少需要(1)片。
(1)A.4 B.6 C .8 D.10答案:C● 某计算机系统由下图所示的部件构成,假定每个部件的千小时可靠度R均为0.9,则该系统的千小时可靠度约为(2)。
(2)A.0.882 B.0.951 C.0.9 D.0.99答案:A● 设指令由取指、分析、执行3个子部件完成,每个子部件的工作周期均为△t ,采用常规标量单流水线处理机。
若连续执行10条指令,则共需时间(3)△t 。
(3)A.8 B.10 C .12 D.14试题解析:答案:C● 某计算机的时钟频率为400MHz,测试该计算机程序使用4种类型的指令。
每种指令的数量及所需指令时钟数(CPI)如下表所示,则该计算机的指令平均时钟数约为(4)。
(4)A.1.85 B.1.93 C.2.36 D.3.75答案:B● 常见的软件开发模型有瀑布模型、演化模型、螺旋模型、喷泉模型等。
其中(5)模型适用于需求明确或很少变更的项目,(6)模型主要用来描述面向对象的软件开发过程。
(5)A.瀑布模型 B.演化模型 C.螺旋模型 D.喷泉模型(6)A.瀑布模型 B.演化模型 C.螺旋模型 D.喷泉模型答案:(5)A (6)D●(7)确定了标准体制和标准化管理体制,规定了制定标准的对象与原则以及实施标准的要求,明确了违法行为的法律责任和处罚办法。
(7)A.标准化B.标准 C.标准化法 D.标准与标准化答案:C● 某开发人员不顾企业有关保守商业秘密的要求,将其参与该企业开发设计的应用软件的核心程序设计技巧和算法通过论文向社会发表,那么该开发人员的行为(8)。
(8)A.属于开发人员权利不涉及企业权利 B.侵犯了企业商业秘密权C.违反了企业的规章制度但不侵权 D.未侵犯权利人软件著作权答案:B● 在一个CPU的计算机系统中,采用可剥夺式(也称抢占式)优先级的进程调度方案,且所有任务可以并行使用I/O设备。
2018年下半年程序员真题+答案解析上午选择2018年11月11日考试1、以下关于信息和数据的描述中,错误的是()。
A.通常从数据中可以提取信息B.信息和数据都由数字组成C.信息是抽象的、数据是具体的D.客观事物中都蕴涵着信息答案:B信息反映了客观事物的运动状态和方式,客观事物中都蕴涵着信息。
数据是信息的物理形式,信息是数据的内容。
因此,信息是抽象的,数据是具体的,从数据中常可抽出信息。
各种形式的数据最终都可以表示成数字0和1的组合,但不能说信息和数据都由数字组成。
声、图、文、像、影都可以是信息和数据的表现形式。
2、问卷的设计原则不包括()。
A.所选问题必须紧扣主题,先易后难B.要尽量提供回答选项C.应便于校验、整理和统计D.问卷中应尽量使用专业术语,让他人无可挑剔答案:D问卷调查中,问卷的设计是关键。
问卷中所选问句必须紧扣主题,先易后难,并且要尽量提供回答选项,使人们回答简便,否则人们不愿意填写。
问卷的设计还要考虑到回收后便于处理(包括校验、整理和统计等)。
问卷中的问题以及术语应尽量使用通俗的语言,过于专业的术语百姓看不懂,也就难于填写问卷。
3、在Excel的A1单元格中输入公式“=ROUND(14.9,0)”,按回车键后,A1单元格中的值为()。
A.10B.14.9C.13.9D.15答案:D本题考查Excel的知识。
ROUND是四舍五入求保留小数点的位数,如果是保留为0位,即按照四舍五入的原则保留为整数。
所以答案是15。
4、在Excel的A1单元格中输入公式“=POWER(MIN(-4,-1,1,4),3)”,按回车键后,A1单元格中显示的值为()。
A.-1B.-64C.1D.64答案:B本题考查Excel的知识。
Power是进行求某数的多少次方。
MIN是用于求给出的数当中的最小数,所以:=POWER(MIN(-4,-1,1,4),3)=POWER(-4,3)=-64。
5、()服务的主要作用是提供远程登录服务。
1. 神经网络中的激活函数主要用于:A) 线性变换B) 非线性变换C) 数据标准化D) 数据清洗2. 在神经网络中,反向传播算法主要用于:A) 数据预处理B) 权重初始化C) 计算损失函数D) 更新权重3. 卷积神经网络(CNN)主要用于:A) 文本分析B) 图像识别C) 声音处理D) 数据挖掘4. 循环神经网络(RNN)特别适合处理:A) 静态图像B) 序列数据C) 表格数据D) 随机数据5. 在神经网络训练中,Dropout层的主要作用是:A) 增加网络深度B) 防止过拟合C) 加速收敛D) 提高精度6. 以下哪种优化算法在神经网络中不常用?A) 梯度下降B) 随机梯度下降C) 动量法D) 贪心算法7. 批量归一化(Batch Normalization)的主要作用是:A) 增加模型复杂度B) 加速训练过程C) 减少模型参数D) 提高模型精度8. 在神经网络中,损失函数的作用是:A) 评估模型复杂度B) 衡量预测值与真实值的差异C) 初始化权重D) 选择激活函数9. 以下哪种情况会导致神经网络过拟合?A) 数据量过大B) 模型复杂度过低C) 训练时间过长D) 数据预处理不当10. 在神经网络中,权重初始化的目的是:A) 防止梯度消失B) 增加模型稳定性C) 提高计算效率D) 以上都是11. 以下哪种激活函数在深度学习中不常用?A) ReLUB) SigmoidC) TanhD) Linear12. 在神经网络中,交叉熵损失函数通常用于:A) 回归问题B) 分类问题C) 聚类问题D) 异常检测13. 以下哪种网络结构适用于自然语言处理?A) CNNB) RNNC) GAND) AE14. 在神经网络中,梯度消失问题通常与哪种激活函数相关?A) ReLUB) SigmoidC) TanhD) Leaky ReLU15. 以下哪种方法可以有效缓解梯度消失问题?A) 增加网络层数B) 使用批量归一化C) 使用Sigmoid激活函数D) 减少训练数据16. 在神经网络中,Adam优化算法结合了哪两种优化算法的优点?A) 梯度下降和动量法B) 动量法和RMSpropC) 随机梯度下降和RMSpropD) 梯度下降和AdaGrad17. 以下哪种网络结构适用于生成对抗网络(GAN)?A) CNNB) RNNC) GAND) AE18. 在神经网络中,自编码器(AE)的主要用途是:A) 数据压缩B) 特征提取C) 数据生成D) 以上都是19. 以下哪种方法可以提高神经网络的泛化能力?A) 增加训练数据B) 减少模型复杂度C) 使用正则化D) 以上都是20. 在神经网络中,L1正则化和L2正则化的主要区别是:A) L1产生稀疏权重B) L2产生稀疏权重C) L1和L2都产生稀疏权重D) L1和L2都不产生稀疏权重21. 以下哪种方法可以有效防止神经网络中的过拟合?A) 增加网络层数B) 使用DropoutC) 减少训练数据D) 增加学习率22. 在神经网络中,学习率的选择对训练过程的影响是:A) 学习率越大,收敛越快B) 学习率越小,收敛越快C) 学习率对收敛速度没有影响D) 学习率过大或过小都会影响收敛速度23. 以下哪种方法可以加速神经网络的训练过程?A) 增加网络层数B) 使用批量归一化C) 减少训练数据D) 增加学习率24. 在神经网络中,动量法的主要作用是:A) 防止梯度消失B) 加速收敛C) 增加模型复杂度D) 减少模型参数25. 以下哪种方法可以提高神经网络的鲁棒性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率26. 在神经网络中,RMSprop优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率D) 随机学习率27. 以下哪种方法可以提高神经网络的解释性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 使用可视化工具28. 在神经网络中,AdaGrad优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率D) 随机学习率29. 以下哪种方法可以提高神经网络的泛化能力?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率30. 在神经网络中,L1正则化和L2正则化的主要区别是:A) L1产生稀疏权重B) L2产生稀疏权重C) L1和L2都产生稀疏权重D) L1和L2都不产生稀疏权重31. 以下哪种方法可以有效防止神经网络中的过拟合?A) 增加网络层数B) 使用DropoutC) 减少训练数据D) 增加学习率32. 在神经网络中,学习率的选择对训练过程的影响是:A) 学习率越大,收敛越快B) 学习率越小,收敛越快C) 学习率对收敛速度没有影响D) 学习率过大或过小都会影响收敛速度33. 以下哪种方法可以加速神经网络的训练过程?A) 增加网络层数B) 使用批量归一化C) 减少训练数据D) 增加学习率34. 在神经网络中,动量法的主要作用是:A) 防止梯度消失B) 加速收敛C) 增加模型复杂度D) 减少模型参数35. 以下哪种方法可以提高神经网络的鲁棒性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率36. 在神经网络中,RMSprop优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率D) 随机学习率37. 以下哪种方法可以提高神经网络的解释性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 使用可视化工具38. 在神经网络中,AdaGrad优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率39. 以下哪种方法可以提高神经网络的泛化能力?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率40. 在神经网络中,L1正则化和L2正则化的主要区别是:A) L1产生稀疏权重B) L2产生稀疏权重C) L1和L2都产生稀疏权重D) L1和L2都不产生稀疏权重41. 以下哪种方法可以有效防止神经网络中的过拟合?A) 增加网络层数B) 使用DropoutC) 减少训练数据D) 增加学习率42. 在神经网络中,学习率的选择对训练过程的影响是:A) 学习率越大,收敛越快B) 学习率越小,收敛越快C) 学习率对收敛速度没有影响D) 学习率过大或过小都会影响收敛速度43. 以下哪种方法可以加速神经网络的训练过程?A) 增加网络层数B) 使用批量归一化C) 减少训练数据D) 增加学习率44. 在神经网络中,动量法的主要作用是:A) 防止梯度消失B) 加速收敛C) 增加模型复杂度D) 减少模型参数45. 以下哪种方法可以提高神经网络的鲁棒性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率46. 在神经网络中,RMSprop优化算法的主要特点是:B) 固定学习率C) 无学习率D) 随机学习率47. 以下哪种方法可以提高神经网络的解释性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 使用可视化工具48. 在神经网络中,AdaGrad优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率D) 随机学习率49. 以下哪种方法可以提高神经网络的泛化能力?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率50. 在神经网络中,L1正则化和L2正则化的主要区别是:A) L1产生稀疏权重B) L2产生稀疏权重C) L1和L2都产生稀疏权重D) L1和L2都不产生稀疏权重51. 以下哪种方法可以有效防止神经网络中的过拟合?A) 增加网络层数B) 使用DropoutC) 减少训练数据D) 增加学习率52. 在神经网络中,学习率的选择对训练过程的影响是:A) 学习率越大,收敛越快B) 学习率越小,收敛越快C) 学习率对收敛速度没有影响D) 学习率过大或过小都会影响收敛速度53. 以下哪种方法可以加速神经网络的训练过程?A) 增加网络层数B) 使用批量归一化C) 减少训练数据54. 在神经网络中,动量法的主要作用是:A) 防止梯度消失B) 加速收敛C) 增加模型复杂度D) 减少模型参数55. 以下哪种方法可以提高神经网络的鲁棒性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 增加学习率56. 在神经网络中,RMSprop优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率D) 随机学习率57. 以下哪种方法可以提高神经网络的解释性?A) 增加网络层数B) 使用正则化C) 减少训练数据D) 使用可视化工具58. 在神经网络中,AdaGrad优化算法的主要特点是:A) 自适应学习率B) 固定学习率C) 无学习率D) 随机学习率答案:1. B2. D3. B4. B5. B6. D7. B8. B9. C10. D11. D12. B13. B14. B15. B16. B17. C18. D19. D20. A21. B22. D23. B24. B25. B26. A27. D28. A29. B30. A31. B32. D33. B34. B35. B36. A37. D38. A39. B40. A41. B42. D43. B44. B45. B46. A47. D48. A49. B50. A51. B52. D53. B54. B55. B56. A57. D58. A。
2018年上半年网络工程师上午试卷⚫浮点数的表示分为阶和尾数两部分,两个浮点数相加时,要先对阶,即(1)(n为阶差的绝对值)。
(1)A.将大阶向小阶对齐,同时将尾数左移n位B.将大阶向小阶对齐,同时将尾数右移n位C.将小阶向大阶对齐,同时将尾数左移n位D.将小阶向大阶对齐,同时将尾数右移n位⚫计算机运行过程中,遇到突发事件,要求CPU暂时停止正在运行的程序,转去为突发事件服务,服务完毕,再自动返回原程序继续执行,这个过程称为(2),其处理过程中保存现场的目的是(3)。
(2)A.阻塞 B.中断 C.动态绑定 D.静态绑定(3)A.防止丢失数据 B.防止对其他部件造成影响C.返回去继续执行原程序D.为中断处理程序提供数据⚫著作权中,(4)的保护期不受限制。
(4)A.发表权B.发行权C.署名权D.展览权⚫王某是某公司的软件设计师,完成某项软件开发后按公司规定进行软件归档。
以下有关该软件的著作权的叙述中,正确的是(5)。
(5)A.著作权应由公司和王某共同享有B.著作权应由公司享有C.著作作权应由王某享有D.除署名权以外,著作权的其它权利由王某享有⚫海明码是一种纠错码,其方法是为需要校验的数据位增加若干校验位,使得校验位的值决定于某些被校位的数据,当被校数据出错时,可根据校验位的值的变化找到出错位,从而纠正错误,对于32位的数据,至少需要增加(6)个校验位才能构成海明码。
以10位数据为例,其海明码表示为D9D8D7D6D5P4D4D3D2D IP3D9P2P1中,其中D i(0≤i≤9)表示数据位,P j(1≤j≤4)表示校验位,数据位D9由P4、P3和P2进行校验(从右至左D9的位序为14,即等于8+4+2,因此用第8位的P4,第4位的P3和第2位的P2校验),数据位D3由(7)进行校验。
(6)A.3 B.4 C. 5 D.6(7)A. P4P1 B. P4P2 C. P4P3P1 D.P3P2P1⚫流水线的吞吐率是指单位时间流水线处理的任务数,如果各段流水的操作时间不同,则流水线的吞吐率是(8)的倒数。
08 –09 学第一学:神经网络计算机科学与技术(医学智能方向)06:::v······yy··················yy3. 在MA TLAB中,下面的(○3)命令可以使用得下次绘制的图和已经绘制的图将不在同一张图上。
不在同一张图上。
A) hold on(设置在同一张图绘制多条曲线)(设置在同一张图绘制多条曲线)B) figure (下次的图和已绘制的不在同一张图上)C) plot D) hold off(取消在同一张图绘制多条曲线)3.下面是一段有关向量运算的MA TLAB代码: >>y= [3 7 11 5]; >>y(3) = 2 运算后的输出结果是(○8)A) 3 2 11 5 B) 3 7 2 5C) 2 7 11 5 D) 3 7 11 2 4. 下面是一段有关矩阵运算的MA TLAB代码: >>A = [1 2 3 4; 5 6 7 8; 9 10 11 12];>>B = A(2,1:3)取出矩阵A中第二行第一个到第三个构成矩阵B 若A(2,3)=5将矩阵第二行第三列的元素置为5 A=[A B’]将B转置后,再以列向量并入A A(:,2)=[]删除第二列:代表删除列A([1,4],:)=[]删除第一和第四行:代表删除行A=[A;4,3,2,1]加入第四行那么运算后的输出结果是(○9)A) 5 7 8 B) 5 6 8 C) 5 6 7D) 6 7 8 plot(x,y,s),s)函数叙说正确的是(○10)5.下面对MA TLAB中的中的 plot(x,yA) 绘制以x、y为横纵坐标的连线图(plot(x,y)) B绘制多条不同色彩的连线图绘制多条不同色彩的连线图 (plot(x,y))C) 默认的绘图颜色为蓝色D) 如果s=’r+’,则表示由红色的+号绘制图形6. 如果现在要对一组数据进行分类,我们不知道这些数据最终能分成几类,那么应)来处理这些数据最适合。
2018年南京工业大学828数据结构与操作系统真题南京工业大学2018年硕士研究生入学考试初试试题(A卷)科目代码:828科目名称:数据结构与操作系统满分:150分注意:①认真阅读答题纸上的注意事项;②所有答案必须写在答题纸上,写在本试题纸或草稿纸上均无效;③本试题纸须随答题纸一起装入试题袋中交回!第一部分:数据结构(共90分)单项选择题(下列每题给出的四个选项中,只有一项符合试题要求。
每小题2分,共30分)1、通常所说的时间复杂度是指。
A.语句的频度B.算法的时间消耗C.渐进时间复杂度D.最坏的时间复杂度2、等概率条件下,在由n个结点构成的顺序表上做插入结点操作,需平均移动的结点数为。
A.nB.(n-1)/2C.n/2D.(n+1)/23、向具有n个结点的有序单链表中插入一个新结点并仍然有序的时间复杂度是。
A.O(1)B.O(n)C.O(n2)D.O(logan)4、从一个栈顶指针为top的链栈中删除一个结点时,用x保存被删除的结点,20应执行下列命令。
A.x=top:top-top>nextB.top=Top->next;=top>dataB.C.x=Top->data;D,x=Top->data;Top-top->next5、循环队列SQ队满的条件是。
A.SQ->rear=SQ->froat;B.(SQ->rear+1)%MAXLEN=SQ->froatC.SQ->rear+2=SQL->froatD.(SQ->rear+2)%MAXLEN=SQL>froat6、某队列允许在两端进行入队操作,但仅允许在一端进行出队操作(称为输出受限的双端队列),若五个元素a,b,c,d,e依次进队,则不可能得到的出队顺序是。
A.bacdeB.dbaceC.dbcaeD.ecbad7、对特殊矩阵采用压缩存储的目的主要是为了。
《神经网络原理》一、填空题1、从系统的观点讲,人工神经元网络是由大量神经元通过极其丰富和完善的连接而构成的自适应、非线性、动力学系统。
2、神经网络的基本特性有拓扑性、学习性和稳定收敛性。
3、神经网络按结构可分为前馈网络和反馈网络,按性能可分为离散型和连续型,按学习方式可分为有导师和无导师。
4、神经网络研究的发展大致经过了四个阶段。
5、网络稳定性指从t=0时刻初态开始,到t时刻后v(t+△t)=v(t),(t>0),称网络稳定。
6、联想的形式有两种,它们分是自联想和异联想。
7、存储容量指网络稳定点的个数,提高存储容量的途径一是改进网络的拓扑结构,二是改进学习方法。
8、非稳定吸引子有两种状态,一是有限环状态,二是混沌状态。
9、神经元分兴奋性神经元和抑制性神经元。
10、汉明距离指两个向量中对应元素不同的个数。
二、简答题1、人工神经元网络的特点?答:(1)、信息分布存储和容错性。
(2)、大规模并行协同处理。
(3)、自学习、自组织和自适应。
(4)、人工神经元网络是大量的神经元的集体行为,表现为复杂的非线性动力学特性。
(5)人式神经元网络具有不适合高精度计算、学习算法和网络设计没有统一标准等局限性。
2、单个神经元的动作特征有哪些?答:单个神经元的动作特征有:(1)、空间相加性;(2)、时间相加性;(3)、阈值作用;(4)、不应期;(5)、可塑性;(6)疲劳。
3、怎样描述动力学系统?答:对于离散时间系统,用一组一阶差分方程来描述:X(t+1)=F[X(t)];对于连续时间系统,用一阶微分方程来描述:dU(t)/dt=F[U(t)]。
4、F(x)与x 的关系如下图,试述它们分别有几个平衡状态,是否为稳定的平衡状态?答:在图(1)中,有两个平衡状态a 、b ,其中,在a 点曲线斜率|F ’(X)|>1,为非稳定平稳状态;在b 点曲线斜率|F ’(X)|<1,为稳定平稳状态。
在图(2)中,有一个平稳状态a ,且在该点曲线斜率|F ’(X)|>1,为非稳定平稳状态。
2-1 分析为什么平方损失函数不适用于分类问题?损失函数是一个非负实数,用来量化模型预测和真实标签之间的差异。
我们一般会用损失函数来进行参数的优化,当构建了不连续离散导数为0的函数时,这对模型不能很好地评估。
直观上,对特定的分类问题,平方差的损失有上限(所有标签都错,损失值是一个有效值),但交叉熵则可以用整个非负域来反映优化程度的程度。
从本质上看,平方差的意义和交叉熵的意义不一样。
概率理解上,平方损失函数意味着模型的输出是以预测值为均值的高斯分布,损失函数是在这个预测分布下真实值的似然度,softmax 损失意味着真实标签的似然度。
在二分类问题中y = { + 1 , − 1 }在C 分类问题中y = { 1 , 2 , 3 , ⋅ ⋅ ⋅ , C }。
可以看出分类问题输出的结果为离散的值。
分类问题中的标签,是没有连续的概念的。
每个标签之间的距离也是没有实际意义的,所以预测值和标签两个向量之间的平方差这个值不能反应分类这个问题的优化程度。
比如分类 1,2,3, 真实分类是1, 而被分类到2和3错误程度应该是一样的,但是明显当我们预测到2的时候是损失函数的值为1/2而预测到3的时候损失函数为2,这里再相同的结果下却给出了不同的值,这对我们优化参数产生了误导。
至于分类问题我们一般采取交叉熵损失函数(Cross-Entropy Loss Function )来进行评估。
2-2 在线性回归中,如果我们给每个样本()()(,)n n x y 赋予一个权重()n r ,经验风险函数为()()()211()()2N n n T n n R w r y w x ==−∑,计算其最优参数*w ,并分析权重()n r 的作用.答:其实就是求一下最优参数*w ,即导数为0,具体如下:首先,取权重的对角矩阵:()(),,,n P diag r x y w =均以向量(矩阵)表示,则原式为:21()||||2T R P Y X Ω=−Ω ,进行求导:()0T R XP Y X ∂=−−Ω=∂Ω,解得:*1()T XPX XPY −Ω=,相比于没有P 时的Ω:1()T withoutP XX XY −Ω=,可以简单理解为()n r 的存在为每个样本增加了权重,权重大的对最优值ω的影响也更大。
神经网络习题1.由单神经元构成的感知器网络,如下图所示:已知:x0 = 1 w0 = -1 w1= w2 = w3= w4 = 0.5假设:神经元的变换函数为符号函数:即:11y⎧=⎨-⎩ss≥<若该网络输入端有十种不同的输入模式:即: x1 x2 x3 x4 = 0 0 0 0 - 1 0 0 1 试分析该感知器网络对以上输入的分类结果。
2、对于图1所示的多层前馈神经网络,试利用BP算法训练该神经网络,使其能实现如下异或逻辑关系,即(0)(0)(2)x x x120 0 00 1 11 0 11 1 0 Array图1要求:(1)提交编写的程序;(2)对已训练的BP网络进行测试,并画出相应的学习曲线。
3、设有如下的二维非线性函数)cos()sin(),(2121x x x x f ππ=其中]1,1[1 x -∈,]1,1[2 x -∈。
试利用多层前馈神经网络实现该非线性映射。
建议按10.021==x x ∆∆的间隔均匀取点,利用上述解析式进行理论计算,将其结果用以构造输入输出训练样本集。
为了构造输入输出测试样本集,建议按12.021==x x ∆∆的均匀间隔进行采样。
要求:(1)提交编写的程序;(2)给出对网络进行测试后的精度分析结果,并画出相应的学习曲线;(3)分别画出按解析式计算的输出结果及已训练BP 神经网络输出结果的三维图形。
【附加总结类文档一篇,不需要的朋友可以下载后编辑删除,谢谢】2015年文化馆个人工作总结在XXXX年X月,本人从XXXX学院毕业,来到了实现我梦想的舞台--XX区文化馆工作。
在这里我用艰辛的努力,勤劳的付出,真诚而认真地工作态度认真的做好自身的每一项文化馆相关工作,取得了较为良好的工作业绩。
随着一场场活动的成功举办、一台台戏剧的成功出演,在这个带有着梦想和希望的舞台上,转眼之间我已在这里渡过了XX年的青春事业,我亦与舞台共同成长,逐步由一名青涩的毕业生,历练成为了今天的XXX。
2018年下半年网络规划师真题+答案解析上午选择题2018年11月11日考试1、在磁盘调度管理中,应先进行移臂调度,再进行旋转调度。
假设磁盘移动臂位于21号柱面上,进程的请求序列如下表所示。
如果采用最短移臂调度算法,那么系统的响应序列应为( )。
A. ②⑧③④⑤①⑦⑥⑨B. ②③⑧④⑥⑨①⑤⑦C. ①②③④⑤⑥⑦⑧⑨D. ②⑧③⑤⑦①④⑥⑨答案:D当进程请求读磁盘时,操作系统先进行移臂调度,再进行旋转调度。
由于移动臂位于21号柱面上,按照最短寻道时间优先的响应柱面序列为23→17→32→38。
按照旋转调度的原则分析如下:进程在23号柱面上的响应序列为②→⑧→③,因为进程访问的是不同磁道上的不同编号的扇区,旋转调度总是让首先到达读写磁头位置下的扇区先进行传送操作。
进程在17号柱面上的响应序列为⑤→⑦→①,或⑤→①→⑦。
对于①和⑦可以任选一个进行读写,因为进程访问的是不同磁道上具有相同编号的扇区,旋转调度可以任选一个读写磁头位置下的扇区进行传送操作。
进程在32号柱面上的响应序列为④→⑥;由于⑨在38号柱面上,故响应最后响应。
从上面的分析中可以得出按照最短寻道时间优先的响应序列为②⑧③⑤⑦①④⑥⑨。
2、某文件系统采用多级索引结构,若磁盘块的大小为4K字节,每个块号需占4字节,那么采用二级索引结构时的文件最大长度可占用( )个物理块。
A. 1024B. 1024×1024C. 2048×2048D. 4096×4096答案:B根据题意,磁盘块的大小为4KB,每个块号需占4B,因此一个磁盘物理块可存放1024个块号。
二级索引时的文件最大长度占1024×1024。
3、CPU的频率有主频、倍频和外频。
某处理器外频是200MHz,倍频是13,该款处理器的主频是( )。
A. 2.6GHzB. 1300MHzC. 15.38MhzD. 200MHz答案:ACPU的主频就是CPU 的工作频率,也就是它的速度,单位是MHz。
2018计算机考研408真题和答案2018年计算机考研408真题及答案一、单选题部分:1. 在计算机网络中,通信协议是指()。
A. 传输介质B. 通信规则C. 通信设备D. 通信软件答案:B2. 在程序开发过程中,下面哪种方法可以用于检测内存泄漏?A. 静态分析B. 动态分析C. 压力测试D. 负载测试答案:B3. 下面哪种存储器具有最小的存取时间?A. 内存B. 磁盘C. 缓存D. 寄存器答案:D4. 下面哪种排序算法的时间复杂度始终为O(nlogn)?A. 冒泡排序B. 插入排序C. 快速排序D. 希尔排序答案:C5. 下面哪种数据库模型是面向对象的数据库模型?A. 层次模型B. 网状模型C. 关系模型D. 对象模型答案:D二、多选题部分:1. 下面哪些属于面向对象编程的特点?()A. 封装B. 继承C. 多态D. 并行答案:A、B、C2. 下面哪些属于软件工程的基本原则?()A. 需求分析B. 设计C. 编码D. 测试答案:A、B、C、D三、填空题部分:1. 在计算机网络中,IP地址共有()位。
答案:322. 在C语言中,变量的作用域可以分为()和()两种。
答案:全局作用域、局部作用域四、简答题部分:1. 简述TCP/IP协议中的TCP和UDP协议的区别。
答案:TCP是面向连接的可靠传输协议,提供了数据传输的可靠性和完整性。
UDP是无连接的不可靠传输协议,不保证数据传输的可靠性和完整性。
TCP使用三次握手建立连接,UDP不需要建立连接。
TCP数据传输时会进行流量控制和拥塞控制,UDP不进行控制。
TCP适用于要求可靠传输的应用,如文件传输;UDP适用于实时性要求较高的应用,如视频流传输。
2. 简述软件测试的基本原则。
答案:软件测试的基本原则包括全面性、及早性、准确性和经济性。
全面性指测试应该覆盖系统的各个功能和各种情况,尽可能发现所有可能的错误;及早性指测试应该尽早开始,尽早发现和修复错误;准确性指测试应该准确地验证系统是否满足需求和设计要求;经济性指测试应该在可接受的时间和成本范围内完成,避免过度测试和浪费资源。
2018年全国硕士研究生入学统一考试计算机科学与技术学科联考计算机学科专业基础综合试题一、单项选择题(第1~40小题,每小题2分,共80分。
下列每题给出的四个选项中,只有一个选项最符合试题要求)1.若栈S1中保存整数,栈S2中保存运算符,函数F()依次执行下述各步操作:(1)从S1中依次弹出两个操作数a和b;(2)从S2中弹出一个运算符op;(3)执行相应的运算b op a;(4)将运算结果压入S1中。
假定S1中的操作数依次是5,8,3,2(2在栈顶),S2中的运算符依次是*,-,+(+在栈顶)。
调用3次F()后,S1栈顶保存的值是。
A.-15B.15C.-20D.202.现有队列Q与栈S,初始时Q中的元素依次是1,2,3,4,5,6(1在队头),S为空。
若仅允许下列3种操作:①出队并输出出队元素;②出队并将出队元素入栈;③出栈并输出出栈元素,则不能得到的输出序列是。
A.1,2,5,6,4,3B.2,3,4,5,6,1C.3,4,5,6,1,2D.6,5,4,3,2,13.设有一个12×12的对称矩阵M,将其上三角部分的元素m i,j(1≤i≤j≤12)按行优先存入C语言的一维数组N中,元素m6,6在N中的下标是。
A.50B.51C.55D.664.设一棵非空完全二叉树T的所有叶结点均位于同一层,且每个非叶结点都有2个子结点。
若T有k个叶结点,则T的结点总数是。
A.2k-1B.2kC.k2D.2k-15.已知字符集{a,b,c,d,e,f},若各字符出现的次数分别为6,3,8,2,10,4,则对应字符集中各字符的哈夫曼编码可能是。
A.00,1011,01,1010,11,100B.00,100,110,000,0010,01C.10,1011,11,0011,00,010D.0011,10,11,0010,01,0006.已知二叉排序树如下图所示,元素之间应满足的大小关系是。
A.x1<x2<x5B.x1<x4<x5C.x3<x5<x4D.x4<x3<x57.下列选项中,不是如下有向图的拓扑序列的是。
2024年考研高等数学三神经网络的数学理论历年真题神经网络是一种模仿人脑神经元工作原理的信息处理系统,近年来在各个领域取得了重大突破。
在数学理论方面,神经网络也发挥着重要的作用。
本文将通过回顾2024年考研高等数学三的历年真题,探讨神经网络在数学理论中的应用以及其相关的数学知识。
一、知识点回顾在开始分析神经网络的数学理论应用之前,我们首先对考研高等数学三中与神经网络相关的知识点进行回顾。
1. 线性代数线性代数是神经网络中涉及到的基础数学学科之一。
其中,矩阵和向量的运算是重要的基础。
在神经网络的模型中,输入和输出通常用向量表示,而模型的参数则用矩阵表示。
2. 概率论与数理统计概率论与数理统计是神经网络中常用的数学工具。
在神经网络的训练过程中,通常会使用到概率模型和统计分析方法。
3. 微积分微积分是神经网络理论的重要基础。
在神经网络的模型中,通过微积分的方法来求解模型的参数,进而实现对输入数据的预测和分类。
二、应用案例分析接下来,我们将通过回顾2024年考研高等数学三的历年真题,从神经网络的数学理论角度进行分析和探讨。
1. 题目一:某神经网络模型的代价函数为何?在这个题目中,我们需要回顾神经网络的代价函数的定义和计算方法。
代价函数通常用来衡量神经网络模型的预测结果和实际结果之间的差异程度,常见的代价函数有均方误差函数。
2. 题目二:如何计算神经网络的反向传播算法?在这个题目中,我们需要回顾神经网络的反向传播算法的原理和计算步骤。
反向传播算法是神经网络中常用的优化算法,通过调整模型的参数来最小化代价函数,进而提高神经网络的预测准确率。
3. 题目三:利用神经网络进行手写数字识别在这个题目中,我们需要回顾神经网络在图像识别领域的应用。
手写数字识别是神经网络的经典应用之一,通过训练模型,使其能够准确地将手写数字图像分类。
三、数学理论与神经网络的结合神经网络作为一种数学理论的应用工具,与线性代数、概率论与数理统计以及微积分等数学学科密切相关。
研究生神经网络试题A卷参考答案
一、名词解释(共5题,每题5分,共计25分)
1、泛化能力
答:泛化能力又称推广能力,是机器学习中衡量学习机性能好坏的一个重要指标。
泛化能力主要是指经过训练得到的学习机对未来新加入的样本(即测试样本)数据进行正确预测的能力。
2、有监督学习
答:有监督学习又被称为有导师学习,这种学习方式需要外界存在一个“教师”,她可以对一组给定输入提供应有的输出结果,学习系统可根据已知输出与实际输出之间的差值来调节系统参数。
3、过学习
答:过学习(over-fitting),也叫过拟和。
在机器学习中,由于学习机器过于复杂,尽管保证了分类精度很高(经验风险很小),但由于VC维太大,所以期望风险仍然很高。
也就是说在某些情况下,训练误差最小反而可能导致对测试样本的学习性能不佳,发生了这种情况我们称学习机(比如神经网络)发生了过学习问题。
典型的过学习是多层前向网络的BP算法
4、Hebb 学习规则
答:如果两个神经元同时兴奋(即同时被激活),则它们之间的突触连接加强。
如
果用i v 、j v 表示神经元i 和j 的激活值(输出),
ij ϖ表示两个神经元之间的连接权,则Hebb 学习规则可以表示为: ij i j w v v α∆= ,这里α表示学习速率。
Hebb 学习规则是人工神经网络学习的基本规则,几乎所有神经网络的学习规则都可以看作Hebb 学习规则的变形。
5、自学习、自组织与自适应性
答:神经网络结构上的特征是处理单元的高度并行性与分布性,这种特征使神经网络在信息处理方面具有信息的分布存储与并行计算而且存储与处理一体化的特点。
而这些特点必然给神经网络带来较快的处理速度和较强的容错能力。
能力方面的特征是神经网络的自学习、自组织与自性适应性。
自适应性是指一个系统能改变自身的性能以适应环境变化的能力,它包含自学习与自组织两层含义。
自学习是指当外界环境发生变化时,经过一段时间的训练或感知,神经网络能通过自动调整网络结构参数,使得对于给定输入能产生期望的输出。
自组织是指神经系统能在外部刺激下按一定规则调整神经元之间的突触连接,逐渐构建起神经网络。
也就是说自组织神经元的学习过程,完全是一种自我学习的过程,不存在外部教师的示教。
二、问答题(共7题,每题8分,共计56分)
1、试述遗传算法的基本原理,并说明遗传算法的求解步骤。
答:遗传算法的基本原理如下:通过适当的编码方式把问题结构变为位串形式(染色体),在解空间中取一群点作为遗传开始的第一代,染色体的优劣程度用一个适应度函数来衡量,每一代在上一代的基础上随机地通过复制、遗传、变异来产生新的个体,不断迭代直至产生符合条件的个体为止。
迭代结束时,一般将适应度最高的个体作为问题的解。
一般遗传算法的主要步骤如下:
(1) 随机产生一个由确定长度的特征字符串组成的初始群体。
(2) 对该字符串群体迭代的执行下面的步(a) 和(b) ,直到满足停止标准:
(a) 计算群体中每个个体字符串的适应值;
(b) 应用复制、交叉和变异等遗传算子产生下一代群体。
(3) 把在后代中出现的最好的个体字符串指定为遗传算法的执行结果,这个结果可以表示问题的一个解。
2、什么是进化计算?它包括哪些内容?它们的出发点是什么?
答:进化计算即模仿生物来建立功能强大的算法,进而将它们运用于复杂的优化问题。
进化计算包括遗传算法、进化策略、进化编程、遗传编程和人工生命。
遗传算法是模仿生物遗传学和自然选择机理,通过人工方式构造的一类优化搜索算法,是对生物进化过程进行的一种数学仿真,是进化计算的一种最重要形式。
进化策略是一类模仿自然进化原理以求解参数优化问题的算法。
进化编程的过程,可理解为从所有可能的计算机程序形成的空间中,搜索具有高的适应度的计算机程序个体。
人工生命试图通过人工方法建造具有自然生命特征的人造系统。
3、人工神经网络是模拟生物神经网络的产物,除相同点外,它们还存在哪些主要区别?
答; 1.单元上的差别对于生物神经元而言,影响突触传递信息强度的因素很多、很复杂。
如突触前微细胞的大小与多少、神经传递化学物质含量的多少、神经传递化学物质释放的速度、突触间隙的变化、树突的位置与大小等诸多因素都会对突触电位产生影响,从而影响神经元的输出脉冲响应。
而人工神经元则忽略了这些影响,输入、输出关系十分简单。
2.信息上的差别生物神经元传递的信息是脉冲,而人工神经元传递的信息是模拟电压。
3.规模与智能上的差别目前,人工神经网络的规模还远小于生物神经网络,网络中神经元的数量一般在104个以下,显然,其智能也无法与生物神经网络相比。
4、感知器神经网络存在的主要缺陷是什么?
答: 1)由于感知器的激活函数采用的是阀值函数,输出矢量只能取0或1,所以只能用它来解决简单的分类问题;
2)感知器仅能够线性地将输入矢量进行分类。
理论上已经证明,只要输人矢量是线性可分的,感知器在有限的时间内总能达到目标矢量;
3)感知器还有另外一个问题,当输入矢量中有一个数比其他数都大或小得很多时,可能导致较慢的收敛速度。
5、请比较前馈型神经网络与反馈型神经网络的异同点。
(8分)
答:前馈型神经网络只表达输入输出之间的映射关系,实现非线性映射;反馈型神经网络考虑输入输出之间在时间上的延迟,需要用动态方程来描述,反馈型神经网络是一个非线性动力学系统。
(1)前馈型神经网络的学习训练主要采用BP算法,计算过程和收敛速度比较慢;反馈型神经网络的学习主要采用Hebb规则,一般情况下计算的收敛速度很快,并且它与电子电路有明显的对应关系,使得网络易于用硬件实现。
(2)前馈型神经网络学习训练的目的是快速收敛,一般用误差函数来判定其收敛程度;反馈型神经网络的学习目的是快速寻找到稳定点,一般用能量函数来判别是否趋于稳定点。
(3)两者都有局部极小问题。
6、BP算法的基本思想是什么,它存在哪些不足之处?(9分)
答:BP算法(即反向传播法)的基本思想是:学习过程由信号的正向传播与误差的反向传播两个过程组成。
1)正向传播:输入样本->输入层->各隐层(处理)->输出层
注1:若输出层实际输出与期望输出(教师信号)不符,则转入2)(误差反向传播过程)
2)误差反向传播:输出误差(某种形式)->隐层(逐层)->输入层
其主要目的是通过将输出误差反传,将误差分摊给各层所有单元,从而获得各层单元的误差信号,进而修正各单元的权值(其过程,是一个权值调整的过程)。
注2:权值调整的过程,也就是网络的学习训练过程(学习也就是这么的由来,权值调整)。
虽然BP算法得到广泛的应用,但它也存在自身的限制与不足,其主要表现在于它的训练过程的不确定上。
具体说明如下:
1)易形成局部极小(属贪婪算法,局部最优)而得不到全局最优;
BP算法可以使网络权值收敛到一个解,但它并不能保证所求为误差超平面的全局最小解,很可能是一个局部极小解。
2)训练次数多使得学习效率低下,收敛速度慢(需做大量运算);
对于一些复杂的问题,BP算法可能要进行几小时甚至更长的时间的训练。
这主要是由于学习速率太小所造成的。
可采用变化的学习速率或自适应的学习速率来加以改进。
3)隐节点的选取缺乏理论支持;
4)训练时学习新样本有遗忘旧样本趋势
7、请描述结构风险最小化原则(SRM)的思想,并给出其数学表达式。
答:传统机器学习中的经验风险最小化(ERM)原则在有限样本情况下是不合理的。
需要同时最小化经验风险和置信界限。
统计学习理论提出了一种新的策略,即把函数集构造为一个函数子集序列,使各个子集按照VC维的大小(亦即θ的大小)排列:在每个子集中寻找最小经验风险,在子集间折衷考虑经验风险和置信界限,取得实际风险的最小,如下图所示。
这种思想称作结构风险最小化准则,即SRM准则。
结构风险最小化原则的数学表达式如下式所示:
式中R(w)为实际风险,R
emp (w)为经验风险,h是函数集的VC维,n是样本数。
n
h
n
h
w
R
w
R
emp
)
4
/
ln(
) 1
)
/
2
(ln(
)
(
)
(
η
-
+
+≤
结构风险最小化原理图
三、推导题(共一题,计19分)
1、给定图1所示的具有一个隐含层的BP简化网络图,请给出BP算法的完整推导步骤。
答:
1、信息的正向传递
1)隐含层中第i个神经元的输出为:
(1)2)输出层第k个神经元的输出为:
(2)3)定义误差函数为:
(3)2、利用梯度下降法求权值变化及误差的反向传播
(1)输出层的权值变化
对从第i个输入到第k个输出的权值有:
(4)其中:
(5)(6)同理可得:
(7)
(2)隐含层权值变化
对从第j个输入到第i个输出的权值,有:
(8)其中:(9)
同理可得:(10)。