当前位置:文档之家› 基于数据挖掘技术的红酒评分预测模型的设计与分析

基于数据挖掘技术的红酒评分预测模型的设计与分析

基于数据挖掘技术的红酒评分预测模型的设计与分析
基于数据挖掘技术的红酒评分预测模型的设计与分析

基于数据挖掘技术的红酒评分预测模型的设计与分析

作者:王柏

来源:《现代商贸工业》2019年第07期

摘要:随着现代社会的快速发展,红酒行业已慢慢走向全球化与大众化,更多的红酒品牌和品种也逐渐被世人所知。然而,红酒品质也分三六九等,如何判断一款红酒是优是劣?利用SPSS,Excel等软件,使用回归、决策树、聚类等经典机器学习算法,对红酒的价格、评分、产地等因素进行统计与分析。最终得出红酒的原产国,省份以及品种基本可以决定红酒的优劣。

关键词:红酒;数据挖掘;机器学习

中图分类号:TB文献标识码:Adoi:10.19311/https://www.doczj.com/doc/998444701.html,ki.1672-3198.2019.07.100

1前言

红酒,是一种有着漫长历史的饮品。早在公元前1000年,红酒就在地中海沿岸大部分地区繁衍传播,并逐漸发展成为高档饮品。在全世界的基督教信徒的眼中,红酒被视为耶稣的血液,这一点也促进了红酒的平民化。红酒不仅仅给人以高雅和浪漫的感觉,在很多女性心中还有美容驻颜的功效,随着时间的推移,社会也在快速发展,人们生活水平逐步提升,红酒市场目前拥有着巨大的发展潜力和良好的发展前景,红酒也将逐渐走向全球化与大众化,让越来越多的人有机会去品尝。

近年来,越来越多的人更加讲究红酒的品质,传统红酒的品鉴,要考虑红酒的香气、口感、结构、酿造工艺、风土和价格等综合因素。但这些复杂的品鉴技术需要积年累月的品酒经验,对于大多数普通人来说,学习这门技术并不容易。因此,人们对于红酒的品质界定十分地模糊,并不清楚哪些红酒档次较高,而哪些红酒档次相对较低。为了帮助人们通过更简单直接的方法去了解红酒的品质,本文根据Kaggle网站上Wine Reviews专题提供的129970组数据,使用决策树,聚类等经典机器学习算法,分析数据规律,建立了根据红酒产地、品种、制造商等因素预测红酒品质的模型;并探索了影响红酒档次的最主要因素。该模型可以为喜欢红酒的人们提供参考,从而使他们对于红酒品质有着更加清晰的认识。

2数据介绍和预处理

本文使用的Wine Reviews数据集的原始出处是WineEnthusiast网站上不同国家用户对众多红酒的评论。本数据集主要包含了129970款红酒的产地国(Country)、省份(Province)、

相关主题
文本预览
相关文档 最新文档