金秋十月跳槽季 ——数据分析行业10个常见面试题(附答案及代码)
- 格式:docx
- 大小:2.34 MB
- 文档页数:12
“金秋十月,尽情挥洒”,国庆节又快要到了,各大企业招聘旺季还在如火如荼地进行着,
期盼了好久的7天国庆长假,你是不是打算来场说走就走的旅行,在这之前,也勇敢地进行
了一次说走就走的辞职,想给自己全新的开始。想进入或转行到大数据或数据分析领域的朋
友们,戳进来好好看看,2018年大数据&数据分析行业的面试机密吧,我亲自为你解答!
为了帮助更多即将进入数据分析行列或大数据领域的朋友找到更好更适合自己的工作,CDA数据分析研究院分享了一份2018年10个常见大数据&数据分析面试题合集,既有基本
的业务分析面试题,也有高阶数据挖掘算法试题,更有分析工具应用试题来指导你准备面试,试题均附有答案。
Q1:说明数据分析挖掘的基本流程。
1) 定义问题,获取数据
2) 数据存储和提取,结合相关业务知识理解数据
3) 数据清洗,整合与检查数据,缺失值和异常值处理
4) 数据预处理,特征工程
5) 数据建模与分析
6) 数据可视化
Q2:说明相关分析、回归分析的联系和区别。
A2:联系:二者都是对变量之间不严格依存关系的分析,在理论基础和方法上具有一致性。只有存在相关关系的变量才能进行回归分析,相关程度越高,回归分析的结果越可靠。
区别:相关分析研究的是变量之间的依存关系,这些变量的地位相等,不区分主从因素或
因果关系。回归分析却是在控制或给定一个(或多个)变量条件下来观察对应的某一变量的
变化,给定的变量为自变量,被观察的变量为因变量。因此回归分析中必须根据研究目的来
确定自变量和因变量。
相关关系主要测定的是变量之间关系的密切程度,回归分析则着重于变量之间的具体变量
关系,通过建立回归模型,控制或给定自变量进行估计和预测。
Q3:分别简述基于内容推荐算法和基于用户的协同过滤推荐算法的原理。
A3:基于内容推荐算法:基于物品或内容的特征,发现物品之间的相似性,然后基于用户以前的喜好记录推荐给用户相似的物品。本质是对物品或内容进行分析建立特征,基于用户
对什么特征的内容感兴趣以及分析一个物品具备什么特征来做推荐。不考虑用户之间的关系,只关注物品本身的特征,根据Item获得与之特征相似的Item进行推荐。简单来说就是根据
用户之前喜欢的物品,通过对特征的匹配分析,预测用户的喜好。
基于用户的协同过滤推荐算法:寻找与目标用户有相同喜好的邻居,然后根据邻居的喜好
向目标用户进行推荐。基本原理就是利用用户访问行为的相似性来推荐用户可能感兴趣的资源。根据用户-物品的评分矩阵,计算用户的相似度,根据相似用户的喜好进行推荐。主要关
注User与Item之间的关联,与具体Item本身的特征没有关系,基于相似用户会喜欢相似物
品的假设进行推荐。简单来说就是根据和某一用户有相似喜好的其他用户的喜好,从而预测
该用户对物品的可能喜好。
差别在于:协同过滤必须要有用户行为,基于内容的推荐不考虑用户行为。冷启动阶段只
能用基于内容的推荐,因为没有用户行为数据,积累一段时间用户行为数据后才可以使用协
同过滤。
从用途上来说,协同过滤适合给用户带点新鲜感的使用场景,如“逛”淘宝的用户;而基于
内容推荐更适合用户焦点比较集中的使用场景,如垂直领域的内容推送。
Q1-Q3主要考察应聘者对数据分析方法、流程和算法的理解及应用能力。
Q4:A员工12月份总绩效得分为90分,已知:总绩效得分在60分以下时,绩效工资为0元,60-80分时,绩效工资为80元,80-100分时,绩效工资为100元。请用Excel函数判断A员
工的绩效工资。
A4:=IF(A<60,0,IF(A<80,80,100))
Q5:列出你知道的Excel函数,并简要介绍使用方法。
A5:Excel常用的函数有:SUM求和函数、AVERAGE求平均值函数,COUNT计数函数、IF逻辑判断函数、NOW日期时间的无参函数、VLOOKUP查找引用函数,ISNUMBER判断
是否为数字函数,SUMIFS多条件求和函数等等。
Q4、Q5主要考察业务数据分析师使用Excel处理轻量数据进行业务分析的能力。
Q6:用SQL删除表A中字段B=“b”的重复记录。
A6:delete from A where B in (select B from A having count(B)>1 and B=’b’);
Q7:现有两张表,A表:id,学号,姓名,年龄。B表:学号,语文,数学。用SQL查找语
文和数学分数都大于80的同学姓名。
A7:select 姓名 from A where 学号 in (select 学号 from B where 语文>80 and 数学>80);
Q6、Q7主要考察SQL语法,应聘者对数据库的基本操作能力。
Q8:用Python实现以下程序:检测用户输入的手机号码是否合法。
A8:
import datetime
#encoding:utf-8
#这是一个用来检测用户输入手机号码是否合法的小脚本。
def phonecheck(s):
#号码前缀,如果运营商启用新的号段,只需要在此列表将新的号段加上即可。phoneprefix=['130','131','132','133','134','135','136','137','138','139','150','151','152','153','156','158','1 59','170','183','182','185','186','188','189']
#检测号码是否长度是否合法。
if len(s) != 11:
return("The length of phonenum is 11.")
else: