当前位置:文档之家› 大数据面试题规律总结

大数据面试题规律总结

大数据面试题规律总结
大数据面试题规律总结

关于Java的面试题:关于虚拟机的面试题:

1.hashmap底层?

2.Java进程中断怎么处理?

3.介绍下面向对象?

4.介绍下多态?

5.方法重载和重写?

6.这俩哪个属于多态?

7.说下多线程?

8.实现方式有哪些,区别?

9.同步锁互斥,为什么常量不能做锁?

10.说下反射,都是做什么的?

11.反射机制怎么实现的?

12.linkedlist和arraylist的区别?

13.hashMap的存储机制和存取过程?

14.java的多线程?

15.java的流处理?

16.socket编程?

17.hibernate的原理,干啥的?

18.服务器之间如何通信?

19.定时器如何写?

20. Hashmap hashset treemap 区别

21.什么是hashMap?

22. 常用标签html?

23.Spring 控制反转依赖注入,AOP 及其用途?

24.java 中怎么解决多线程问题有几种方式,他们之间的不同?

25.Hashtale hashmap currenthashtable 区别?

26.Jvm 机制以及OOM发生的情况简述一下?

27.Java 数组反转实现?

28.Java 序列化 SqenceFile 并说明你的序列化方式和适用场景?

29.Hashmap怎么实现,与tremap的区别?

30.Java中问到常问的new String()问题到底是创建几个对象,StringBuffer和StringBuilder 区别?

31.java反射比较多怎么优化处理?

32. java 集合set list map 原理区别如何选择?

33.jvm调优?

34.线程同步?

35.web service生命周期?

36.对spring的理解?

37.java7新特性?

38.java实现上述功能,在TB级别数据情况下,实现方案?

39.java实现取出两个文件中共有的数据?

40.做一个排序(java伪代码)?

41.常用的jqury框架,比如jqury的表单校验框架?

42.单例?

43.LinkdList和ArrayList的区别?

44.http传输的时候是明文的,怎么解决安全问题?

45.垃圾回收机制?

46.java内存模型?

47.java内存模型?

48.java垃圾回收机制?

49.object中有哪些方法?

50.ArrayList中Array的长度超了是怎么增加的,一次增加多少?

51.java多线程?

52.java中的集合?

53.垃圾回收机制?

54.java中的排序算法?

55.会不会SSH框架?

56.线程池怎么实现?

57.Java内存错误中的一个错误,问我如何解决。?

58.Callable和Runable的区别?

59.在线项目的bug如何调试?

60.进程和线程的区别,线程如何配置??

关于设计模式的面试题:

1. 设计模式?

2.说说常用的设计模式,我说了个单例,他好像觉得太简单了,我又说了个策略模式?

关于数据结构和算法的面试题:

1.再一次提起数据结构和算法

2.算法和数据结构--要求,是基本的?

3.一个数组,如a=[1,2,3,4,1,2],把元素出现两次的保留,最后得到a=[1,2];最后要写几个测试case。

这个问题我先用一个循环,map统计次数,让后再循环。当出现两次的元素,踢掉。

一个字符串,如何查询是否含有某一个子字符串,如果有返回索引,不能用api的函数

4.PageRank怎么实现?

5.算法中O(n)一定比O(lg(n))性能差吗?为什么?有那些因素需要考虑?

算法中O(n)一定比O(lg(n))性能差吗?为什么?有那些因素需要考虑

6.出了个题让我现场搞一下,一个文件里有两个字段分别是IP和time,ip可以通过写好的函数转换成省份,让我实时统计每一分钟的PV,UV,注意PV,UV是累加的,不是一分钟的数据,可以根据省份去查询PV,UV。

7. 对一个字符串进行全排列?

8.用户文件2个属性10万行,课程文件2个属性2万行,日志文件1个属性很大,这些属性可以任意的组合查询,每秒的请求数是10000个,请如何最快的方式查询出数据??9. 给你2个字符串,字符串最后一个字符可以循环到最前面,只要一个字符串中每一个字符在另一个字符串都有就是相等的,请用你的方法比较是否相等?

10.一个100G文件,里面每一个行都是一个ip,怎么写单机程序找出出现次数最多的前100个IP?

11.写个二分查找?

12.写程序找出两个字符串中出现的共同字母?

中国移动公司面试问题及回答

中国移动公司面试问题及回答 来源:时间:2014-12-24 1、移动面试题:您就是怎么知道我们招聘这个职位得呢? 如果您就是从公司内部某人处打听来得消息,记得提及她得名字,个人简历,公司不说偏袒内部关系不代表它不存在。 2、移动面试题:除了工资,还有什么福利最吸引您? 尽可能诚实,如果您做足了功课,您就知道她们会提供什么,回答尽可能与她们提供得相配.如果您觉得自己该得到更多,也可以多要一点. 3、移动面试题:您参加过什么业余活动? 既然最好就是让人觉得您处事不乏手腕,那么最好强调一下那些需要群体合作与领导才能得活动. 4 、移动面试题:您参加过义务活动吗? 现在就着手作一些义务活动,不仅仅就是那些对社会有贡献得,还要就是您得雇主会在意得,如果她们还没有一个这样得员工,那么您会成为很好得公关资源。 5、移动面试题:您心目中得英雄就是谁? 最好得答案就是您得朋友或家人,尽量避免说及名人或明星。 6、移动面试题:您有什么问题吗? 一定要提问。您必须回答”当然"。您要通过您得发问,了解更多关于这家公司、这次面试、这份工作得信息.假如您笑笑说"没有”(心里想着终于结束了,长长吐了口气)那才就是犯了一个大错误.这往往被理解为您对该公司、对这份工作没有太深厚得兴趣;其次,从最实际得考虑出发,您难道不想听话听音敲打一下考官,推断一下自己入围有几成希望? 7、移动面试题:您过去得上级就是个什么样得人? 别贬低过去得上司,提一下她得长处与不足。 8、移动面试题:您为什么还没找到合适得职位呢? 别怕告诉她们您可能会有得聘请,千万不要说”我上一次面试弄得一塌糊涂……"。指出这就是您第一次面试。 9、移动面试题:您最近瞧过得电影,或者小说就是什么? 找一些老少咸宜,真情感人得电影. 10、移动面试题:您得业余爱好就是什么? 找一些富于团体合作精神得。 1、如果问为什么要进移动对移动得瞧法与意见?要怎么回答? 我先给大家讲一个关于我得故事吧,N年前我有一个梦想,我可以在任何时间,地点,跟我想通电话得人通电话,就是中国移动帮我完成了这个梦想,现在我想让更多跟我有共同梦想得人享受移动带给我得便利,所以我选择进入移动,中国移动就是世界500强企业,所以有先进得企业经营理念与浓厚得企业文化,如果能在中国移动工作对我个人能力得提高就是非常有帮助得,对于移动而言,您们又多了一个求上进得员工,永葆发展得活力。

最全大数据程序员面试题库

最全大数据程序员面试题库 大数据开发面试题库,千锋讲师总结了很多,经过总结学生在面试中遇到的问题,还有讲师多年的经验精心编制。就是要宠千锋学生到底,不仅教授你专业的大数据技术,更要让你从容的面对面试官,在众多的竞争者中脱颖而出。 好了,废话不多说,直接上题库。。。。。。 1.scala 语言有什么特点,什么是函数式编程?有什么优点 2.scala 伴生对象有什么作用 3.scala 并发编程是怎么弄得,你对actor 模型怎么理解有何优点 4.scala case class 有什么重要 5.scala akka 框架有没有接触过,有什么重要 6.scala 为什么设计var 和val 7.SDD,DAG,Stage怎么理解? 8.宽依赖窄依赖怎么理解? 9.Stage是基于什么原理分割task的? 10.血统的概念

11.任务的概念 12.容错方法 13.粗粒度和细粒度 14.Spark优越性 15.Spark为什么快 16.Transformation和action是什么?区别?举几个常用方法 17.SDD怎么理解 18.spark 作业提交流程是怎么样的,client和cluster 有什么区别,各有什么作用 19.spark on yarn 作业执行流程,yarn-client 和yarn cluster 有什么区别 20.spark streamning 工作流程是怎么样的,和storm 比有什么区别 21.spark sql 你使用过没有,在哪个项目里面使用的 22.spark 机器学习和spark 图计算接触过没,,能举例说明你用它做过什么吗? 23.spark sdd 是怎么容错的,基本原理是什么? 大数据时代,中国IT环境也将面临重新洗牌,不仅仅是企业,更是程序员们转型可遇而不可求的机遇。随着互联网时代的迅猛发展,大数据全面融入了现代社会的生产、生活中,并将大大改变全球的经济。大数据,它其实不仅仅是一种技术,更是战略资源。 千锋不仅仅注重学生的专业技能培训,还注重学生的素质培养,开班第一天起,每节课的课前十分钟分享,锻炼学员的沟通表达能力,在工作中减少沟通成

大数据工程师面试题

大数据工程师面试题 大数据工程师面试,对于很多人来说应该都不陌生了吧,虽说大数据就业前景很好,但想要成功进入名企,并不是一件容易的事情,不仅仅需要专业的技能,还需要你在面试的时候认真准备一下。面试的时候,我们会遇到各种各样的问题,千锋讲师今天就先讲解一下面试经常会遇到的问题,Hadoop是如何工作的? Hadoop是一个分布式文件系统(Hadoop Distributed File System),简称HDFS。Hadoop是一个能够对大量数据进行分布式处理的软件框架,以一种可靠、高效、可伸缩的方式进行数据处理。所以说Hadoop解决了大数据如何存储的问题,因而在大数据培训机构中是必须学习的课程,也是面试中面试官非常注重的一个技术点。 Hadoop是如何工作的? Hadoop是从Google文件系统发源而来,并且他是一个用Java开发的跨平台的应用。核心组件有: Hadoop Common,拥有其他模块所依赖的库和基础

工具,Hadoop分布式文件系统(HDFS),负责存储,Hadoop YARN,管理计算资源,和Hadoop MapReduce,负责处理的过程。 Hadoop把文件拆成小块并且把他们分发给集群中的节点。然后,它使用打包的代码分发到节点上并行处理数据。这意味着可以处理数据的速度会比使用传统的体系结构的更快。 一个典型的Hadoop集群都会有主节点和从节点或者叫工作节点。主节点有一个任务跟踪器,任务调度,名字节点和数据节点组成。从节点通常作为一个数据节点和任务调度器,不过特殊的场景下程序可能只有数据节点然后在其他的从节点进行处理计算。 在大的Hadoop集群中,通常会使用一个专用的名字节点来管理HDFS节点的文件系统索引信息,这防止了文件系统的数据丢失和损坏。 千锋教育拥有一支的强师队伍,在教学研究方面,我们老师不断的推陈出新,探索更新的教学方式,结合时代所需不断更新课程大纲,加强学生对于知识的理解和运用。千锋讲师对于大数据行业时刻保持一定的敏感性和前瞻性,定期与各大企业的技术官交流分析,掌握大数据的发展动向,不仅仅可以帮助同学们更好的学习大数据技术,还会预测一些大数据工程师面试题,为同学们的就业之路披荆斩棘。 关键词:大数据工程师面试题

最新中国移动面试题

中国移动面试题

中国移动面试题总结 中国移动笔试题面试题 1、TCP/IP有几层,都是什么? 4层,应用层、传输层、网络层、数据链路层 应用层—应用层是所有用户所面向的应用程序的统称。ICP/IP协议族在这一层面有着很多协议来支持不同的应用,许多大家所熟悉的基于Internet的应用的实现就离不开这些协议。如我们进行万维网(WWW)访问用到了HTTP协议、文件传输用FTP协议、电子邮件发送用SMTP、域名的解析用DNS协议、远程登录用Telnet协议等等,都是属于TCP/IP应用层的;就用户而言,看到的是由一个个软件所构筑的大多为图形化的操作界面,而实际后台运行的便是上述协议。 * 传输层—这一层的的功能主要是提供应用程序间的通信,TCP/IP协议族在这一层的协议有TCP和UDP。 * 网络层—是TCP/IP协议族中非常关键的一层,主要定义了IP地址格式,从而能够使得不同应用类型的数据在Internet上通畅地传输,IP协议就是一个网络层协议。 * 网络接口层—这是TCP/IP软件的最低层,负责接收IP数据包并通过网络发送之,或者从网络上接收物理帧,抽出IP数据报,交给IP层。 2、3G都有哪几种标准? W-CDMA:即Wideband CDMA,也称为CDMA Direct Spread,意为宽频分码多重存取,其支持者主要是以GSM系统为主的欧洲厂商,日本公司也或多或少参与其中,包括欧美的爱立信、阿尔卡特、诺基亚、朗讯、北电,以及日本的NTT、富士通、夏普等厂商。这套系统能够架设在现有的GSM网络上,对于系统提供商而言可以较轻易地过渡,而GSM系统相当普及的亚洲对这套新技术的接受度预料会相当高。因此W-CDMA具有先天的市场优势。mscbsc 移动通信论坛拥有30万通信专业人员,超过50万份GSM/3G等通信技术资料,是国内领先专注于通信技术和通信人生活的社区。4R;L"@9F9{ CDMA2000:CDMA2000也称为CDMA Multi-Carrier,由美国高通北美公司为主导提出,摩托罗拉、Lucent和后来加入的韩国三星都有参与,韩国现在成为该标准的主导者。这套系统是从窄频CDMA One 数字标准衍生出来的,可以从原有的CDMA One结构直接升级到3G,建设成本低廉。但目前使用CDMA 的地区只有日、韩和北美,所以CDMA2000的支持者不如W-CDMA多。不过CDMA2000的研发技术却是目前各标准中进度最快的,许多3G手机已经率先面世。 TD-SCDMA:该标准是由中国大陆独自制定的3G标准,1999年6月29日,中国原邮电部电信科学

应届生进入大数据领域面试题大全

应届生进入大数据领域面试题大全 如今参加大数据培训学习大数据开发技术的小伙伴越来越多,因为现在就是大数据时代,所以想要加入到大数据领域的人越来越多,对于刚入门大数据领域的小伙伴来说,如果敲响企业的大门就很重要了,本篇文章小编给大家分享一下应届生进入大数据领域有哪些大数据面试题,对小伙伴感兴趣的小伙伴可以来了解一下哦。 1、频繁项集、频繁闭项集、最大频繁项集之间的关系是:(C) A、频繁项集频繁闭项集=最大频繁项集 B、频繁项集= 频繁闭项集最大频繁项集 C、频繁项集频繁闭项集最大频繁项集 D、频繁项集= 频繁闭项集= 最大频繁项集 2、考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含(C) A、1,2,3,4 B、1,2,3,5 C、1,2,4,5 D、1,3,4,5 3、在图集合中发现一组公共子结构,这样的任务称为( B ) A、频繁子集挖掘 B、频繁子图挖掘 C、频繁数据项挖掘

D、频繁模式挖掘 4、下面选项中t不是s的子序列的是( C ) A、s=<{2,4},{3,5,6},{8}> t=<{2},{3,6},{8}> B、s=<{2,4},{3,5,6},{8}> t=<{2},{8}> C、s=<{1,2},{3,4}> t=<{1},{2}> D、s=<{2,4},{2,4}> t=<{2},{4}> 5、下列__(A)__不是将主观信息加入到模式发现任务中的方法。 A、与同一时期其他数据对比 B、可视化 C、基于模板的方法 D、主观兴趣度量 6、下列度量不具有反演性的是(D) A、系数 B、几率 C、Cohen度量 D、兴趣因子 7、以下哪些算法是分类算法,(B) A,DBSCAN

大数据面试题试卷

大数据面试题及答案 汇总版

第1部分选择题 1.1 Hadoop选择题 1.1.1 HDFS 1.下面哪个程序负责 HDFS 数据存储?A.NameNode B.Jobtracker C.Datanode D.secondaryNameNode E.tasktracker 2. HDFS 中的 block 默认保存几份? A.3份 B.2份 C.1份 D.4份 3. 下列哪个程序通常与NameNode 在一个节点启动? A. SecondaryNameNode B.DataNode C.TaskTracker D. Jobtracker 4. HDFS 默认 Block Size(新版本)

A. 32MB B.64MB C.128MB D.256MB 5. Client 端上传文件的时候下列哪项正确 A. 数据经过 NameNode 传递给 DataNode B.Client端将文件切分为Block,依次上传 C.Client 只上传数据到一台DataNode,然后由 NameNode 负责Block 复制工作 6. 下面与 HDFS 类似的框架是? A.NTFS B.FAT32 C.GFS D.EXT3 7. 的 8. 的 1.1.2 集群管理 1. 下列哪项通常是集群的最主要瓶颈 A. CPU B.网络 C.磁盘IO

D.存 2. 关于SecondaryNameNode 哪项是正确的? A.它是 NameNode 的热备 B.它对存没有要求 C.它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间 D.SecondaryNameNode 应与 NameNode 部署到一个节点 3. 下列哪项不可以作为集群的管理? A. Puppet B.Pdsh C.ClouderaManager D.Zookeeper 4. 配置机架感知的下面哪项正确 A. 如果一个机架出问题,不会影响数据读写 B.写入数据的时候会写到不同机架的 DataNode 中 C.MapReduce 会根据机架获取离自己比较近的网络数据 5. 下列哪个是 Hadoop 运行的模式 A. 单机版B.伪分布式C.分布式 6. Cloudera 提供哪几种安装 CDH 的方法 A. Cloudera manager B.Tarball C.Yum D.Rpm 7. 1.2 Hbase选择题 1.2.1 Hbase基础

大数据hadoop面试题-企业项目实战

大数据hadoop面试题-企业项目实战 大数据技术逐渐被企业所重视,其带来的益处其实是可以被无限放大的,要知道,现在的市场都是,得数据者得天下!而数据的获得还是要靠大数据技术的,Hadoop作为大数据技术的一个重要技术点,在面试大数据工程师的时候是肯定要被问及的,千锋小编整理一些关于大数据Hadoop的面试题,预祝每一位大数据工程师都能找到自己理想的工作。 1、在Hadoop中定义的主要公用InputFormat中,默认是哪一个?(A) A、TextInputFormat B、KeyValueInputFormat C、SequenceFileInputFormat 2、下面哪个程序负责HDFS 数据存储?(C) https://www.doczj.com/doc/e77576284.html,Node B.JobTracker C.DataNode

D.SecondaryNameNode E.tasktracker 3、HDFS 中的block 默认保存几份?(A) A.3 份 B.2 份 C.1 份 D.不确定 4、下列哪个程序通常与NameNode 在一个节点启动?(D) A.SecondaryNameNode B.DataNode C.TaskTracker D.JobTracker 解析:hadoop的集群是基于master/slave模式,namenode和jobtracker 属于master,datanode和tasktracker属于slave,master只有一个,而slave 有多个. SecondaryNameNode内存需求和NameNode在一个数量级上,所以通常secondary NameNode(运行在单独的物理机器上)和NameNode 运行在不同的机器上。 JobTracker对应于NameNode,TaskTracker对应于DataNode. DataNode和NameNode是针对数据存放来而言的.JobTracker和TaskTracker是对于MapReduce执行而言的. mapreduce中几个主要概念,mapreduce 整体上可以分为这么几条执行

面试题目

一·主观题 1.你认为app测试过程中,相对于web,要更多注意哪些测试点?或者说app测试和 web测试有哪些不同之处? 答:1、“点击加载更多”的分页处理技术,是否有重复的数据,数据显示是否完整,到达最后一页后是否还有数据进行显示; 2、数据的排序方式; 2、界面跳转是否正确; 3、出现异常情况是否有提示,是否跳转到已经设定好的默认页面,如断网情况下,显示网络未连接,数据加载失败,或者如果此页面没有数据显示,显示友好提示信息; 4、图片处理的地方,是否容易出现程序崩溃现象,主要是图片压缩机制; 5、前台展示的数据,后台进行变动(增、删、改),是否是实时更新还是app一开始运行再进行加载; 6、前台主动发出请求,后台数据库中是否存在相应的数据同时包括数据的关联性(商家的会员进行下订单,数据库中生成一条订单的记录的同时,生成一条积分记录,该会员的积分进行相应的变化); 7、手机app网络环境测试重点:主要是针对2G、3G、4G、wifi三种网络环境进行测试; 8、手机app兼容性测试:主要是针对android各个系统版本进行测试,及测试屏幕分辨率进行测试; 2.请说明 Android手机和oS手机,系统有什么区别? 答:安卓是开源的,苹果ios是闭源的 1、两者运行机制不同:IOS采用的是沙盒运行机制,安卓采用的是虚拟机运行机制。 2、两者后台制度不同:IOS中任何第三方程序都不能在后台运行;安卓中任何程序都能在后台运行,直到没有内存才会关闭。 3、IOS中用于UI指令权限最高,安卓中数据处理指令权限最高。 3.请试着说明一下黑盒测试,白盒测试,单元测试,集成测试,系统测试,验收测试的区别和联系 答:黑盒测试:把测试对象当成一个黑盒子,测试人员完全不考虑逻辑结构和内部特性,只依据程式的需求说明书来检查程式的功能是否满足它的功能说明。 白盒测试:把测试对象当成一个透明的盒子,允许测试人员利用程序内部逻辑结构 及相关信息,设计或选择测试用例,对程式所有逻辑路径进行测试。 单元测试:白盒测试的一种,对软件设计中的单元模块进行测试。 集成测试:在单元测试的基础上,对单元模块之间的连接和组装进行测试。 系统测试:在所有都考虑的情况下,对系统进行测试。 验收测试:第三方进行的确认软件满足需求的测试。 4.你认为性能测试工作的目的是什么?做好性能测试工作的关键是什么 答:性能测试的目的--- 1)评估系统的能力----测试中得到的负荷和响应时间数据可被用于验证所计划的模型的能力,并帮助作出决策。 2)识别体系中的弱点----受控的负荷被增加到一个极端水平,并突破它,从而修复体系的

中国移动面试题

中国移动面试题总结 1、TCP/IP有几层,都是什么? 4层, 2、3G都有哪几种标准? 3、对移动通信的各个部分有多少的了解? 4、你对运行商怎么选择3G的看法? 5、介绍一下自己的家庭、教育背景、研究经验等等 6、对传输层协议的研究或看法(TCP、UDP有许多的改进协议的,随便谈谈即可) TCP、UDP协议的区别? 7、谈谈自己的长处? 8、什么是CDMA? 9、A TM的帧头格式? 10、精通什么? 11、TTL/CMOS之类 12、SDH的基本知识(STM-1、B1?) 13、快速排序,二分查找,双向链表的删除节点 14、最得意的项目的详细介绍,其中自己使用的关键技术等 15、EJB分为哪几种?(J2EE中的) 16、做过数据库设计,那你们是通过什么方式访问数据库的?你是怎么做数据库设计的? 17、ISO9000分为哪几个? 总结: 1、考官一般不会问你简历上说自己精通的东东,反而对你略微提到的进行深究,呵呵,

大家要小心哟 2、对于每个问题不一定要回答的特别完整丰满,呵呵只要提到关键点就行了。比如数据 库设计共享访问的问题,当我提到锁的概念时,gg就不让我说了。 3、对于感觉不会的问题但是在相关方面又有一点了解,可以先呗活你了解的那些,指不 定呗活呗活着答案就出来了,呵呵,偶就有好几个这种情况。 18、TCP如何保证可靠性? 19、CDMA和GSM比较的优缺点? 20、解释计算机网络中的冲突域和广播域。 21、CDMA的频段? 22—27题“>”后面的是另一种答法 22、你认为将来移动互联网的盈利点在什么上? 当然是聊天和游戏了 > 当然是聊天和游戏了? 我觉得是针对客户定制的内容提供服务……,聊天游戏,目前互联网的吧,和移动商务没什么关系。即使是现在,各大网站赢利最多的,第一无线业务(主要是短信)第二广告第三游戏,聊天就好比眼球经济,算不得赢利点。 23、你认为QQ如何推广它的业务? 我认为只有靠广告 >无线业务现在最大啊,拇指经济已经取代眼球经济了,还可以做搜索,搜索力经济发展很猛,客户定制,细分市场,移动的M -Zone就是这样,针对会员提供不同的更丰富的服务,目前180万会员,就是每个月收会员费,也得1800万啊,还不包括游戏广告QQ秀,当然应该努力发展会员了。 24、你如何看待你在甲方到乙方的角色的转变? 去哪里都从基层坐起,没关系。 25、你认为如何摆正QQ在移动和联通的业务关系?

大数据常见面试题

大数据常见面试题 经历了水深火热的大数据学习,终于拨开云雾见天明了,但你离成功总是还差了一步,那就是拿到大数据工程师的Offer。 在电脑旁奋斗了无数个日夜,代码敲了无数遍,项目整改了无数遍,只为了得到一份自己满意的高薪资高待遇的Offer。但这个收获不仅仅需要你学到娴熟的大数据技术,还需要在面试之前精心准备,了解自己要应聘的企业发展状况、自己应聘岗位的技术要求等等,除此之外,多看一些大数据面试题也是很有必要的,给自己涨涨经验。 千锋小编虽然不能帮你调查你理想企业的发展状况,但大数据常见面试题早已经为你准备好了,需要的尽快收入囊中吧! 1.scala 语言有什么特点,什么是函数式编程?有什么优点 2.scala 伴生对象有什么作用 3.scala 并发编程是怎么弄得,你对actor 模型怎么理解有何优点 4.Spark如何处理结构化数据,Spark如何处理非结构话数据? 5.Spark性能优化主要有哪些手段?

6.对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里? 7.对于算法是否进行过自主的研究设计? 8.简要描述你了解的一些数据挖掘算法与内容 9.怎么用spark做数据清洗 10.跟我聊聊spark的应用,商场里广告投放,以及黄牛检测 11.spark读取数据,是几个Partition呢?hdfs几个block 就有几个Partition? 12.Mogodb和hbase的区别 13.开发中遇到的问题 14.HIVE的优化 15.linux的启动顺序 16.编译好的scala程序,运行时还需要scala环境吗 17.Write a java program to implement Stack in java. 18.Linkedlist和ArrayList的区别 19.hadoop中combiner的作用 20.用mr设计一个分组排重计数算法 21.用MapReduce找出存在公共好友的两个人 22.hdfs存储机制 23.MapReduce原理 24.hadoop运行原理 25.hadoop 的namenode 宕机,怎么解决 26.Hbase 的特性,以及你怎么去设计rowkey 和columnFamily ,怎么去

手机销售面试试题

面试入门知识 一:单项选择题每题6分一共60分 1:td-scdma是哪个运营商的牌照 A:中国移动B:中国联通C:中国电信D:中国铁通2:WCDMA是哪个运营商的牌照 A:中国移动B:中国联通C:中国电信D:中国铁通3:CDMA2000-EVDO是哪个运营商的牌照 A:中国联通B:中国铁通C:中国移动D:中国电信4:苹果手机的操作系统简称是 A:ANDROID B:MAC OSX C:IOS D:WP7 5:苹果手机ITUNES下载的安装文件后缀名是 A:NDSL B:SIS C:APK D:IPA 6:安卓操作系统最新版本是多少 A:2.3.4 B: 2.3.5 C:2.3.6 D:4.0 7 苹果手机操作系统的最新版本是 A:4.0 B:4.3.5 C:5.0 D:10 8:安卓手机的软件后缀名是 A:PSP B:SIS C:APK D:IPA 9:IPHONE4 的屏幕分辨率是多大 A:854*480 B:960*480 C:800*480 D:320*480 10:IPHONE4 的CPU型号是 A:MSM8255 B:OMAP3430 C:A4 D:tegra2 二:判断题每题4分一共40分 1:三星I9108是移动定制机() 2:三星I9000是移动定制机() 3:iphone4是td-scdma的制式() 4:iphone4手机安装软件可以用豌豆夹安装() 5:如果没有数据线豌豆夹就不能给安卓手机装软件() 6:带导航的手机不用连接手机网络就能精确定位() 7:安卓2.2固件能吧软件安装到内存卡上() 8 :IPHONE手机可以支持MP3铃声() 9:IPHONE不能播放RMVB格式的视频() 10:电脑里下好的软件可以直接拷到苹果手机里进行安装()

大数据技术Hadoop面试题

大数据技术Hadoop面试题,看看你能答对多少? 单项选择题 1. 下面哪个程序负责HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 中的block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 3. 下列哪个程序通常与NameNode 在一个节点启动? a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker 4. Hadoop 作者 a)Martin Fowler b)Kent Beck c)Doug cutting 5. HDFS 默认Block Size a)32MB b)64MB c)128MB 6. 下列哪项通常是集群的最主要瓶颈 a)CPU b)网络 c)磁盘 d)内存 7. 关于SecondaryNameNode 哪项是正确的? a)它是NameNode 的热备 b)它对内存没有要求 c)它的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间 d)SecondaryNameNode 应与NameNode 部署到一个节点 多选题: 8. 下列哪项可以作为集群的管理工具 a)Puppet b)Pdsh c)Cloudera Manager d)d)Zookeeper

9. 配置机架感知的下面哪项正确 a)如果一个机架出问题,不会影响数据读写 b)写入数据的时候会写到不同机架的DataNode 中 c)MapReduce 会根据机架获取离自己比较近的网络数据 10. Client 端上传文件的时候下列哪项正确 a)数据经过NameNode 传递给DataNode b)Client 端将文件切分为Block,依次上传 c)Client 只上传数据到一台DataNode,然后由NameNode 负责Block 复制工作 11. 下列哪个是Hadoop 运行的模式 a)单机版 b)伪分布式 c)分布式 12. Cloudera 提供哪几种安装CDH 的方法 a)Cloudera manager b)Tar ball c)Yum d)Rpm 判断题: 13. Ganglia 不仅可以进行监控,也可以进行告警。() 14. Block Size 是不可以修改的。() 15. Nagios 不可以监控Hadoop 集群,因为它不提供Hadoop 支持。() 16. 如果NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。() 17. Cloudera CDH 是需要付费使用的。() 18. Hadoop 是Java 开发的,所以MapReduce 只支持Java 语言编写。() 19. Hadoop 支持数据的随机读写。() 20. NameNode 负责管理metadata,client 端每次读写请求,它都会从磁盘中读取或则会写入metadata 信息并反馈client 端。() 21. NameNode 本地磁盘保存了Block 的位置信息。() 22. DataNode 通过长连接与NameNode 保持通信。() 23. Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。() 24. Slave 节点要存储数据,所以它的磁盘越大越好。() 25. hadoop dfsadmin –report 命令用于检测HDFS 损坏块。() 26. Hadoop 默认调度器策略为FIFO() 27. 集群内每个节点都应该配RAID,这样避免单磁盘损坏,影响整个节点运行。() 28. 因为HDFS 有多个副本,所以NameNode 是不存在单点问题的。() 29. 每个map 槽就是一个线程。() 30. Mapreduce 的input split 就是一个block。() 31. NameNode 的Web UI 端口是50030,它通过jetty 启动的Web 服务。() 32. Hadoop 环境变量中的HADOOP_HEAPSIZE 用于设置所有Hadoop 守护线程的内存。它默认是200 GB。() 33. DataNode 首次加入cluster 的时候,如果log 中报告不兼容文件版本,那需要NameNode执行“Hadoop namenode -format”操作格式化磁盘。() 【编辑推荐】 没有数据分析大数据什么也不是...... 大数据告诉你,真正的白富美的生活是怎样的呢?

大数据面试题

1、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为)中。这样每个小文件的大约为300M。 s 遍历文件b,采取和a相同的方式将url分别存储到1000个小文件(记为)。这样处理后,所有可能相同的url都在对应的小文件()中,不对应的小文件不可能有相同的url。然后我们只要求出1000对小文件中相同的url即可。s 求每对小文件中相同的url时,可以把其中一个小文件的url存储到hash_set中。然后遍历另一个小文件的每个url,看其是否在刚才构建的hash_set中,如果是,那么就是共同的url,存到文件里面就可以了。 方案2:如果允许有一定的错误率,可以使用Bloom filter,4G内存大概可以表示340亿bit。将其中一个文件中的url使用Bloom filter映射为这340亿bit,然后挨个读取另外一个文件的url,检查是否与Bloom filter,如果是,那么该url应该是共同的url(注意会有一定的错误率)。2、有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。 方案1: s、顺序读取10个文件,按照hash(query)的结果将query写入到另外10个文件(记为)中。这样新生成的文件每个的大小大约也1G(假设hash函数是随机的)。s、找一台内存在2G左右的机器,依次对用hash_map(query, query_count)

大数据工程师笔试题

链表排序 Java: class Node{ Int value; Node next; } C++: struct Node{ int nValue; Node* pNext; } 请实现如下函数对任意给定链表按照其中的value字段排序 Java: Node sortList(Node head); C++: Node* sortList(Node* pHead); 解答: 编写归并排序迭代器 java: class MergeIterator implements Iterator{ Public MergeIterator(Iterator a,Iterator b){} Public boolean hasNext(){} Public Integer next(){} } 测试用例: Class MockIterator implements Iterator{ Int current,step,endValue; Public MockIterator(int step,int endValue){ this.step=step; This.endValue=endValue; This.current=endValue%step; } Public boolean hasNext(){return this.current < this.endValue;} Public Integer next(){return this.current += this.step;} } Iterator it=new MergeIterator(new MockIterator(2,10),new MockIterator(2,9)); //输出2 3 4 5 6 7 8 9 10 C++: Struct Iterator{ Virtual bool hasNext()=0; Virtual int next()=0;

中国移动公司面试问题及回答讲解学习

中国移动公司面试问题及回答 来源:https://www.doczj.com/doc/e77576284.html, 时间:2014-12-24 1、移动面试题:你是怎么知道我们招聘这个职位的呢? 如果你是从公司内部某人处打听来的消息,记得提及他的名字,个人简历,公司不说偏袒内部关系不代表它不存在。 2、移动面试题:除了工资,还有什么福利最吸引你? 尽可能诚实,如果你做足了功课,你就知道他们会提供什么,回答尽可能和他们提供的相配。如果你觉得自己该得到更多,也可以多要一点。 3、移动面试题:你参加过什么业余活动? 既然最好是让人觉得你处事不乏手腕,那么最好强调一下那些需要群体合作和领导才能的活动。 4 、移动面试题:你参加过义务活动吗? 现在就着手作一些义务活动,不仅仅是那些对社会有贡献的,还要是你的雇主会在意的,如果他们还没有一个这样的员工,那么你会成为很好的公关资源。 5、移动面试题:你心目中的英雄是谁? 最好的答案是你的朋友或家人,尽量避免说及名人或明星。 6、移动面试题:你有什么问题吗? 一定要提问。你必须回答"当然"。你要通过你的发问,了解更多关于这家公司、这次面试、这份工作的信息。假如你笑笑说"没有"(心里想着终于结束了,长长吐了口气)那才是犯了一个大错误。这往往被理解为你对该公司、对这份工作没有太深厚的兴趣;其次,从最实际的考虑出发,你难道不想听话听音敲打一下考官,推断一下自己入围有几成希望? 7、移动面试题:你过去的上级是个什么样的人? 别贬低过去的上司,提一下他的长处和不足。 8、移动面试题:你为什么还没找到合适的职位呢? 别怕告诉他们你可能会有的聘请,千万不要说"我上一次面试弄得一塌糊涂……"。指出这是你第一次面试。 9、移动面试题:你最近看过的电影,或者小说是什么? 找一些老少咸宜,真情感人的电影。 10、移动面试题:你的业余爱好是什么? 找一些富于团体合作精神的。

大数据面试题剖析讲课稿

单项选择题 1. 下面哪个程序负责 HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 中的 block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 3. 下列哪个程序通常与 NameNode 在一个节点启动? a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker

4. Hadoop 作者 a)Martin Fowler b)Kent Beck c)Doug cutting 5. HDFS 默认 Block Size a)32MB b)64MB c)128MB 6. 下列哪项通常是集群的最主要瓶颈 a)CPU b)网络 c)磁盘 d)内存 7. 关于 SecondaryNameNode 哪项是正确的? a)它是 NameNode 的热备 b)它对内存没有要求

c)它的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间 d)SecondaryNameNode 应与 NameNode 部署到一个节点 多选题 8. 下列哪项可以作为集群的管理工具 a)Puppet b)Pdsh c)Cloudera Manager d)d)Zookeeper 9. 配置机架感知的下面哪项正确 a)如果一个机架出问题,不会影响数据读写 b)写入数据的时候会写到不同机架的 DataNode 中 c)MapReduce 会根据机架获取离自己比较近的网络数据 10. Client 端上传文件的时候下列哪项正确 a)数据经过 NameNode 传递给 DataNode b)Client 端将文件切分为 Block,依次上传

大数据面试

大数据面试:面对众多的offer,该如何选择 大数据的就业前景,相信就不用小编多赘述了吧,从千锋大数据培训班毕业的学生平均每个人都能拿到2到3个大数据岗位的offer,由此可见,各大企业对于大数据技术人才的渴求真的是求贤若渴!那面对众多企业向我们抛来的橄榄枝,我们该如何选择呢? 首先先解决大家都比较困惑两点,一是薪资问题,二如何选择公司。 一、薪资问题 其实对于刚毕业几年的大学生来说,不要太看重薪资,除非薪资的差距是在数量级间的差距,如果只是几千块的差距这个不算差距,现在的工资并不代表你未来的工资,学会投资自己看未来,成长性好的员工未来的收益差距是在数量级,比如几年后,同学A的薪水比另外一个同学B的薪水高上百万都是非常正常的。 其次要学会比较薪水。收到Offer时,首先要知道薪酬福利的组成,比如月薪,年终奖,期权,商业保险,补贴等。不要单纯的比较月薪,而是综合比较年薪和福利。A同学月薪比B低几千,但是A同学年薪和福利加在一起可能比B同学高好几倍。除了期权外,福利上主要关注以下几点:(1)公积金,等你买房或

退休的时候可以取出来,这个我认为可以算在薪水里;(2)补贴,不同的公司补贴不一样,大致有住房补贴,异地补贴,汽油补贴,餐补等。另外补贴有个期限,是一年还是几年,这个也要问清楚。(3)商业保险,过节费等。 二、如何选择公司 我自己也经历过几个不同类型的公司,小型私企,大型私企,大型国企,互联网企业。从我的经历来看,如果你想学技术可以选择互联网公司,外企和创业公司,如果你想做管理,可以选择创业公司和中大型私企。 我总结了一下各种类型公司的状态,仅供参考: 三、其他问题 1、某某公司的招聘我是否应该参加? 如果有时间尽量参加,好处很多,第一拿到offer越多选择就多,也有和想去的公司谈offer的资本。其次是参加了一些面试也能意识到自己的不足,比如先去意愿不强的企业面试,发现自己的不足后回来复习,再继续面试。 2、选择大公司还是小公司?

过来人:移动面试经验

过来人:移动面试经验 移动面试经验一: 今天正装从[被过滤]西门出发,一路堵车,将近半个小时才到达翠宫饭店,和我走路速度差不多。负责接待的都是学生,好像是北邮的。所以溜须拍马的功夫可以先省下来。有个专门等候面试的房间,可以用来填表格。耐心等待之后,就轮到我了。 市场综合类初面在811,里面有一个ssgg和ppmm,比较nice。人很好,很有亲和力,和他们交流很互动,可以放松展现自己的特点。其间ssgg会问你所学课程,然后挑出这些课程的细致知识考查。这两个hr和我们年纪相差不大,just take it easy,and show yourself! Everything will be ok! 最后,他会告知你在门外等两分钟。他们在里面打分,这个时候你千万不要离开,多等一会儿。当时我一出门,就想回去,幸好想起有东西遗留在等候室,回去拿。当我再次经过811 时,hrjj急匆匆地追上来:“你怎么跑的这么快,我还以为你不想二面了呢!”把资料交还交还给我,最后增加了一页他们内部评判的表格,上面写着评语“敢于社会实践,头脑灵活,善于表达,但个子较矮:(”。然后就去836等待二面了。 836是完全是另外一种风格,很压抑。里面三个cool man 是典型的国企领导。外表冷峻,不苟言笑,问问题很刁钻。根本没有交流和互动,就是施加压力让你出错。最后我扛不住了,当他闻到“你对深圳移动感觉很好,好在什么地方呢?”我汗颜,只说:“整个移动都好,深圳地方也好:(”他似乎很不满意,555555555555 最后,他通知我等消息。本来有两分钟写评语给分数的时间,但是可能我表现不好,直接pass了,我出门不到十秒,他就通知下一个进去了。为什么别人都是两分钟我却只有10秒?5555555,这就代表over了。

阿里巴巴Oracle-DBA笔试题及答案

一:SQL tuning 类 1:列举几种表连接方式 hash join/merge join/nest loop(cluster join)/index join 2:不借助第三方工具,怎样查看sql的执行计划 set autot on explain plan set statement_id = &item_id for &sql; select * from table(dbms_xplan.display); https://www.doczj.com/doc/e77576284.html,/docs/cd/B14117_01/server.101/b10752/ex_plan.htm 3:如何使用CBO,CBO与RULE的区别 在optimizer_mode=choose时,如果表有统计信息(分区表外),优化器将选择CBO,否则选RBO。 RBO遵循简单的分级方法学,使用15种级别要点,当接收到查询,优化器将评估使用到的要点数目, 然后选择最佳级别(最少的数量)的执行路径来运行查询。 CBO尝试找到最低成本的访问数据的方法,为了最大的吞吐量或最快的初始响应时间,计算 使用不同 的执行计划的成本,并选择成本最低的一个,关于表的数据内容的统计被用于确定执行计划。 4:如何定位重要(消耗资源多)的SQL select sql_text from v$sql where disk_reads > 1000 or (executions > 0 and buffer_gets/executions > 30000); 5:如何跟踪某个session的SQL exec dbms_system.set_sql_trace_in_session(sid,serial#,&sql_trace); select sid,serial# from v$session where sid = (select sid from v$mystat where rownum = 1); exec dbms_system.set_ev(&sid,&serial#,&event_10046,&level_12,''); 6:SQL调整最关注的是什么 查看该SQL的response time(db block gets/consistent gets/physical reads/sorts (disk)) 7:说说你对索引的认识(索引的结构、对dml影响、为什么提高查询性能) b-tree index/bitmap index/function index/patitional index(local/global) 索引通常能提高select/update/delete的性能,会降低insert的速度, 8:使用索引查询一定能提高查询的性能吗?为什么 索引就是为了提高查询性能而存在的,

相关主题
文本预览
相关文档 最新文档