大数据常见面试题

  • 格式:pdf
  • 大小:294.79 KB
  • 文档页数:2

下载文档原格式

  / 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据常见面试题

万事俱备只欠东风,大数据技术已经学到手,接下来就是该面对找工作了的难题了,虽说大数据人才急缺,很好找工作,但如果你想找到一份自己满意的工作还是要下功夫的。自然一套新版的大数据面试题是必不可少的,正所谓知己知彼,百战不殆!千锋小编节选了千锋讲师刚刚总结出来的大数据常见面试题,欢迎各位小伙伴自行下载。

1、hdfs存储机制

1)client端发送写文件请求,namenode检查文件是否存在,如果已存在,直接返回错误信息,否则,发送给client一些可用namenode节点

2)client将文件分块,并行存储到不同节点上datanode上,发送完成后,client 同时发送信息给namenode和datanode

3)namenode收到的client信息后,发送确信信息给datanode

4)datanode同时收到namenode和datanode的确认信息后,提交写操作。

2、用mr设计一个分组排重计数算法

输入文件格式:二级域名,一级频道,二级频道,访问ip地址,访问者id

需求:按照二级域名,一级频道,二级频道分组,计算pageview数,计算独立ip数和独立访问者id数。

3、Linkedlist和ArrayList的区别

ArrayList是使用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢。LinkedList使用双向链表实现存储,按序号索引数据需要进行前向或后向遍历,但是插入数据时只需要记录本项的前后项即可,所以插入速度较快。

4、http安全问题

1)重要信息:MD5,AES加密

2)不太重要的数据:用签名

3)登录态:

5、linux的启动顺序

通电后读取ROM的BIOS程序进行硬件自检,自检成功后把计算机控制权交给BIOS中BOOTsequence中的下一个有效设备,读取该设备MBR找到操作系统,载入linux的bootloader,一般是grub。之后载入kernel,执行/etc/rc.d/sysinit ,开启其他组件(/etc/modules.conf),执行运行级别,执行/etc/rc.d/rc.local ,执行/bin/login,末后shell启动。

更多更全的千锋大数据面试题尽在千锋教育官网,而且是免费领取哦!小编在这里只是抛砖引玉,更多干货等你自己来挖掘。