大数据常见面试题
- 格式:pdf
- 大小:294.79 KB
- 文档页数:2
大数据常见面试题
万事俱备只欠东风,大数据技术已经学到手,接下来就是该面对找工作了的难题了,虽说大数据人才急缺,很好找工作,但如果你想找到一份自己满意的工作还是要下功夫的。自然一套新版的大数据面试题是必不可少的,正所谓知己知彼,百战不殆!千锋小编节选了千锋讲师刚刚总结出来的大数据常见面试题,欢迎各位小伙伴自行下载。
1、hdfs存储机制
1)client端发送写文件请求,namenode检查文件是否存在,如果已存在,直接返回错误信息,否则,发送给client一些可用namenode节点
2)client将文件分块,并行存储到不同节点上datanode上,发送完成后,client 同时发送信息给namenode和datanode
3)namenode收到的client信息后,发送确信信息给datanode
4)datanode同时收到namenode和datanode的确认信息后,提交写操作。
2、用mr设计一个分组排重计数算法
输入文件格式:二级域名,一级频道,二级频道,访问ip地址,访问者id
需求:按照二级域名,一级频道,二级频道分组,计算pageview数,计算独立ip数和独立访问者id数。
3、Linkedlist和ArrayList的区别
ArrayList是使用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢。LinkedList使用双向链表实现存储,按序号索引数据需要进行前向或后向遍历,但是插入数据时只需要记录本项的前后项即可,所以插入速度较快。
4、http安全问题
1)重要信息:MD5,AES加密
2)不太重要的数据:用签名
3)登录态:
5、linux的启动顺序
通电后读取ROM的BIOS程序进行硬件自检,自检成功后把计算机控制权交给BIOS中BOOTsequence中的下一个有效设备,读取该设备MBR找到操作系统,载入linux的bootloader,一般是grub。之后载入kernel,执行/etc/rc.d/sysinit ,开启其他组件(/etc/modules.conf),执行运行级别,执行/etc/rc.d/rc.local ,执行/bin/login,末后shell启动。
更多更全的千锋大数据面试题尽在千锋教育官网,而且是免费领取哦!小编在这里只是抛砖引玉,更多干货等你自己来挖掘。