For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
想成为一名大数据工程师,首先你要会普通工程师会做的事!
经常有学员来东莞达内咨询,学习大数据要具备哪些技能才算学好了,才能满足企业的需求?
偶然认识的一个朋友,最开始是从事 Java 后端开发 的,后来他在业余时间自学成功转入大数据行业,现在是一名 大数据工程师 ,待遇也比之前好更多。前提是他是一名Java后端开发。
大数据是我们如今比较火的一个发展方向。但是大数据的起点要高,并不是所零基础就可以入门的。我们接下来讲述的有关大数据的学习是有条件限制的,首先你需要是一名普通的工程师,如果你是Java工程师的话更好,但如果你是小白的话,那就只能成为一名工程师的后再来学习大数据吧。
东莞达内跟你一起来认识认识大数据
大数据本质其实也是数据,不过也包括了些新的特征:
数据来源广;
数据格式多样化(结构化数据、非结构化数据、Excel文件等);
数据量大(最少也是TB级别的、甚至可能是PB级别);
数据增长速度快。
而针对以上新的特征需要考虑很多问题:
例如,数据来源广,该如何采集汇总?采集汇总之后,又该存储呢?数据存储之后,该如何通过运算转化成自己想要的结果呢?
对于这些问题,我们需要有相对应的知识解决
大数据一般所需的技能要求:
Java 语言: 大数据框架编写
Python 语言: 编写一些脚本时会用到。
Scala 语言: 编写Spark程序的最佳语言,当然也可以选择用Python。
Ozzie ,azkaban: 定时任务调度的工具。
Hue ,Zepplin: 图形化任务执行管理,结果查看工具。
Allluxio ,Kylin等: 通过对存储的数据进行预处理,加快运算速度的工具。
必须掌握的技能:
Java高级(虚拟机、并发)、Linux基本操作、Hadoop(HDFS+MapReduce+Yarn)、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming )、辅助小工具(Sqoop/Flume/Oozie/Hue等)
高阶技能6条:
机器学习算法以及mahout库加MLlib、R语言、Lambda 架构、Kappa架构、Kylin、Alluxio
总结
在技术行业里面,每天都会有新的东西出现,需要关注最新技术动态,不断学习。任何一般技术都是先学习理论,然后在实践中不断完善理论的过程。
如果你觉得自己看书效率太慢,你可以网上搜集一些课程。
快速学习的能力、解决问题的能力、沟通能力在这个行业是真的非常重要的指标。
要善于使用StackOverFlow和Google来帮助你学习过程遇到的问题。
以上是东莞达内对大数据学习的总结,当然我们也提到了,并不是说零基础的就可以直接学习,需要有编程的基础,我们需要先掌握扎实的编程基础,在此建议学习Java,成为一名工程师的时候,有一定编程经验,自学起来也相对比开始要简单一点,然后对大数据有兴趣或者想要进入这个行业的就可以去学习了,也可以咨询下东莞达内。