2025年12月10日来源:信管网 作者:cnitpm
★学习要求:记住Hadoop生态系统的三部分组成,了解每个部分的功能、特点;记住大数据应用内容,了解常用技术工具
★考察方向:
1.Hadoop生态系统的三部分是哪些?
2.大数据应用包括哪些?
3.HDFS、MapReduce、Yarn的功能及忧缺点是什么?
★可能难以理解的点
●对于非专业考生来说,可能这些名词都比较陌生,所以有可能都比较难理解
☛考点讲解:
这个知识点大家关键要记住4个点:
1.Hadoop是一个能够对大量数据进行分布式处理的软件框架,其特点为:可靠、高效、可伸缩。
2.Hadoop2.0 主要由三部分组成:HDFS、MapReduce 、Yarn,它们分别管存储、管计算、管资源。
3.大数据应用,一般包括:数据采集、数据存储、数据计算和数据展现与交互。
4.HDFS优点:具有高容错性、适合大数据批处理、可构建在廉价机器上等,缺点:不支持低延迟数据访问、小文件存取、并发写入、文件随机修改。
其他的常见的开源日志采集系统、分布式文件系统、非关系型数据库、分布式计算框架、数据可视化工具,这些大家可以了解下,当然能记住是最好的。
温馨提示:因考试政策、内容不断变化与调整,信管网提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准!