当前位置:首页 >知识 >Hadoop性能优化功能测试详解 欢迎大家一起来学习

Hadoop性能优化功能测试详解 欢迎大家一起来学习

2024-06-30 16:20:21 [百科] 来源:避面尹邢网

Hadoop性能优化功能测试详解

作者:hadoopstudy 开发 架构 Hadoop Hadoop性能你是性能详解否了解,这里就向大家介绍一下hadoop性能优化功能测试方面的优化内容,欢迎大家一起来学习,测试相信本文的性能详解介绍一定会让你受益。

本节向大家介绍一下hadoop性能优化功能测试方面的优化内容,在学习Hadoop的测试过程中,此类的性能详解问题你可能时常会遇到,在这里和大家分享一下,优化欢迎大家一起来学习hadoop性能优化的测试知识。

hadoop性能优化功能测试
以下是性能详解分别就配置了机架感知信息和没有配置机架感知信息的hadoopHDFS启动instance进行的数据上传时的测试结果。

Hadoop性能优化功能测试详解 欢迎大家一起来学习

写入数据

Hadoop性能优化功能测试详解 欢迎大家一起来学习

当没有配置机架信息时,优化所有的测试机器hadoop都默认在同一个默认的机架下,名为“/default-rack”,性能详解这种情况下,优化任何一台datanode机器,测试不管物理上是否属于同一个机架,都
会被认为是在同一个机架下,此时,就很容易出现之前提到的增添机架间网络负载的情况。例如,对没有机架信息的hadoopHDFS启动instance上传一个文件,其block信息如下:
从上图可以看出,在没有机架信息的情况下,namenode默认将所有的slaves机器全部默认为在/default-rack下,根据hadoop代码的分析也能知道哦啊,此时在写block时,三个
datanode机器的选择完全是随机的。

Hadoop性能优化功能测试详解 欢迎大家一起来学习

而hadoop性能优化功能测试时当配置了机架感知信息以后,hadoop在选择三个datanode时,就会进行相应的判断:

1.如果上传本机不是一个datanode,而是一个客户端,那么就从所有slave机器中随机选择一台datanode作为***个块的写入机器(datanode1)。
a)而此时如果上传机器本身就是一个datanode(例如mapreduce作业中task通过DFSClient向hdfs写入数据的时候),那么就将该datanode本身作为***个块写入机器(datanode1)

2.随后在datanode1所属的机架以外的另外的机架上,随机的选择一台,作为第二个block的写入datanode机器(datanode2)。

3.在写第三个block前,先判断是否前两个datanode是否是在同一个机架上,如果是在同一个机架,那么就尝试在另外一个机架上选择第三个datanode作为写入机器(datanode3)。
而如果datanode1和datanode2没有在同一个机架上,则在datanode2所在的机架上选择一台datanode作为datanode3。

4.得到3个datanode的列表以后,从namenode返回该列表到DFSClient之前,会在namenode端首先根据该写入客户端跟datanode列表中每个datanode之间的“距离”由近到远进行一
个排序。如果此时DFS写入端不是datanode,则选择datanode列表中的***个排在***位。客户端根据这个顺序有近到远的进行数据块的写入。在此,判断两个datanode之间“距
离”的算法就比较关键,hadoop目前实现如下,以两个表示datanode的对象DatanodeInfo(node1,node2)为例:
a)首先根据node1和node2对象分别得出两个datanode在整个hdfs集群中所处的层次。这里的层次概念需要解释一下:每个datanode在hdfs集群中所处的层次结构字符串是这样描述
的,假设hdfs的拓扑结构如下:

每个datanode都会对应自己在集群中的位置和层次,如node1的位置信息为“/rack1/datanode1”,那么它所处的层次就为2,其余类推。
b)得到两个node的层次后,会沿着每个node所处的拓朴树中的位置向上查找,如“/rack1/datanode1”的上一级就是“/rack1”,此时两个节点之间的距离加1,两个node分别同
上向上查找,直到找到共同的祖先节点位置,此时所得的距离数就用来代表两个节点之间的距离。所以,如上图所示,node1和node2之间的距离就为4.

5.当根据“距离”排好序的datanode节点列表返回给DFSClient以后,DFSClient便会创建BlockOutputStream,并想这次block写入pipeline中的***个节点(最近的节点)开始
写入block数据。

6.写完***个block以后,依次按照datanode列表中的次远的node进行写入,直到***一个block写入成功,DFSClient返回成功,该block写入操作结束。
通过以上策略,namenode在选择数据块的写入datanode列表时,就充分考虑到了将block副本分散在不同机架下,并同时尽量的避免了之前描述的网络多于开销。
对配置了机架信息的hadoopHDFS启动instance上传一个文件,其block信息如下:
从上图可以看出,在配置了机架信息的情况下,为了减少机架间的网络流量,namenode会将其中两个副本写在同一个机架上,并且为了尽量做到容错,会将第三个block写道另一
个机架上的datanode上。看一下hadoop性能优化功能测试如何读取数据。

读取数据

当对某个文件的某个block进行读取的时候,hadoop采取的策略也是一样:
1.首先得到这个block所在的datanode的列表,有几个副本数该列表就有几个datanode。
2.根据列表中datanode距离读取端的距离进行从小到大的排序:
a)首先查找本地是否存在该block的副本,如果存在,则将本地datanode作为***个读取该block的datanode
b)然后查找本地的同一个rack下是否有保存了该block副本的datanode
c)***如果都没有找到,或者读取数据的node本身不是datanode节点,则返回datanode列表的一个随机顺序。本节关于hadoop性能优化功能测试方面的内容介绍到这里。

【编辑推荐】

  1. Hadoop性能优化及配置如何实现?
  2. Hadoop集群与Hadoop性能优化
  3. 专家讲解 Hadoop:HBASE松散数据存储设计
  4. 两种模式运行Hadoop分布式并行程序
  5. Hadoop概念及其用法专家讲解
责任编辑:佚名 来源: csdn.net hadoop性能优化

(责任编辑:焦点)

    推荐文章
    • 清明假期酒店预订量同比增长4.5倍 哪些城市热度较高?

      清明假期酒店预订量同比增长4.5倍 哪些城市热度较高?清明节一般放假三天,部分特殊人员可能需要值班,所以在清明节期间或是无法外出游玩了。临近清明节期间,你打算去哪里游玩呢?目前数据指出,清明假期酒店预订量上升,同比增长4.5倍。去年清明节,由于需要做好疫 ...[详细]
    • AI大爆炸,你准备好了吗?

      AI大爆炸,你准备好了吗?来源:36氪2024必将成为AI应用元年,AI即将赋能万物。 ...[详细]
    • V观财报|康隆达年报造假等被罚300万元

      V观财报|康隆达年报造假等被罚300万元中新经纬1月30日电 康隆达30日披露,公司收到中国证监会《行政处罚决定书》(下称《决定书》),公司被责令改正,给予警告,并被罚300万元。康隆达公告截图《决定书》显示,经查明,康隆达等存在以下违法事 ...[详细]
    • 神奇“果冻”精准修复皮肤创面

      神奇“果冻”精准修复皮肤创面水凝胶“果冻”材料。■本报记者 王昊昊 通讯员 陶贤都 曹娇十几年前,当蚕丝蛋白、水凝胶等生物材料领域的很多研究还是“新奇状态”时,施李杨就对多学科交叉研究产生了浓厚兴趣。他的求学之路也颇为交叉——本 ...[详细]
    • 建行快贷利率6.3算高吗 减少贷款利息的技巧你知道哪些?

      建行快贷利率6.3算高吗 减少贷款利息的技巧你知道哪些?在打算办贷款的时候,大部分借款人第一想法就是要降低自己的贷款利息。但银行对于贷款利率的审批有一套自己的规章制度,在审批结果出来之前,谁也没有把握。建行快贷利率6.3算高吗?减少贷款利息的技巧大家要掌握 ...[详细]
    • 大乐透奖池滚存至8.67亿元

      大乐透奖池滚存至8.67亿元开出2注1427万元+8注792万元新快报讯 记者陆妍思报道 1月29日,体彩超级大乐透第24013期开奖,全国开出2注1427万元追加一等奖、8注792万元一等奖,开奖后奖池滚存至8.67亿元。大乐 ...[详细]
    • 可打印非虹彩轻量结构色墨水问世

      可打印非虹彩轻量结构色墨水问世    科技日报北京1月30日电 记者张佳欣)日本神户大学开发了一种新方法,可产生永不褪色的结构色,且不受限于视角,还能被打印出来。这种材料对环境和生物的影响很小,而且可以薄涂,有望显著改善传统涂料的 ...[详细]
    • 丰田汽车:2023年丰田汽车全球销量达到创纪录的1120万辆 增长7.2%

      丰田汽车:2023年丰田汽车全球销量达到创纪录的1120万辆 增长7.2%丰田汽车公布数据显示,包括子公司日野和大发在内,其2023年全球销量增长7.2%,达到创纪录的1120万辆。包括同名品牌和雷克萨斯品牌在内的丰田汽车销量达到1030万辆,也创下历史新高。其中,油电混合 ...[详细]
    • 云南省国资委印发《关于加快推进绿色国资建设的实施意见》 推进示范引领

      云南省国资委印发《关于加快推进绿色国资建设的实施意见》 推进示范引领为推动国资国企坚定不移走生态优先、绿色发展之路,以绿色国资建设助力国资国企高质量发展,云南省国资委印发《关于加快推进绿色国资建设的实施意见》(以下简称《意见》)。《意见》强调,全云南国资国企要全面践行 ...[详细]
    • 福建厦门打造海绵城市

      福建厦门打造海绵城市◎本报记者 符晓波 陈 瑜 都 芃 李梦一    抬眼是绿,俯首有花,远处是成群的白鹭……1月24日,记者在福建省厦门市马銮湾新城看到,这里环海湾岸线打造的新城市景观带生态多样、风景如画。    “这 ...[详细]
    热点阅读