iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >Hadoop监控分析工具Dr.Elephant
  • 366
分享到

Hadoop监控分析工具Dr.Elephant

2024-04-02 19:04:59 366人浏览 八月长安
摘要

公司基础架构这边想提取慢作业和获悉资源浪费的情况,所以装个dr elephant看看。LinkIn开源的系统,可以对基于yarn的mr和spark作业进行性能分析和调优建议。DRE大部分基于java开发,s

公司基础架构这边想提取慢作业和获悉资源浪费的情况,所以装个dr elephant看看。LinkIn开源的系统,可以对基于yarn的mr和spark作业进行性能分析和调优建议。


DRE大部分基于java开发,spark监控部分使用Scala开发,使用play堆栈式框架。这是一个类似python里面Django的框架,基于java?scala?没太细了解,直接下来就能用,需要java1.8以上。


prerequest list:

Java 1.8

PlayFramework+activator

nodejs+npm

scala+sbt


编译服务器是设立在美国硅谷的某云主机,之前为了bigtop已经装好了java,Maven,ant,scala,sbt等编译工具,所以下载activator解压放到/usr/local并加入PATH即可。


然后从 GitHub clone一份dr-elephant下来,打开compile.conf,修改hadoop和spark版本为当前使用版本,:wq保存退出,运行compile.sh进行编译,经过短暂的等待之后,因为美国服务器,下依赖快。会有个dist文件夹,里面会打包一个dr-elephant-2.0.x.zip,拷出来解压缩就可以用了。


DRE本身需要Mysql 5.5以上支持,或者mariadb最新的10.1稳定版本亦可。这里会有一个问题,就是在DRE/conf/evolutions/default/1.sql里面的这三行:

create index yarn_app_result_i4 on yarn_app_result (flow_exec_id);
create index yarn_app_result_i5 on yarn_app_result (job_def_id);
create index yarn_app_result_i6 on yarn_app_result (flow_def_id);

由于在某些数据库情况下,索引长度会超过数据库本身的限制,所以,需要修改索引长度来避免无法启动的情况发生。

create index yarn_app_result_i4 on yarn_app_result (flow_exec_id(150));
create index yarn_app_result_i5 on yarn_app_result (job_def_id(150));
create index yarn_app_result_i6 on yarn_app_result (flow_def_id(150));

然后就应该没啥问题了。


到数据库里创建一个叫drelephant的数据库,并给出相关访问权限用户


接下来是需要配置DRE:

打开app-conf/elephant.conf

# Play application server port
# 启动dre后play框架监听的WEB端口
port=8080
# Database configuration
# 数据库主机,用户名密码库名
db_url=localhost
db_name=drelephant
db_user="root"
db_passWord=

其他默认即可,不需更改


然后是GeneralConf.xml

<configuration>
  <property>
    <name>drelephant.analysis.thread.count</name>
    <value>3</value>
    <description>Number of threads to analyze the completed jobs</description>
  </property>
  <property>
    <name>drelephant.analysis.fetch.interval</name>
    <value>60000</value>
    <description>Interval between fetches in milliseconds</description>
  </property>
  <property>
    <name>drelephant.analysis.retry.interval</name>
    <value>60000</value>
    <description>Interval between retries in milliseconds</description>
  </property>
  <property>
    <name>drelephant.application.search.match.partial</name>
    <value>true</value>
    <description>If this property is "false", search will only make exact matches</description>
  </property>
</configuration>

修改drelephant.analysis.thread.count,默认是3,建议修改到10,3的话从jobhistoryserver读取的速度太慢,高于10的话又读取的太快,会对jobhistoryserver造成很大压力。下面两个一个是读取的时间周期,一个是重试读取的间隔时间周期。


然后到bin下执行start.sh启动。And then, show smile to the yellow elephant。


装完看了一下这个东西,其实本身原理并不复杂,就是读取各种jmx,metrics,日志信息,自己写一个也不是没有可能。功能主要是把作业信息里的内容汇总放到一屏里面显示,省的在JHS的页面里一个一个点了。


Hadoop监控分析工具Dr.Elephant


Hadoop监控分析工具Dr.Elephant


That's it, so easy


您可能感兴趣的文档:

--结束END--

本文标题: Hadoop监控分析工具Dr.Elephant

本文链接: https://www.lsjlt.com/news/39755.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Java内存泄露监控工具以及JVM监控工具的实例分析
    Java内存泄露监控工具以及JVM监控工具的实例分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。jstack -- 如果java程序崩溃生成core文件,jstack工具...
    99+
    2023-06-17
  • UAVStack中JVM监控分析工具怎么用
    这篇文章主要为大家展示了“UAVStack中JVM监控分析工具怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“UAVStack中JVM监控分析工具怎么用”这篇文章吧。引言作为AllInOne...
    99+
    2023-06-04
  • Windows 2003自带性能监控工具的使用分析
    本篇文章为大家展示了Windows 2003自带性能监控工具的使用分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。前几天有一台备库在累积了多日的REDO后,进行REDO APPLY时,整个系统变得...
    99+
    2023-06-06
  • 网络监控工具ntopng
    网络监控工具ntopng...
    99+
    2023-06-04
  • linux监控工具有哪些
    常见的linux监控工具有:1.dstat,系统监控工具;2.pidstat,系统资源监控工具;3.Netstat,TCP/IP网络监控工具;4.iotop,磁盘操作监控工具;5.Saidar,CLI系统数据监控和统计工具;6.top,性能...
    99+
    2024-04-02
  • Linux 流量监控工具 iftop
    iftop 可以用来监控网卡的实时流量(可以指定网段)、反向解析ip、显示端口信息等。直接运行[root@yoon ~]# iftopiftop 界面相关说明界面上面显示的是类似刻度尺的刻度范围,为显示流量图形的长条作标尺用的.中间的<...
    99+
    2023-06-05
  • redis监控工具之redis-live
    介绍 监控redis的一款工具 安装(linux下) yum install python-devel 安装 setuptools 1) wget http://p...
    99+
    2024-04-02
  • ​性能监控工具集合
    性能监控工具集合性能监控工具集合(vmstat,dstat,htop,top,iotop,sar,iostat,iftop,netlog,glances,lm_sersors)一.vmstatvmstat 虚拟内存工具vmstat 刷新时间...
    99+
    2023-06-05
  • Centos7部署nmon监控工具
    Nmon是一款计算机性能系统监控工具,因为它免费,体积小,安装简单,耗费资源低,广泛应用于AIX和Linux系统上传软件包...
    99+
    2023-06-05
  • ganglia监控hadoop集群的配置文件问题分析
    这篇文章主要介绍“ganglia监控hadoop集群的配置文件问题分析”,在日常操作中,相信很多人在ganglia监控hadoop集群的配置文件问题分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”gangl...
    99+
    2023-06-03
  • mongoDB的监控工具怎么用
    mongoDB的监控工具怎么用,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。mongostatmongostat捕捉并返回各种...
    99+
    2024-04-02
  • 什么是监控工具Linux iotop
    这期内容当中小编将会给大家带来有关什么是监控工具Linux iotop,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。iotop的简介:iotop是一款开源、免费的用来监控磁盘I/O使用状况的类似top命令...
    99+
    2023-06-15
  • Linux监控工具Glances怎么用
    这篇文章主要介绍了Linux监控工具Glances怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。Glances 是一个由 Python 编写,使用 psutil 库来从...
    99+
    2023-06-27
  • RedisLive监控工具如何安装
    这篇文章给大家分享的是有关RedisLive监控工具如何安装的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。 1.安装python2.7.5 和piphttp://blog.itpub.net/30089851/v...
    99+
    2023-06-03
  • PHP中的性能监控工具
    近年来,随着互联网技术的发展,PHP作为一种广泛使用的开发语言,受到越来越多开发者和企业的青睐。然而,PHP性能问题也随之而来,会直接影响网站的稳定性和用户访问体验。为了保证PHP的高效运行,性能监控工具成为必不可少的一部分。一、性能监控的...
    99+
    2023-05-23
    PHP 性能监控 工具
  • Python+PyQt5自制监控小工具
    本篇文章通过使用python实现对计算机摄像头的调用从而实现摄像监控的功能。 利用opencv的图像处理功能可以轻松对计算机摄像头的调用实现实时图像的采集效果。 最终将图片进行保存后...
    99+
    2023-03-19
    Python PyQt5监控工具 Python PyQt5监控 Python 监控 Python PyQt5
  • MySQL监控工具orzdba怎么用
    这篇文章给大家分享的是有关MySQL监控工具orzdba怎么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。[root@hank-yoon servers]# chmod +x ...
    99+
    2024-04-02
  • Linux中有哪些监控磁盘分区的工具
    这期内容当中小编将会给大家带来有关Linux中有哪些监控磁盘分区的工具,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。什么是Linux系统Linux是一种免费使用和自由传播的类UNIX操作系统,是一个基于P...
    99+
    2023-06-07
  • 数据库监控工具--PIGOSSBSM运维监控管理系统
    数据就是一切,各类数据在企业生产经营中都起着至关重要的作用,是所有的经营活动所依赖的,不可或缺的信息。数据就犹如企业经营者的眼睛一样,通过数据可以反映出所有的问题,就犹如舵手依赖导航一样。现在每个企业和组织发展都需要依赖大量的数据,数据也成...
    99+
    2023-06-04
  • ASP 健康监控的革命:自动化和监控工具
    自动化的力量 传统上,健康监控是一个繁琐的手动过程,需要开发人员手动检查指标和事件日志。然而,自动化工具可以简化这一过程,通过自动执行以下任务: 定期监控关键指标(例如 CPU 使用率、内存消耗) 检测异常模式和阈值违规情况 生成警报...
    99+
    2024-02-28
    ASP.NET、健康监控、自动化、监控工具
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作