MTTR vs. 平均故障间隔与. MTTD vs. MTTF故障度量

Entuity软件


乔丹麦克弗森-全球网络和十大赌博正规老平台器管理领导-大头照
约旦麦克弗森 2022年5月9日

你会在半夜被手机铃声吵醒. 屏幕显示是凌晨1点37分,CTO正在打电话. 你的网络宕机了,夜间工作人员还没找到原因. 接下来的72小时是一阵旋风, 当眼前的大火被扑灭时, 你能否保住你的工作还没有定论.

防止网络停机 是A计划,但如果失败了,优化你的恢复程序就变得非常重要了. 可以使用不同的网络故障度量来度量事件响应,并在每次灾难发生时显示进展情况.

不同的组织将以不同的方式定义正常运行时间. 一个完全死亡的系统, 无法完成任何数量的操作, 传递不正确的信息或性能不佳都可以视为十大赌博正规老平台中断.

你可以 避免IT消防演习 如上文所述,当您使用Entuity软件™时,多供应商, 企业网络监控软件 这简化了管理、监控和分析网络数据的过程. 整合网络警报,重新控制你的时间!

衡量正常运行时间最流行的方法是通过系统可用性. 该指标被认为是网络专业人员的主要行业标准之一,本文将使用该指标, 但基本前提也适用于其他形式的十大赌博正规老平台故障.

女技术员解决MTTF vs. 平均故障间隔与. mttr

所有这些指标都创建为 意思是平均水平 -集中趋势由所有测量值的总和除以数据集中的观测值的数量表示. 这种计算的结果通常以小时或数千小时为单位进行测量, 所以数字越小越好. 这些可用于跟踪kpi, 通知sla或维护合同,并在报告和分析中解释结果.

以下是相关术语的快速词汇表:

您将希望减少MTTR, MTTD并增加平均故障间隔和MTTF,这可以通过以下方式实现 IT硬件监控 以及对预防性维护过程的周到规划.

什么是平均时间恢复(MTTR)?

平均恢复时间是指发生故障后恢复系统所需的平均时间. 修复和恢复伴随着系统中断和故障. 在快速发展的IT行业, 了解一件设备的修理速度是至关重要的. 您的事件响应时间将反映您的团队的表现, 你的组织和企业的盈利能力.

如何计算MTTR

对于单个组件, 我们只关心从停电开始到系统正常运行的时间. 正确操作所花费的时间不包括在内. 诊断时间包括在计算中,但不包括订购零件的交货时间或供应链/采购等待时间.

其目的是返回中断首次被发现和恢复运行之间的度量. 这可能会改变 数据中心硬件维护 因此,澄清不同的组织如何解释什么是“MTTR”是很重要的.

下面是一些例子:

  • 一个资产恰好失败了一次, 故障立即被发现并报告, 现场技术人员在24小时内修复了故障设备. MTTR是24小时.
  • 资产失败, 停电, 和ISP故障都发生在三小时内, 每次系统故障都能及时报告,并在3小时内通知当地技术人员第一时间修复故障系统, 第二次在4小时内,第三次在2小时内. MTTR是(3+4+2)/3 = 3小时.
  • 报告了由于过度拥塞导致的性能下降,但由于其他地方的操作问题,24小时内无法采取行动, 然后又花了24小时诊断出确切的问题,又花了24小时修复它. MTTR是72小时. 然后同样的问题继续存在,只需要12个小时就能解决. 然后MTTR将下降到(72+12)/2 = 42小时.

什么是平均故障间隔时间(平均故障间隔)?

平均故障间隔显示系统发生故障的频率,并可用于计算该系统的预期寿命.

如何计算平均故障间隔

而不是查看十大赌博正规老平台中断发生和恢复之间的时间, 我们查看十大赌博正规老平台的总运行(在线)小时数,并将这段时间除以十大赌博正规老平台宕机的次数.

这意味着在上面的最后一个例子中, 第一次复苏花了很长时间,在计算中没有那么重要. 例如, 一个系统可能已经运行了21年,被干扰了3次, 平均故障间隔是7,000小时.

MTTR vs. 平均故障间隔

在上面的例子中,您可以看到恢复如何从根本上改变每个指标. 平均故障间隔为10的十大赌博正规老平台,但24小时的MTTR可能与平均故障间隔为8的十大赌博正规老平台的价值不同,000小时,但MTTR是1小时. 一般来说,在考虑平均恢复时间和平均恢复时间时. 平均故障间隔时间, 第一个指标更重要,因为它代表了工程师将采取的行动,以减少停机时间和由于失去十大赌博正规老平台而导致的业务自付费用.

数据中心技术人员计算平均故障间隔 MTTR MTTF公式

什么是平均检测时间(MTTD)?

MTTD, 也称为平均确认时间,是您用来确定响应中断和通知的效率的度量. 越接近0越好. 这可以反映在单个组件上, 或者针对一个或多个数据中心中的整个十大赌博正规老平台.

如何计算MTTD

计算, 将事件检测时间(以分钟为单位)的总和除以给定时间段内的事件数量, 比如一年或一个月. 例如:有5个事件分别用了16分钟、21分钟、4分钟、8分钟和36分钟来检测. (16+21+4+8+36)/5 = 15min MTTD.

MTTR vs. 平均故障间隔与. MTTD

而高mtd和低平均故障间隔是采取纠正措施来解决十大赌博正规老平台差距的关键原因, 跟踪MTTR kpi仍然是最重要的.

什么是平均无故障时间(MTTF)?

平均故障时间是组织内整个资产系统的表示,以及其中一个系统发生故障所需的平均时间.

如何计算MTTF

为了计算这个, 将总操作小时数(正常运行时间)除以被监视的失败资产的数量. 在一个拥有20种资产的系统中.988%的正常运行时间超过一年,由于3次中断,MTTF将是2,919.66小时.

最大化正常运行时间与正确的网络监视器

你的网络需求是独特的,但正确的 网络故障管理软件 能帮你定制理想的警报系统吗. Entuity软件不会以分数形式运行, 点菜的能力,需要你拼凑出一个连贯的监控系统. 我们全面的网络监控软件帮助您设计事件, 为您独特的组织提供Syslog和trap管理,并最大限度地减少组件故障对业务的影响.

使用Entuity快速测量和响应网络故障-今天十大赌博平台排行榜安排演示!

乔丹麦克弗森-全球网络和十大赌博正规老平台器管理领导-大头照

作者简介

乔丹麦克弗森
Jordan负责指导Park Place的ParkView管理十大赌博正规老平台部门的全球网络和十大赌博正规老平台器管理产品. 他的职责包括与销售、市场营销、企业运营和R部门合作&D团队开发并向市场推广公园广场的世界级管理十大赌博正规老平台. 他拥有12年的全球规划经验, 监控, 及提供资讯科技十大赌博正规老平台, 包括在MSP IntelliNet被Park Place收购之前担任近10年的团队领导和战略应用开发人员. 乔丹是俄亥俄大学的毕业生.