0%

RPO(Recovery Point Objective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量,指灾难发生后,从IT系统宕机导致业务停顿之时开始,到IT系统恢复至可以支持各部门运作、恢复运营之时,此两点之间的时间段称为RTO,广道容灾备份系统RTO达到分钟级。

RTO(Recovery Time Objective):即恢复时间目标,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。

指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度,这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据。

RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。

img

系统选择

在选择容灾系统的构造时,还要建立多层次的广域网络故障切换机制。本地的高可用系统指在多个服务器运行一个或多种应用的情况下,应确保任意服务器出现任何故障时,其运行的应用不能中断,应用程序和系统应能迅速切换到其它服务器上运行,即本地系统集群和热备份。

整的应用容灾,既要包含本地系统的安全机制、远程的数据复制机制,还应具有广域网范围的远程故障切换能力和故障诊断能力。

也就是说,一旦故障发生,系统要有强大的故障诊断和切换策略制订机制,确保快速的反应和迅速的业务接管。实际上,广域网范围的高可用能力与本地系统的高可用能力应形成一个整体,实现多级的故障切换和恢复机制,确保系统在各个范围的可靠和安全。

手动解决

windows cmd->属性->选项->编辑选项

取消 快速编辑模式

cmd默认开启了“快速编辑模式”,只要当鼠标点击cmd任何区域时,就自动进入了编辑模式,之后的程序向控制台输入内容甚至后台的程序都会被阻塞。

我们在控制台里面回车或者右键鼠标后,自动退出了编辑模式。因此,控制又恢复输出内容,服务端又正常了。

选择快速编辑模式的时候,鼠标不小心点到cmd某个位置,都可能让正在运行的进程都卡住,直到按下回车后,会跳出一堆。

自动解决

拖动或点击CMD窗口造成程序阻塞,这是因为windows默认cmd窗口启用快速编辑模式,关闭即可。在bat文件中关闭cmd窗口的快速编辑模式,bat文件如下:

1
2
@echo off
reg add HKEY_CURRENT_USER\Console /v QuickEdit /t REG_DWORD /d 00000000 /f

通过示例和方法说明了解根本原因分析

要理解根本原因分析,最简单的方法是考虑常见问题。如果我们生病了并在工作时呕吐,我们会去看医生,让医生找出病根。如果我们的汽车抛锚了,我们会让汽修师找出问题的根本原因。如果我们的业务在某个地区的业绩超出或低于预期,我们会尝试找出原因。

在以上每个例子中,我们都可以通过简单的方法来应付表面的问题。如果不想在上班时呕吐,我们可以待在家中并准备好痰盂。如果要在私家车无法启动时外出,我们可以坐公交车,把坏车留在家中。但这些办法治标而不治本 — 需要治疗的肠胃感染或者需要维修的交流发电机得不到处理。要解决或分析一个问题,我们必须进行根本原因分析,找出确切的原因以及解决方法。

本文将定义根本原因分析,简要介绍常用技巧,演示模板方法,并提供一些示例。

好的。那什么是根本原因分析呢?

根本原因分析 (RCA) 指为了确定适合的解决方案而探查问题根本原因的过程。RCA 认为,与解决临时问题和被动应对相比,以系统化方式防范和解决基础问题可以让效果得到显著改善。

根本原因分析可以综合运用一系列原理、技巧和方法来找出某个事件或趋势的根本原因。RCA 可以透过表层的因果关系,显示流程或系统最初在哪个环节出现故障或造成问题。

目标和优势

根本原因分析的第一个目标是发现问题或事件的根本原因。

第二个目标是全面了解如何修复、弥补根本原因内的深层问题,以及如何吸取教训。

第三个目标是将从分析中获得的见解应用到实践中,从而以系统化方式预防各种问题,或者再次运用成功的做法。

分析的价值只能通过应用来体现,因此 RCA 的第三个目标十分重要。我们还可以通过 RCA 来修改核心流程或解决系统问题,从而避免将来可能出现的事故。举例来说,在橄榄球运动员出现脑震荡时,我们不仅仅要治疗症状,还可以通过根本原因分析来建议运动员佩戴头盔,减少再次出现脑震荡的风险。

对症治疗看起来非常有效。解决大量的问题会让人获得成就感。但如果不切实诊断出问题的根本原因,我们就可能一而再,再而三地遇到相同的问题。新闻编辑不仅仅要将每一个缺失的逗号补上,还需要对新闻作者进行培训,让他们知道如何在日后的新闻稿件中正确使用逗号,从而防止类似的问题。

核心原则

要有效进行根本原因分析,我们必须遵循几条核心原则,其中的一些原则是显而易见的。这些原则不仅有助于确保分析质量,还可以帮助分析师获得利益相关者、客户或患者的信任和支持。

  • 您的重点应该是针对根本原因进行纠正和弥补,而不是仅仅消除症状。
  • 但对症治疗可以在短期内缓解症状,您不应该忽视其重要性。
  • 您需要认识到,问题可能有多个根本原因,这种情况经常出现。
  • 专注于事情如何发生以及为何发生,而不是应该归咎于谁。
  • 应该讲究策略,找出实实在在的因果证据来支持自己的根本原因结论。
  • 提供充足的信息作为更正措施的依据。
  • 考虑如何在日后防范(或复制)根本原因。

以上原则表明:分析深层次的问题或原因时,我们必须采用从整体出发,采取全面的策略。我们不但要发现根本原因,还应该努力提供相关背景和信息,以便制定决策或行动方案。记住:高质量的分析是可以付诸行动的分析。

如何进行有效的根本原因分析:技巧和方法

我们可以在进行根本原因分析时选用大量的技巧和策略,下文并未列出所有技巧和策略。但我们将介绍一些最常用、适用范围最广泛的技巧。

5 个为什么

进行根本原因分析时,一种较为常见的技巧是 5 问法。我们也可以将这种方法视为顽皮宝宝的方法。得到每个问题(“为什么”)的答案后,继续提出更深入的问题(“好,那为什么”)。儿童能够有效地进行根本原因分析,这让很多人感到惊讶。根据常识,我们可以通过大约五个“为什么”找到最根本的原因 — 但有时只需要问两次,有时需要问 50 次。

示例:我们回到刚才的橄榄球运动员脑震荡示例。首先,我们的运动员会反映一个问题:为什么我的头痛这么严重?这是第一个“为什么”。
第一个答案:因为我视物模糊。
第二个“为什么”:为什么您视物模糊?
第二个答案:因为我的头撞到了地面。
第三个“为什么”:为什么您的头撞到了地面?
第三个答案:我在对手的阻截下倒地,头重重地撞到地面。
第四个“为什么”:为什么撞到地面后会这么痛?
第四个答案:因为我没有佩戴头盔。
第五个“为什么”:为什么您没有佩戴头盔?
第五个“为什么”:因为更衣室没有足够多的头盔。

啊哈。通过这五个问题,我们发现脑震荡的根本原因最有可能是头盔数量不足。今后,为了防止此类脑震荡的风险,我们可以确保每名橄榄球运动员都有一顶头盔。(当然,佩戴头盔也不能保证脑震荡一定不会发生。因此要多加小心!)

这 5 个问题所起的作用是避免我们进行无根据的假设。针对递进式问题探寻详细的答复,答案会在每一轮变得更加明确、更加精炼。在理想情况下,最后一个问题会揭示出某个失败的过程,此时我们就能够对此过程采取更正措施。

变更分析/事件分析

在进行根本原因分析时,另一个有用的方法是仔细分析事件发生之前的各种变更。
如果存在大量可能的原因,这种方法会非常管用。我们的调查不应该局限于出现问题的具体日期或时刻,而是应该覆盖一个更长的时期,以便获得历史背景。

**1.**首先,我们列出可能导致某个事件发生的所有潜在原因。这应该包括所有有害、有益及良性变更。

示例:我们假设,要分析的事件是我们在纽约市的销售额在某一天出奇地高,我们想知道这个销售额背后的原因,以便重现这样的事件。首先,我们列出每个主要客户的每个接触点、每个事件、每个可能相关的变更。

**2.**接下来,我们根据自己对每个变更或事件的影响力对其进行分类。我们的类别可以是“内部/外部”、“自有/非自有”等等。

示例:在我们的“日销售额超高”示例中,我们开始梳理出一些事情,例如“销售代表进行了关于社会影响的新幻灯片演示”(内部),“季度最后一天”(外部)或“春季第一天”(外部)等。

**3.**第三步,我们逐个分析每个事件,确定该事件是无关因素、相关因素、促成因素,还是可能的根本原因。大部分分析工作都集中在这个阶段,我们也可以在此阶段使用其他方法,例如“5 问法”。

示例:我们在分析中发现,那些制作精美的新销售幻灯片其实是无关因素,而那个时间节点(季度最后一天)肯定是一个促成因素。但可能性最大的根本原因却是另一个因素:该地区的销售主管搬到了车程更近的新住所,因此从该季度的最后一个星期开始,她与客户会面的时间比以往早了 10 分钟。

**4.**第四步,我们研究怎样才能复制根本原因或者对其采取纠正措施。

示例:让每个人都搬家不太现实,但我们的组织决定:如果销售代表能够在季度的最后一星期每天提前十分钟与客户会面,他们就有可能复制这个根本原因并取得成功。

因果鱼骨图

另一种常见的方法是创建鱼骨图(又称 Ishikawa 图)来对因果关系进行可视化呈现。这种方法有助于发现问题的可能原因;根据此方法,我们沿着类别分支路径找到各种潜在原因并最终确定根本原因。它与 5 问法类似但直观程度远高于 5 问法。

通常,我们先把问题放在图形中部(鱼的脊柱),然后通过头脑风暴找出几个类别的原因,将这些原因放到从主线散发出的分支(鱼骨架的肋骨)上。这些类别非常宽泛,可能包括“人”或者“环境”等。划分类别后,我们将其细分为更小的群组。举例来说,在“人”下方,我们可以考虑“领导”、“职员”或“培训”等潜在的根本原因。

我们越来越深入地分析潜在的原因和次级原因,对每个分支提出问题,并在这个过程中越来越接近问题的来源。通过这种方法,我们可以去除无关类别,确定相关因素,并且可能找到根本原因。为简明起见,请在创建图表前仔细考虑要使用的类别。

创建鱼骨图时可以考虑的常见类别:

  • 机器(设备,技术)
  • 方法(流程)
  • 物料(包括原料、消耗品和信息)
  • 人/智力(体力或脑力劳动)
  • 测量(检查)
  • 任务(目的,预期)
  • 管理/财力(领导)
  • 维护
  • 产品(或服务)
  • 价格
  • 推广(营销)
  • 流程(系统)
  • 人员(员工)
  • 实物证据
  • 绩效
  • 场所(地点,环境)
  • 供应方
  • 技能

关于如何有效进行根本原因分析的提示

通过提问来澄清信息并接近答案。越是针对每个可能的原因提出深入的问题,我们就越容易找到根本原因。一旦认为自己找到了问题的根本原因(而不仅仅是另一种表面现象),我们可以提出更多问题:为什么说这个原因(而非其他原因)是根本原因?我们如何解决根本原因,防止问题再次发生?使用简单的问题,例如“为什么?”“如何?”以及“那意味着什么”来寻找理解问题的途径。

进行团队合作并寻求新颖的观点

无论是单个合作伙伴还是由同事组成的整个团队,不同的视角总是有助于我们更快地找到解决方案,还可以打消我们的偏见。获取其他人的意见也有助于发掘更多的观点,帮助我们验证自己的假设。

为将来的根本原因分析制定计划

进行根本原因分析的时候,我们必须注意流程本身。做好笔记。提出关于分析流程本身的问题。根据您的具体业务需求和环境,确定是否存在某种最适合您的技术或方法。

别忘了也对成功事件进行根本原因分析

根本原因分析是确定故障环节的好方法。我们常常使用根本原因分析来诊断问题,但它在确定成功的根本原因方面同样有效。在成功实现目标、超额或者提前完成任务时,查找成功的根本原因往往是有益的做法。这种分析有助于我们提升关键因素的优先级并主动采取保护措施,进而有可能将一个领域的成功复制到另一个领域。

RCA(根本原因分析)的重要步骤

01 根本原因分析

Let’s look now at an important tool used in continuous improvement efforts. The tool is Root Cause Analysis (RCA). We will cover steps you can take when using this tool to help solve problems and resolve issues.

现在,我们一起来看看用在持续改善方面的一个非常重要的工具:RCA(根本原因分析)。在这篇文章里,我们会涵盖一些在使用RCA来解决问题时可以采用的步骤。

We should note that Root Cause Analysis is a way of finding a fundamental cause for a problem not just a ways to address a symptom.

我们应该注意一下,RCA(根本原因分析)是一个找出问题根本原因的方法,而不单单是是用来处理某个症状的方法。

For example, imagine you are manufacturing plastic cups and scrap 100 of them in a day.

举例,假设你生产塑料杯,而在一天内会有100个塑料杯会报废。

A cause of this could be that the technician did not maintain equipment properly. The root cause could be that the maintenance procedure is not clear and training did not cover maintenance.

造成这种情况出现的原因可能是:技术人员没有对设备进行适当的维护,而问题的根本原因则可能是设备维护程序不清晰,以及培训并没有涉及到设备维护。

To fix the problem properly you must maintain the equipment and improve the overall process of documentation and training.

为了妥善解决问题,你得对设备进行维护,并对文件和培训的整个过程进行改善。

We should also note that Root Cause Analysis when done properly is an iterative process to help with continuous improvement in an organization.

我们还应该注意到,正确完成RCA(根本原因分析),是一个帮助组织进行持续改进的反复过程。

Root Cause Analysis can use approaches that depend on the application. These can be quality industrial applications, safety concerns, process concerns, business processes, and systems approaches.

RCA(根本原因分析),可以使用基于实际案例的方法,可以是质量方面的行业应用、安全问题、流程问题、业务流程,以及系统方法。

02 RCA的基本原则

Here are some of the general best practices for Root Cause Analysis:

下面是一些RCA(根本原因分析)的常见最佳做法:

· Make the aim of Root Cause Analysis to determine how to fix a particular problem and other related problems.

将RCA(根本原因分析)的目标设定为:确定如何处理特定的问题,以及与之相关的问题。

· Use Root Cause Analysis in a systematic way.

用系统性的方法运用RCA(根本原因分析)。

· Remember a problem can have more than one root cause.

要注意,一个问题可能有多个根本原因。

· Keep cost in mind when determining a fix to a problem.

在确定问题的解决方案时,要有成本意识。

· Keep in mind a fix needs to be sustained.

请牢记,需要确认应急措施。

· Understand that Root Cause Analysis can cause a change to a culture and resistance from those who will implement the change.

要理解:RCA(根本原因分析),会让文化产生变革,并会导致变革实施者的抵制。

03 RCA的步骤

Here are some steps to taking action based on Root Cause Analysis:

基于RCA(根本原因分析),以下是可以采取行动的一些步骤:

1.Define the problem

定义问题

2.Collect data

收集数据

3.Ask why. This means determining the factors that led to the problem.

询问原因。该步骤意味着要确定导致问题的因素。

4.Determine which factors are root causes and not just symptoms.

需要确定哪些因素是导致问题的根本原因,而不单单是征兆。

5.Identify corrective actions.

确定纠正措施。

6.Identify solutions that will help the problem from recurring and do not cause other problems.

确定问题的解决方案,避免问题重现,并导致其他问题的出现。

7.Implement the solution.

实施解决方案。

8.Determine if you can use this solution with other problems.

确认该方案可否用来解决其他的问题。

04 更多准则

Remember that Root Cause Analysis is one of the basic tools you should use for continual improvement. Your goal using it is to understand an issue and what is causing it. You can then resolve the issue, not repeat the problem, and improve a process.

请记住:RCA(根本原因分析),是应该被用于持续改善的最基本的工具之一。使用RCA(根本原因分析),是用来理解问题,以及导致该问题出现的原因的。后续,你可以解决问题,不让问题重现,并对流程进行改进。

Here are some guidelines:

以下是一些准则:

· Use Root Cause Analysis as soon as you recognize a problem.

一旦识别出问题,请立即使用RCA(根本原因分析)。

· Do not wait until a problem becomes severe.

不要等到问题变得很严重。

· Use Root Cause Analysis in an iterative way.

要反复使用RCA(根本原因分析)。

· Give priority to the problem that is most urgent.

对最紧急的问题进行优先处理。

· Be precise.

要一丝不苟。

· Pick a problem that is solvable.

选择可以解决的问题。

· Use the 5 Whys technique.

使用5WHY的方法。

05 沟通纠正措施

When you implement a corrective action communicate to all involved the:

在实施纠正措施时,请与所有相关的人员就以下3个方面进行沟通:

· reason for the action.

实施纠正措施的原因。

· benefits of the action.

实施纠正措施的好处。

· time needed to implement.

实施纠正措施所需要的时间。

After implementing a solution remember to iterate.

实施解决方案之后,要记住要重复进行。

06 要分享最佳做法

Here are some related best practices:

以下是相关的一些最佳做法:

·Ask if the solution is effective.

询问解决方案是否有效。

·Review the results of the action.

回顾行动的结果。

·Modify the action as needed.

如有必要,对行动进行更改。

·Recognize you may need a different approach if the problem continues.

如果问题还是继续存在,要意识到可以采用不同的方法。

·Update procedures.

对程序进行更新。

After you update procedures check that everyone is following the procedures.

在程序更新后,请检查确认下是否所有人都遵守程序了。

In time revisit the issue to make sure the fix is still working and everyone is following the procedures properly.

要及时继续讨论问题,确保结果还是有效的,每个人都在正确地遵守程序。

Remember that training could be involved once you determine a resolution of a root cause problem.

记住,一旦确定下导致问题的根本原因的解决方案,就可能会涉及到培训。

Remember also that when you do a root cause analysis the next step is critical.

还要记住,在做根本原因分析时,下一个步骤是非常重要的。

You must have an effective corrective action plan and a preventive action plan too.

你得拥有有效的纠正性措施计划,以及预防性措施计划。

Make sure your organization follows the plan, provides proper documentation, trains all involved, and continuously follows up on additional improvements to the process.

要确保组织落实了计划,请提供恰当的文件,对所有的相关人员进行培训,并持续跟踪过程中其他方面的改进。

随机生成日期、时间

用mysql自带函数生成随机日期/时间

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# 取1224的随机整数,包括1224
SELECT FLOOR(12+(RAND()*13));

# 取0-24之间的随机数,不够2位的前补0
SELECT LPAD(FLOOR(0 + (RAND() * 23)),2,0);

# 给用户赋一个随机创建日期,年份为2015-2015
SELECT CONCAT(
FLOOR(2015 + ( RAND() * 1 )),
'-',
LPAD(FLOOR(10 + ( RAND() * 2 )),2,0 ),
'-',
LPAD(FLOOR(1 + ( RAND() * 25 )),2,0 )
);

# 给用户赋一个随机创建时间,年份为2019
SELECT CONCAT(
FLOOR(2019 + ( RAND() * 1 )),
'-',
LPAD(FLOOR(0 + ( RAND() * 12 )),2,0 ),
'-',
LPAD(FLOOR(1 + ( RAND() * 25 )),2,0 ),
' ',
LPAD(FLOOR(1 + ( RAND() * 23 )),2,0 ),
':',
LPAD(FLOOR(1 + ( RAND() * 59 )),2,0 ),
':',
LPAD(FLOOR(1 + ( RAND() * 59 )),2,0 )
);

函数说明

1
2
3
4
5
6
7
8
# 可以在01之间产生一个随机数:
RAND()

# 向下取整
FLOOR(x)

# 填充字符串左边
LPAD(str,len,padstr)