SRE、系统可靠性、韧性与混沌工程之间有哪些联系?
SRE、系统可靠性、韧性与混沌工程之间有哪些联系?
talkwithtrend
talkwithtrend.com社区(即twt社区)官方公众号,持续发布优秀社区原创内容。内容深度服务企业内各方向的架构师、运维主管、开发和运维工程师等IT专业岗位人群,让您时刻和国内企业IT同行保持信息同步。
【作者】汪照辉, 中国银河证券架构师,专注于容器云、微服务、DevOps、数据治理、数字化转型等领域,对相关技术有独特的理解和见解。擅长于软件规划和设计,提出的“平台融合”的观点越来越得到认同和事实证明。发表了众多技术文章探讨容器平台建设、微服务技术、DevOps、数字化转型、数据治理、中台建设等内容,受到了广泛关注和肯定。
不同的视角得出的结论可能是不同的,所以概念也总是层出不穷。在讨论一个问题的时候,往往会涉及很多的方面的概念和知识,一些概念是相似的、相互关联的、甚至是重叠的。理解这些概念之间的关系和联系,有助于我们更好的探讨和解决遇到的实际问题。
SRE与系统可靠性
可靠性计算通常是一个时间比值,也就是正常运行时间和总运行时间的比值。而韧性更多是考虑对不稳定性的容忍能力和容忍程度,是个区间值。混沌工程的目的就是要主动探测出某一条件下某一组件、系统、服务等的韧性的区间范围,从而形成知识库,为系统故障预警、智能化运维和运营提供支持。所以,有些人也称混沌工程为韧性工程。
可靠性工程和韧性工程
不折腾是系统稳定性的保障之一,但一旦出现问题,往往也会措手不及,所以它和混沌工程主动去探索系统不稳定的因为是相反的,所以需要演练。很多人也提倡混沌工程来提升系统可靠性和韧性,它也是增强认知从而更好应对不确定性的很好的举措。
应对变化和混沌工程
不过系统运行是动态变化的,特别数字化时代,敏捷应对变化是必需的能力,所以通常需要能动态的应对这些变化。 对于任何一个系统来说,其可用的资源都是有限的。比如说,磁盘存储资源,如果应用系统的日志大小和数量没有限制,早晚会导致磁盘资源耗尽而使应用系统进程异常。但通常应用系统运维人员并不参与系统的设计和研发,可能不了解日志文件大小和数量是否进行了限制,所以需要对这些内容进行监控和分析,找到可能会导致系统异常的一些点,然后采取措施消除这些可能会导致系统异常的点,从而也就提升了系统的可靠性和稳定性。 要具备应对变化的能力,就需要对环境和系统运行状况能够有所了解,或者有深入的了解,知其然更知其所以然,才能做到敏捷应对。
混沌,指的是一种模糊不清的状态。和一片清明、知其所以然正好相反。混沌工程要做的就是将一片混沌的状态探索为一片清明,所以混沌工程重要的是知识的积累,知识库的建立就非常有必要而且非常重要。用已知的知识探索未知的领域,逐步对系统的内外有清晰的认识。 探索过程中有时候是很难控制影响范围的,因为对当前的环境和状态是未知的,因为未知,所以才需要探索,但因为未知,也就难以知道哪里有陷进、哪里是悬崖,犯错甚至牺牲都是有可能的。
不管概念怎么变化,核心的内容其实还是那么多。结合不同的概念有时候可能更好地、全面地理解这些内容。同样,在进行系统建设时,也需要结合不同的概念和系统,来从全局考虑和把握,避免重复的建设和低效的集成。数字化时代,重要的时要具备全局的思想、敏捷的思维和随时随地随需的响应能力。
原题:SRE、系统可靠性、韧性与混沌工程 如有任何问题,可 点击文末阅读原文 ,到社区原文下留言探讨 觉得本文有用,请 转发、点赞 或点击 “赏” ,让更多同行看到
资料/文章推荐:
-
从 SRE 看 DevOps 建设 -
正确认识混沌工程 -
混沌工程实践:一次进程假死事件
欢迎关注社区 "运维 " 技术主题 ,将会不断更新优质资料、文章,您也可以前往提出疑难问题,与同行切磋交流。地址:https://www.talkwithtrend.com/Topic/4549
下载 twt 社区客户端 APP
长按识别二维码即可下载
或到应用商店搜索“twt”
长按二维码关注公众号
*本公众号所发布内容仅代表作者观点,不代表社区立场
-
2023年血糖新标准公布,不是3.9-6.1,快来看看你的血糖正常吗? 2023-02-07
-
2023年各省最新电价一览!8省中午执行谷段电价! 2023-01-03
-
GB 55009-2021《燃气工程项目规范》(含条文说明),2022年1月1日起实施 2021-11-07
-
PPT导出高分辨率图片的四种方法 2022-09-22
-
2023年最新!国家电网27家省级电力公司负责人大盘点 2023-03-14
-
全国消防救援总队主官及简历(2023.2) 2023-02-10
-
盘点 l 中国石油大庆油田现任领导班子 2023-02-28
-
我们的前辈!历届全国工程勘察设计大师完整名单! 2022-11-18
-
关于某送变电公司“4·22”人身死亡事故的快报 2022-04-26
