聊聊 Linux 运维排查问题的分析思路
聊聊 Linux 运维排查问题的分析思路
talkwithtrend
talkwithtrend.com社区(即twt社区)官方公众号,持续发布优秀社区原创内容。内容深度服务企业内各方向的架构师、运维主管、开发和运维工程师等IT专业岗位人群,让您时刻和国内企业IT同行保持信息同步。
社区探讨,供大家参考:
问题和以下分享均来自社区会员
@zhanxuechao 数字研究院 咨询专家:
1.整体情况
USE方法:监控系统资源的使用率(Utilization)、饱和度(Saturation)、错误数(Errors)
@匿名用户:
来自chatgpt——
在Linux系统运维中,排查问题的分析思路通常如下:
确认问题表现:先明确问题的具体表现,如何出现的,何时出现的等等。这有助于缩小问题排查范围。
查看系统日志:系统日志记录了系统运行中的各种信息,包括错误、警告等,可以帮助找到问题的原因。
检查系统资源:查看系统资源使用情况,如内存、CPU、磁盘等,是否达到了系统的限制或者出现了异常。
检查配置文件:检查系统配置文件,是否有错误或者不合理的设置。
进行测试和验证:进行一系列测试和验证,包括网络连接、服务运行情况等等。
查找相关文档和资料:查找相关的文档和资料,了解相关的技术和解决方案,寻找其他可能的解决方案。
进行复盘:在问题得到解决后,进行复盘总结,记录下问题的原因和解决方法,为以后的排查问题提供参考。
@zhaoxiaoyong081 平安科技 资深工程师 :
1、观察现象:首先需要了解问题的现象和表现形式,比如服务器出现宕机、应用程序出现异常等,需要通过观察现象了解问题的大体情况。
2、收集信息:收集系统和应用程序的相关信息,比如系统日志、应用程序日志、进程信息、网络连接情况等。可以通过各种命令(比如top、ps、netstat等)和工具(比如syslog、dmesg、tcpdump等)来获取相关信息。
3、确定问题范围:根据收集的信息,确定问题的范围,比如是操作系统问题、应用程序问题、网络问题等,缩小问题的范围可以更快地定位问题。
4、分析问题原因:根据收集到的信息和确定的问题范围,分析问题的原因,可能是系统配置问题、软件漏洞、硬件故障等。
5、解决问题:找到问题的原因后,可以采取相应的措施来解决问题,比如修改配置、更新软件、修复硬件等。
6、预防问题:在解决问题的同时,也要思考如何预防类似问题的发生,比如增强系统的安全性、优化系统性能等。
主机层面的问题,可以使用工具排查:
CPU 相关问题,可以使用 top、vmstat、pidstat、ps 等工具排查;
内存相关问题,可以使用 free、top、ps、vmstat、cachestat、sar 等工具排查;
IO 相关问题,可以使用 lsof、iostat、pidstat、sar、iotop、df、du 等工具排查;
网络相关问题,可以使用 ifconfig、ip、nslookup、dig、ping、tcpdump、iptables 等工具排查。
分析问题的套路:
第一,分析问题一定是需要依据的,靠猜是猜不出来的,需要提前做好基础监控的建设。监控的话,需要在基础运维层、应用层、业务层等多个层次进行。定位问题的时候,我们同样需要参照多个监控层的指标表现综合分析。
第二,定位问题要先对原因进行大致分类,是CPU 相关问题还是内存相关问题、仅仅是接口的问题还是整个应用的问题,然后再去进一步细化探索,一定是从大到小来思考问题;在追查问题遇到瓶颈的时候,我们可以先退出细节,再从大的方面捋一下涉及的点,再重新来看问题。
第三,分析问题很多时候靠的是经验,很难找到完整的方法论。遇到重大问题的时候,往往也需要根据直觉来第一时间找到最有可能的点,这里甚至有运气成分。建议你在平时解决问题的时候多思考、多总结,提炼出更多自己分析问题的套路和拿手工具。
@匿名用户:
欢迎来探讨
欢迎点击文末 阅读原文 到社区阅读和讨论交流,发表您的看法 觉得本文有用,请 转发 或点击 赏 ,让更多同行看到
资料/文章推荐:
-
Linux 系统性能优化思路和优化方法
-
Linux 系统巡检报告参考模板
-
Linux 系统加固规范
欢迎关注社区以下 “系统运维”技术主题 ,将会不断更新优质资料、文章。地址:
http://www.talkwithtrend.com/Topic/112795
下载 twt 社区客户端 APP
长按识别二维码即可下载
或到应用商店搜索“twt”
长按二维码关注公众号
*本公众号所发布内容仅代表作者观点,不代表社区立场
-
2023年血糖新标准公布,不是3.9-6.1,快来看看你的血糖正常吗? 2023-02-07
-
2023年各省最新电价一览!8省中午执行谷段电价! 2023-01-03
-
GB 55009-2021《燃气工程项目规范》(含条文说明),2022年1月1日起实施 2021-11-07
-
PPT导出高分辨率图片的四种方法 2022-09-22
-
2023年最新!国家电网27家省级电力公司负责人大盘点 2023-03-14
-
全国消防救援总队主官及简历(2023.2) 2023-02-10
-
盘点 l 中国石油大庆油田现任领导班子 2023-02-28
-
我们的前辈!历届全国工程勘察设计大师完整名单! 2022-11-18
-
关于某送变电公司“4·22”人身死亡事故的快报 2022-04-26
