超融合节点虚拟机密度问题带来的风险思考
超融合节点虚拟机密度问题带来的风险思考
talkwithtrend
talkwithtrend.com社区(即twt社区)官方公众号,持续发布优秀社区原创内容。内容深度服务企业内各方向的架构师、运维主管、开发和运维工程师等IT专业岗位人群,让您时刻和国内企业IT同行保持信息同步。
社区探讨,供大家参考:
问题来自社区会员@bugbeta 国X证券系统运维工程师,以下分享均来自社区同行
@pysx0503 系统工程师:
以4节点的超融合为例,如果4台机器上的虚拟机资源消耗超过了3/4.那么。当一个节点重启的时候必然会有一部分虚拟机的资源无法的到满足而产生影响。可以通过对业务的分级来调整。比如把重要业务和不重要的业务划分开。通过策略实现当某个节点挂掉的时候优先保证重要业务。
另外还有一种就是尽可能的保证系统资源占用预留一个节点以上。保证任何一个节点重启时业务不受影响。
@Jerry Miku The Global 500:
宿主机配置拉高,虚拟机的密度必然增大,遇到宿主机宕机的极端情况,HA切换的时间也可能会相应的延长。虽然现在虚拟化层针对HA的机制更加智能了,能序列化、并发进行,但是单台宿主机上虚拟机的密度变大,故障和风险的影响范围必然扩大不少,潜在隐患风险系数自然高。
几个经验性的建议:
1、将宿主机分成多个逻辑集群,核心业务部署在高规格集群,虚拟机密度适当降低。非核心业务部署在中低规格集群,预留充足的HA资源。
2、业务集群化部署,至少2节点部署。同时指定亲和性策略,将同一个业务的几台虚拟机分配到不同的物理节点上。同一类型的业务,不要同时放到同一区域/片区的宿主机上,避免突发极端情况,该类业务全线凉凉。
@waring_id 技术经理:
1、先确保群集中有冗余的主机,当故障发生时,冗余的机器能够接管且性能足够。
2、VM主机的操作系统和数据盘分开,通过方案实现故障时数据的转移操作只限于操作系统层面。
@匿名用户:
建议规划使用冗余一台作为备份,防止突发宕机造成业务无发切换使用。
划分业务服务重要,核心重要业务优先保证,次一级的业务按需规划。
如果条件允许可以搭建私有云环境。
1、首先是使用阈值限制,至少预留一个节点资源应对物理节点故障的风险,(4节点,预算1/4,3节点,预留1/3);
2、核心应用系统正常都是双机,分布在不同的物理节点,多节点同时宕机故障的情况发生率较低;多集群部署,主备节点部署在不同机柜/机房的不同超融合集群,及时挂掉一个集群,其他集群可以接管业务;(真正生产的核心系统必然会有一定的运营保障投入)
3、优先级策略设置,出现故障,优先保障重要核心机器的运行;
@sunnysu IT工程师:
一切的问题都是因为花钱少。
欢迎来探讨
欢迎点击文末 阅读原文 到社区阅读和讨论交流,发表您的看法 觉得本文有用,请 转发 或点击 赏 ,让更多同行看到
资料/文章推荐:
-
超融合能不能扛起全闪做支撑交易类数据库最佳平台的大旗?| 争议
-
抛弃?保留?——基于超融合的容器应用入云,延用超融合还是用裸金属替代 | 争议
-
企业应用超融合架构的设计实例
-
争议 | 小金融对双活要求不高,能否采用超融合架构替代存储架构?
-
超融合探讨和实践精选30篇,包含金融、医疗等行业分享
欢迎关注社区 "超融合" 技术主题 ,将会不断更新优质资料、文章。地址:
http://www.talkwithtrend.com/Topic/39775
下载 twt 社区客户端 APP
长按识别二维码即可下载
或到应用商店搜索“twt”
长按二维码关注公众号
*本公众号所发布内容仅代表作者观点,不代表社区立场
-
2023年血糖新标准公布,不是3.9-6.1,快来看看你的血糖正常吗? 2023-02-07
-
2023年各省最新电价一览!8省中午执行谷段电价! 2023-01-03
-
GB 55009-2021《燃气工程项目规范》(含条文说明),2022年1月1日起实施 2021-11-07
-
PPT导出高分辨率图片的四种方法 2022-09-22
-
2023年最新!国家电网27家省级电力公司负责人大盘点 2023-03-14
-
全国消防救援总队主官及简历(2023.2) 2023-02-10
-
盘点 l 中国石油大庆油田现任领导班子 2023-02-28
-
我们的前辈!历届全国工程勘察设计大师完整名单! 2022-11-18
-
关于某送变电公司“4·22”人身死亡事故的快报 2022-04-26
