上海数慧  数据与智慧的桥梁!

典型案例    Typical Case
武汉不动产登记信息管理平台巡检

背景

随着不动产登记职责整合工作的推进以及不动产统一登记制度的建立,政府在全国范围内开始了不动产登记的试点工作,而武汉市是全国15个不动产登记试点的城市之一。

武汉市国土规划局的不动产登记信息管理平台,是全国第一个不动产业务管理系统(下文简称“不动产系统”),关联了银行、公安、规划、国土、征信等各个领域。该系统为全市所有市民提供服务,且业务逻辑非常复杂。同时系统每月的新增业务量达到9-12万件,其业务量远远超过规划行业平均一年业务量大约1万的水平。

 

需求

不动产系统服务于全市市民,每日需办理的业务量巨大,这对我们的系统提出了两点要求:

1.系统必须保持7*24小时内正常运行,同时保持稳定的性能水平。

2.我们知道不动产系统的数据涉及民生,不容有失。

此外,不动产系统的业务需求变更和增减频率较高,所需承载的业务类型和复杂度在不断上升,在这种情况下,系统开始出现性能降低、运行不稳定的现象。这些要求和出现的问题迫切需要我们采取措施对系统的健康情况进行诊断。

 

解决方案

我们向武汉市国土规划局推出“系统巡检”服务,以确保系统稳定运行,并持续完善运行环境。“系统巡检”内容包括硬件设施、数据库和软件系统三个方面。通过对硬件设施、数据库和软件系统这三个方面的健康检查,及时发现潜在的运行问题,并提出优化建议。

整个“系统巡检”过程包括四大步骤:

1、监控部署:部署后台监控程序,定期汇总所有服务器的后台监控数据,检查数据情况和变化趋势,检查是否存在问题;

2、信息汇总:汇总服务器后台监控数据、磁盘容量状态、操作系统日志等硬件设施相关信息,数据库的基本状态、备份状态、运行统计报告、表空间容量、表容量、连接情况、SQL性能、数据库日志等数据库相关信息,以及中间件软件、应用系统的日志等软件系统相关信息;

3、问题识别:判断某个数据项是否达到或超出指定阈值,例如CPU负载平均值不应超过60%等;对某个数据项进行时间变化分析,判断是否会在一段时间后发生异常,例如磁盘存储量变化、JVM内存泄露等;对两个或多个相似对象判断是否存在差异,例如多个节点服务器中,是否有一台服务器CPU负载明显高于其他服务器;对条目性的信息记录进行归类统计,例如对数据库日志中的错误进行判断分析等;

4、改进优化:针对发现的问题,需要进一步分析问题的发生原因,包括对问题的解释、问题的触发条件、关联的其他信息等。在问题分析后,针对问题的发生原因,提出相应的解决方案,并针对问题原因进行改进优化,解决方案包括以下三个方面:故障消除、原因纠正、风险预防措施。常见的纠正预防措施包括:集群水平扩容,磁盘、数据库的容量扩容,调整JVM、最大连接数的配置等。

5-14.png


成效

武汉不动产系统的“系统巡检”至成稿时,已滚动运行了五个月时间,在此期间:

●  进行了数据库表扩容,避免了使用率100%导致的数据库交易中止。

●  建立了数据库RMAN备份机制,提高了数据安全和恢复能力。

●  发现了SQL瓶颈,提交给了系统开发人员进行优化改进。

●  进行了BPM集群扩容,使CPU负荷从60%降至20%的安全水平,避免了性能异常事件。

●  进行了不同应用的服务器拆分,提高了各自应用的CPU利用效率,提升了系统性能。

●  发现了mongodb磁盘容量不足的情况,及时避免了因磁盘容量不足会导致的问题。

通过对系统进行定期巡检,运维人员可以及时发现系统潜在的运行问题,并提出相应的解决方案,排除潜在问题,保障系统的业务连续性,同时确保数据不丢失,进而提升系统的稳定性和可靠性。


联系我们

  电话:021-61016225 021-61016226

  传真:021-61001383

  邮箱:zhaopin@dist.com.cn

  地址:中国(上海)自由贸易试验区张衡路1000弄58-59号

DIST上海数慧

Copyright © 2001-2016 上海数慧系统技术有限公司All rights reserved  沪ICP备05004315号

敬请期待

敬请期待

DIST上海数慧

021-61016225  021-61016226