主机系统运维服务 2023-11-22 15:12

本公司秉承“应用信息技术,成就客户梦想”的企业使命,始终坚持“客户导向、至诚守信、艰苦奋斗、专业专注、持续改进、合作共赢”的核心价值理念,致力塑造“智慧IT服务顾问”的高端品牌。

     现在造成IT架构不可用的原因有很多,主要包括非计划性宕机和计划性宕机两大类,其中,非计划性宕机主要是由计算机故障或数据故障引起的;计划性宕机主要是由于生产系统的数据改变或系统改变引起的。

(1)、非计划性宕机

非计划性宕机主要包括主机故障宕机、数据故障宕机、存储故障、人为错误、数据损坏、站点故障等。

A.主机故障宕机

当主机系统或数据库服务器出现意外故障并导致服务中断时,主机系统就会发生故障。

B.数据故障宕机

数据故障是指丢失、损坏或破坏关键企业数据。数据故障的原因比计算机故障更加错综复杂,可能由于存储硬件、人为错误、损坏或站点故障引起。

C.存储故障

单一存储配置,目前都是采用磁盘RAID技术加热备磁盘来解决,因此存储系统的故障主要是由机房电力故障或人为因素导致存储设备的电源发生故障。

D.人为错误

人为错误包括:误删除重要数据或升级语句中不正确的“WHERE”子句更新了比预定更多的行。

E.数据损坏

数据损坏通常由I/O堆栈中的故障组件导致,例如,数据库将I/O作为更新交易的结果,该数据库I/0将在各个组件中进行传输,包括:操作系统的 I/0代码、文件系统、卷管理器、设备驱动程序、主机总线适配器、存储控制器和磁盘驱动器,直至最后被写入。I/O堆栈中任何组件发生错误或硬件故障,都可能“变换”数据中的一些位,进而导致损坏的数据被写入数据库中,这一损坏可能是数据库控制信息或用户数据,它们对于数据库的正常工作至关重要;同样磁盘故障也可能损坏数据。

F.站点故障

数据保护特性提供了预防灾难性事件的能力,这些事件可能在某一段时间内严重减缓站点的处理能力,这些事件包括文件损坏、自然灾害、电力或通信中断,甚至恐怖活动。

(2)、计划性宕机

计划性宕机是IT系统在运行阶段所不可避免的,但IT系统停机运维会影响到数据库停止对外提供服务,会对业务运营造成一定影响,特别是对7X24X365的业务系统、计费系统、在线交易系统等。

计划内停机包括例行操作、定期维护和部署新设备等:例行操作指频繁进行的维护任务,包括备份、性能管理、用户管理和批处理;定期维护,如安装补丁和重新配置系统,只是偶尔进行,以更新数据库、应用程序、操作系统、中间件或网络;部署新设备包括硬件、操作系统、据库、应用程序、中间件或网络的重大升级。

申请计划停机时不仅要考虑计划的停机时间,同时还要考虑因停机造成的对整个业务系统的影响。

A.数据更改导致的停机

对于数据的更改例如增加数据空间、改变数据库的对象,添加及删除数据库对象,对数据库的参数进行调整等操作,都有可能导致计划性停机。

  1. 系统更改而导致的停机

由于系统更改导致的停机主要表现在两方面:一是主机系统的更改,例如更新设备、添加硬件、调整参数造成主机系统重启;二是数据库系统的更改,例如数据库补丁升级,调整一些重要参数需要重新启动数据库的运维操作。

提供的主机系统的运维服务包括:主机的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。

主机系统基本服务内容:

序号

服务模块

内容描述

1

现场备件安装

配合用户进行。按备件到达现场时间工程师到达现场

2

补丁服务

消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。

3

 升级服务

对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。

4

现场故障诊断

按服务级别:7x24小时 5x8小时

5

电话远程技术支持

7x24小时

6

问题管理系统

对遇到的问题进行汇总和发布

7

系统优化

对客户系统的括主机、存储设备、操作系统提供优化服务