对于大型并发项目的经验
运维阶段是每个乙方宝宝都必然经历的时期,那么运维期要怎么进行管理呢?运维期又需要做哪些事项呢?
运维管理的意义
# 运维管理定义

是指采用相关的方法、手段、技术、制度、流程和文档 等,对软硬运行环境、业务系统和运维人员进行的综合管理。(信息来源百度)
# 发展趋势

普通的企业中,70%以上的故障、问题都是由业务人员发现的,运维团队、客服指导人员都处于被动接收的状态,更多担任一个救火队员的角色。在信息化、大数据日益发展的今天,这种“见招拆招”的方式已被out,“主动出击”成为应用发展趋势。
何时进入运维期
运维期在整个项目周期内属于中后期,也是当前项目和新的商机的桥梁,不同的项目特征也决定了运维的方式和执行策略。
运维的不同定义方式 ★质保期:项目上线且项目验收通过进入运维期,此部分一般不再进行系统的迭代升级、功能的优化,保证系统正常运转; ★运营服务:为了满足用户新的需求、增加软件功能的维护行为,为配合系统的推广运营进行的一系列的新功能开发; ★系统运维:项目中负责部署、服务器的配置; 怎样进行运维管理 规范制度、流程的制定是运维期有效的管理手段。运维期是系统的运营阶段的服务、技术配合阶段,意在保证系统的正常可使用、并发可承载。 项目的特征决定了运维的方式,项目的战略发展决策了运维的发展方向,一般划分为系统运维、业务运维、服务运维、互联网运维。 系统运维主要关注定在底层设备和网络层面的可用性,更加专注于具体的设备。 业务运维更加注重于业务的稳定性。 服务运维多指客户服务团队,主要进行一些系统操作指导、系统问题及建议记录反馈。 互联网运维主要负责系统的稳定运行,服务的日常巡检等。 运维期要做哪些事情 1.日常巡检 上线初期为保证系统的正常运行,每天对系统进行各项巡检。保证系统的正常运行,如发生问题应及时通知项目经理及需求、开发、测试,并协调解决问题。 2.系统监控 Zabbix、Elk、piwik对平台进行724小时的实时监控,根据定义的阈值触发告警,第一时间通过短信发送到一线运维工程师,响应并按照事件管理流程恢复生产。 3.客服支撑 根据业务方提出的服务请求,提出解决方法,耐心指导并记录问题,客服支持的响应时间为724小时。根据问题的类型触发处理流程。 了解更多