了解最新公司动态及行业资讯
随着互联网的发展,除非数据出现革命性的技术创新,否则按照目前的趋势,肯定会建设越来越多的数据中心。一个数据中心的建设周期大约是几个月到两年。它往往会运行多年,所以从这个角度来看,数据中心肯定需要越来越多的员工服务器运维外包,但现在基础设施运维市场上还没有这样的垄断企业。那种市场份额基本处于百家争鸣的阶段,行业也没有特别规范,所以总体来说还是从业者比较好的时期。如果你在一个相对快速成长的企业,你可以获得非常好的发展。
至今,我在数据中心运维部工作了一年。我的工作主要是协助部门主管处理一些事务性的工作。从今年的情况来看,数据中心在很多投资者和政府官员中都是高科技。科技公司,无论是投资还是政府业绩,说起来都很花里胡哨,所以总的来说,我们公司发展很快。投递简历的时候,看到互联网数据中心的概念服务器运维外包,瞬间觉得高大上。再加上公司HR的洗脑,感觉这是一个很朝阳的行业,号称是互联网行业的水电。为所有互联网公司提供基础设施支持。
让我们谈谈我们公司是做什么的。主要业务是提供数据中心基础设施的咨询、规划、设计、建设、验证、全生命周期运维。我们的机房有自己的机房,也就是自己投资。建设,主要是通过向客户出租或出售给其他公司获取利润,并为其他公司的机房提供运维外包服务,即依靠服务收费。
我在运维部,做数据中心的基础设施运维。数据中心的基础设施是什么?简单来说就是强弱电、暖通空调、安防三个方面。IT设备,也就是客户端服务器、存储、交换机等等等等,无论网络里面传输什么,后端的大数据、各种数据的存储、处理都与我们无关。根据工作性质,在机房工作的人员主要分为电气、暖通、弱电、安防几个专业。从职级上分为:主任、经理、主管、工程师、助理工程师、技术员等,从工作内容上分为:值班人员、维修人员、和管理人员。安排多少人取决于具体机房的大小和设备的数量。值班人员需要7x24值班,也就是说需要上夜班,还是比较辛苦的。.
数据中心的日常工作主要包括值班、巡检、设备维护、故障排除、演练等。
值班时,每个数据中心都有一个动态循环系统。本监控系统监控数据中心内所有设备,采集电压、电流、频率、PUU、功率、温湿度等数千个点。所有信息均可从本系统读取,每个参数设置为一定范围。若数值超过此范围,系统会报警,屏幕对应位置闪烁,并有语音提示。这是值班人员需要纠正的。相应问题现场处理。由于每次故障的处理都有时间限制,值班人员需要快速定位位置,因此要求值班人员非常熟悉机房内所有设备的位置。
日常检查是对不同的设备有不同的检查频率要求。巡查就是拿着巡查记录簿到机房进行巡查。有点类似于国王派我去巡山的感觉。处理然后记录在案。
设备维护,每个机房都有详细的设备维护计划,具体到每天要做什么,具体对哪些设备进行什么维护,这个维护周期是以月为单位,连续循环。
演练的目的是提高大家处理突发情况的能力。我们的演练包括各种故障情况,如停电、停水、设备故障、防恐、防汛、防台风等。演练主要是模拟真实的紧急情况。当情况发生时,我们可以根据现有的应急预案完美处理。为了完成本次演习,我们需要准备大量的材料,如演习计划、演习计划、应急预案、演习报告等,进行部署,并在事后进行总结和反思。
故障排除,机房设备很多,难免会出现一些故障。这时就需要有经验的工程师现场解决问题。我们一般分为一线工程师和二线专家。当一线工程师不能解决问题时,向二线专家寻求帮助,如果二线专家无法处理,只能向设备制造商寻求帮助。
以上是机房运行中的一些最基本的任务,是保证机房运行的最基本要求。除此之外,还有很多事务性的工作,比如与客户的沟通、节能减排等特殊工作等等。一般来说,运维工作不是一项技术性很强的工作,但是涉及到很多方面,而且容不得一点点差错,不仅是不间断的业务,而且里面的高压也是非常危险的,所以需要一个非常规范的流程来减少大家的失误,提高我们的工作效率,满足更高的要求。
因此,运维应该是一种熟悉设备、熟悉所有流程、能按规范工作的工作。