前言:想要寫出一篇引人入勝的文章?我們特意為您整理了集團(tuán)公司信息系統(tǒng)運(yùn)維工作思考探析范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
摘要:本文闡述了中國(guó)鐵路哈爾濱局集團(tuán)有限公司信息系統(tǒng)運(yùn)維工作現(xiàn)狀,分析了運(yùn)維工作取得的成績(jī)和存在的不足,提出了改善信息系統(tǒng)運(yùn)維工作的七點(diǎn)建議。
關(guān)鍵詞:信息系統(tǒng);運(yùn)維平臺(tái)
1引言
隨著信息技術(shù)在中國(guó)鐵路哈爾濱局集團(tuán)有限公司(以下簡(jiǎn)稱“集團(tuán)公司”)安全生產(chǎn)、運(yùn)輸組織、客貨營(yíng)銷等領(lǐng)域的廣泛應(yīng)用,信息系統(tǒng)逐漸成為各項(xiàng)業(yè)務(wù)活動(dòng)的重要組成部分,信息系統(tǒng)一旦發(fā)生故障,將嚴(yán)重影響正常的生產(chǎn)和經(jīng)營(yíng)活動(dòng),造成重大社會(huì)影響或經(jīng)濟(jì)損失。為適應(yīng)各項(xiàng)業(yè)務(wù)開展高度依賴信息化現(xiàn)狀,有效防范化解信息系統(tǒng)故障風(fēng)險(xiǎn),保障業(yè)務(wù)的連續(xù)性,提升對(duì)信息安全事件的處置能力,確保信息系統(tǒng)安全穩(wěn)定運(yùn)行,需要切實(shí)提高信息系統(tǒng)運(yùn)行維護(hù)水平。隨著集團(tuán)公司不斷整治信息系統(tǒng)及基礎(chǔ)運(yùn)行環(huán)境設(shè)施,信息系統(tǒng)故障頻率大幅降低,故障處置效率不斷提升,為重要信息系統(tǒng)安全穩(wěn)定運(yùn)行奠定了堅(jiān)實(shí)的基礎(chǔ)。
2信息化運(yùn)維工作基本情況
信息系統(tǒng)是運(yùn)維主要服務(wù)對(duì)象,信息化基礎(chǔ)設(shè)備、設(shè)施是運(yùn)維工作的基礎(chǔ),集團(tuán)公司目前已經(jīng)對(duì)信息化設(shè)備、設(shè)施和信息系統(tǒng)進(jìn)行了清理,建立了管理臺(tái)賬,并明確了各信息系統(tǒng)的運(yùn)維負(fù)責(zé)單位和運(yùn)維方式。
2.1集團(tuán)公司信息化設(shè)備設(shè)施情況
(1)信息機(jī)房情況集團(tuán)公司共有94處重要信息機(jī)房,其中:集團(tuán)公司數(shù)據(jù)中心(信息機(jī)房)2處,車務(wù)信息機(jī)房58處,機(jī)務(wù)信息機(jī)房6處,車輛信息機(jī)房5處,工務(wù)信息機(jī)房10處,電務(wù)信息機(jī)房4處,房產(chǎn)信息機(jī)房3處,客運(yùn)信息機(jī)房3處,供電信息機(jī)房3處。
(2)重要信息系統(tǒng)情況集團(tuán)公司目前正在應(yīng)用的重要信息系統(tǒng)共299個(gè),其中235個(gè)信息系統(tǒng)由信息技術(shù)所運(yùn)維,其余由站段負(fù)責(zé)運(yùn)維。
(3)信息設(shè)備情況集團(tuán)公司信息機(jī)房部署設(shè)備共計(jì)1498臺(tái),其中小型機(jī)和服務(wù)器629臺(tái)、存儲(chǔ)108臺(tái)。各站段部署設(shè)備共計(jì)2769臺(tái),其中小型機(jī)和服務(wù)器557臺(tái)、存儲(chǔ)20臺(tái)。
2.2集團(tuán)公司信息系統(tǒng)運(yùn)維體系
集團(tuán)公司信息系統(tǒng)由集團(tuán)公司、站段兩級(jí)負(fù)責(zé)運(yùn)行維護(hù),日常維護(hù)工作按照職責(zé)分工分級(jí)負(fù)責(zé),信息技術(shù)所負(fù)責(zé)集團(tuán)公司級(jí)信息系統(tǒng)運(yùn)行維護(hù)工作,站段負(fù)責(zé)本單位信息系統(tǒng)日常維護(hù)工作。
2.3集團(tuán)公司運(yùn)維工作情況
信息系統(tǒng)運(yùn)維工作采用信息部門自行維護(hù)和委外維護(hù)相結(jié)合的方式。
(1)硬件設(shè)備采取三種方式進(jìn)行維護(hù)小型機(jī)、重要服務(wù)器、存儲(chǔ)、核心交換機(jī)、UPS、空調(diào)等采取委外運(yùn)維方式,由專業(yè)維保商進(jìn)行維護(hù);部分服務(wù)器、終端、打印機(jī)采取故障修方式,由維修公司進(jìn)行維修;其余設(shè)備采用自主維修維護(hù)或者設(shè)備故障更換方式。
(2)系統(tǒng)軟件采取兩種方式進(jìn)行維護(hù)對(duì)于重要信息系統(tǒng)數(shù)據(jù)庫(kù)采用委外維護(hù)方式,由維保商進(jìn)行維護(hù);操作系統(tǒng)、中間件和非核心系統(tǒng)數(shù)據(jù)庫(kù)采用自主維護(hù)方式,由信息技術(shù)所和站段運(yùn)維人員自主維護(hù),信息技術(shù)所對(duì)站段提供技術(shù)支持。
(3)應(yīng)用軟件采用三種方式進(jìn)行維護(hù)部分重要信息系統(tǒng)采用委外維護(hù)方式,由維保商進(jìn)行維護(hù);部分系統(tǒng)由系統(tǒng)研發(fā)單位負(fù)責(zé)免費(fèi)維護(hù);其余采取自主維護(hù)方式,由信息技術(shù)所和站段運(yùn)維人員負(fù)責(zé)維護(hù),信息技術(shù)所對(duì)站段提供技術(shù)支持。
3系統(tǒng)運(yùn)維工作存在的不足
集團(tuán)公司信息化工作基本保持平穩(wěn)有序,近三年來(lái)未出現(xiàn)重大運(yùn)維安全故障,較好的保障了集團(tuán)公司各項(xiàng)業(yè)務(wù)的開展,但運(yùn)維工作仍然存在一些不足,有很大的改進(jìn)空間。
(1)運(yùn)維規(guī)章制度落實(shí)不徹底信息系統(tǒng)運(yùn)維管理辦法沒(méi)有得到有效執(zhí)行,雖然制定了年度運(yùn)維計(jì)劃,但沒(méi)有起到應(yīng)急演練作用,僅僅隨著施工進(jìn)行局部演練,同時(shí)信息系統(tǒng)故障存在隱匿不報(bào)現(xiàn)象,這些都給信息系統(tǒng)運(yùn)維工作帶來(lái)安全隱患。
(2)信息設(shè)備部署過(guò)于分散當(dāng)前信息化設(shè)備部署分散情況非常普遍,基本每個(gè)基層站段都有信息機(jī)房,都有專人維護(hù),由于機(jī)房過(guò)多,造成部分機(jī)房質(zhì)量不達(dá)標(biāo),不能滿足信息化設(shè)備運(yùn)行的基本條件,同時(shí)信息技術(shù)所機(jī)房存在大量空閑空間,因此優(yōu)化信息化設(shè)備部署結(jié)構(gòu)是今后一個(gè)時(shí)期的重點(diǎn)工作。
(3)運(yùn)維人員能力無(wú)法滿足需求隨著信息系統(tǒng)在集團(tuán)公司業(yè)務(wù)領(lǐng)域的應(yīng)用不斷深入,規(guī)模逐步擴(kuò)大,對(duì)運(yùn)維人員的專業(yè)水平要求越來(lái)越高,目前運(yùn)維人員不能完全掌握相關(guān)專業(yè)知識(shí),無(wú)論是小型機(jī)、服務(wù)器等硬件,還是數(shù)據(jù)庫(kù)、中間件等系統(tǒng)軟件,甚至旅服系統(tǒng)、防災(zāi)系統(tǒng)、客票系統(tǒng)等應(yīng)用軟件都依賴外部維保商提供運(yùn)維服務(wù),對(duì)維保商的依賴性極強(qiáng),核心系統(tǒng)運(yùn)維不掌握在自己手中,給我們的信息系統(tǒng)運(yùn)維工作帶來(lái)極大困難。
(4)交付運(yùn)維環(huán)節(jié)存在欠缺現(xiàn)行信息系統(tǒng)在投入運(yùn)用、交付運(yùn)維方面存在問(wèn)題,信息工程竣工驗(yàn)收和信息系統(tǒng)研發(fā)完成交付運(yùn)維單位運(yùn)行維護(hù)前,普遍存在竣工資料和交接手續(xù)不完善,項(xiàng)目文檔資料嚴(yán)重缺失,缺少必要的培訓(xùn),系統(tǒng)存在安全隱患等問(wèn)題,給后期系統(tǒng)維護(hù)及日常管理工作造成很大困難,運(yùn)維單位缺乏網(wǎng)絡(luò)拓?fù)鋱D、系統(tǒng)構(gòu)成圖、機(jī)房配線圖、軟件維護(hù)手冊(cè)等資料,無(wú)法高質(zhì)量開展運(yùn)維工作,給信息系統(tǒng)安全運(yùn)行帶來(lái)威脅。
(5)對(duì)站段業(yè)務(wù)指導(dǎo)不夠信息技術(shù)所承擔(dān)對(duì)基層站段的信息化專業(yè)指導(dǎo)職能,但隨著武清數(shù)據(jù)中心的啟用和鐵科院承擔(dān)鐵路主要信息系統(tǒng)研發(fā)職能的轉(zhuǎn)變,信息技術(shù)所對(duì)信息系統(tǒng)的掌握程度逐步下降,且信息系統(tǒng)逐漸增多后,信息技術(shù)所的技術(shù)支持人員力量不足問(wèn)題凸顯,對(duì)站段的技術(shù)指導(dǎo)弱化,不能滿足站段在技術(shù)支持方面的需求,影響信息系統(tǒng)的運(yùn)維質(zhì)量。
(6)運(yùn)行環(huán)境監(jiān)控能力不足信息技術(shù)所的運(yùn)行環(huán)境監(jiān)控能力相對(duì)較好,站段對(duì)信息機(jī)房運(yùn)行環(huán)境日常監(jiān)控能力普遍不足,部分站段信息機(jī)房沒(méi)有環(huán)境監(jiān)控系統(tǒng),機(jī)房日常環(huán)境監(jiān)控主要依靠人工值班巡檢,有環(huán)境監(jiān)控系統(tǒng)的站段也存在運(yùn)用水平不高問(wèn)題,運(yùn)行環(huán)境監(jiān)控問(wèn)題大大降低機(jī)房環(huán)境巡檢質(zhì)量及安全事件應(yīng)急處置能力。
4對(duì)運(yùn)維工作的幾點(diǎn)建議
為了提高集團(tuán)公司信息系統(tǒng)運(yùn)維工作質(zhì)量,有效提升信息系統(tǒng)運(yùn)行穩(wěn)定性,對(duì)信息系統(tǒng)運(yùn)維工作提出七點(diǎn)建議。
(1)從運(yùn)維結(jié)構(gòu)角度推行集中化隨著兩網(wǎng)融合工作的推進(jìn),網(wǎng)絡(luò)帶寬大幅提升,為集團(tuán)公司信息化設(shè)備集中部署創(chuàng)造了網(wǎng)絡(luò)條件。集團(tuán)公司信息技術(shù)所新信息機(jī)房投入運(yùn)用,原有信息機(jī)房空閑大量空間,為信息化設(shè)備集中部署創(chuàng)造了設(shè)備設(shè)施條件。當(dāng)前完全具備將站段信息化設(shè)備上移至集團(tuán)公司信息技術(shù)所機(jī)房的條件,下一步建議把設(shè)備集中部署作為運(yùn)維重點(diǎn)工作,通過(guò)設(shè)備的集中化部署,既可大幅減少站段機(jī)房和運(yùn)維人員數(shù)量,優(yōu)化信息系統(tǒng)運(yùn)維結(jié)構(gòu),實(shí)現(xiàn)信息化運(yùn)維集約化管理,又可利用信息技術(shù)所標(biāo)準(zhǔn)化機(jī)房和運(yùn)維人員專業(yè)能力強(qiáng)的客觀優(yōu)勢(shì),提升設(shè)備運(yùn)行環(huán)境和運(yùn)維質(zhì)量,提高信息系統(tǒng)運(yùn)行穩(wěn)定性。
(2)從運(yùn)維管理角度推行臺(tái)帳化信息系統(tǒng)運(yùn)維的基礎(chǔ)是設(shè)備、設(shè)施、網(wǎng)絡(luò)、電源的底數(shù)要清晰,信息化設(shè)備種類較多,不同設(shè)備的檢查、維護(hù)周期不同,需要對(duì)信息化設(shè)備建立設(shè)備臺(tái)賬和巡檢臺(tái)賬,對(duì)信息化網(wǎng)絡(luò)建立拓?fù)鋱D和配線圖,對(duì)機(jī)房機(jī)架建立設(shè)備部署示意圖,對(duì)電源、UPS、PDU建立布線圖和檢修臺(tái)賬,對(duì)動(dòng)環(huán)系統(tǒng)建立巡檢臺(tái)賬,這些是信息化運(yùn)維的基礎(chǔ)性工作。建議對(duì)運(yùn)維進(jìn)行臺(tái)賬化管理,建立信息化運(yùn)維管理信息系統(tǒng),實(shí)施信息化設(shè)備設(shè)施的全面信息化管理,對(duì)設(shè)備的型號(hào)、配置參數(shù)、廠商、運(yùn)維方式、維保商、巡檢記錄、維修記錄、故障應(yīng)急方案等進(jìn)行全面管理,從而為運(yùn)維工作奠定堅(jiān)實(shí)基礎(chǔ)。
(3)從設(shè)備應(yīng)用角度推行虛擬化集團(tuán)公司現(xiàn)有信息化設(shè)備4000余臺(tái),其中服務(wù)器、小型機(jī)和存儲(chǔ)設(shè)備1200余臺(tái),這些設(shè)備需要大量的機(jī)房空間并配合雙路電源、空調(diào)以滿足設(shè)備運(yùn)行需求,對(duì)集團(tuán)公司無(wú)論是投資還是運(yùn)維都是較大負(fù)擔(dān),而且這些設(shè)備平時(shí)使用率往往低于10%,存在大量浪費(fèi)情況。虛擬化和私有云平臺(tái)是提高設(shè)備利用率、減少設(shè)備使用量的有效方式。集團(tuán)公司采用小型機(jī)虛擬化技術(shù),1臺(tái)小型機(jī)可以虛擬出4至8臺(tái)小型機(jī),采用服務(wù)虛擬化技術(shù),1臺(tái)服務(wù)器可以虛擬出16至32臺(tái)服務(wù)器,不僅有效節(jié)省了集團(tuán)公司有限的信息化投資,而且節(jié)省了大量機(jī)房和配套設(shè)施,建議加大虛擬化云平臺(tái)建設(shè)力度,充分利用私有云技術(shù)打造集團(tuán)公司云數(shù)據(jù)中心。
(4)從日常維護(hù)角度推行平臺(tái)化各信息部門需要運(yùn)維的設(shè)備和系統(tǒng)數(shù)量較大,而且隨著信息系統(tǒng)不斷整合,系統(tǒng)越來(lái)越復(fù)雜,如果還依賴傳統(tǒng)的人工巡檢方式已經(jīng)很難滿足信息系統(tǒng)運(yùn)維要求。建議建設(shè)集團(tuán)公司信息系統(tǒng)運(yùn)維管理平臺(tái),采用成熟技術(shù)將日常巡檢、運(yùn)行狀態(tài)監(jiān)控、故障監(jiān)控、性能監(jiān)控、資源監(jiān)控、運(yùn)行環(huán)境監(jiān)控等大量重復(fù)性工作由過(guò)去的人工執(zhí)行逐步轉(zhuǎn)變?yōu)樽詣?dòng)化操作,實(shí)現(xiàn)自動(dòng)報(bào)警,從而做到及時(shí)發(fā)現(xiàn)問(wèn)題,減少運(yùn)維中的延遲,降低故障發(fā)生幾率,減少故障處置時(shí)間。同時(shí)運(yùn)維管理平臺(tái)應(yīng)具備運(yùn)維知識(shí)庫(kù)功能,將歷史故障處理案例進(jìn)行詳細(xì)描述和記載,為后續(xù)信息化設(shè)備故障處理提供參考,提高運(yùn)維工作效率。
(5)從故障處理角度推行清單化重要信息系統(tǒng)都建立了應(yīng)急預(yù)案,對(duì)信息系統(tǒng)的故障處理有詳細(xì)的處理流程,可以在故障發(fā)生時(shí)按照預(yù)案進(jìn)行處置,但預(yù)案一般更強(qiáng)調(diào)故障處理過(guò)程,對(duì)故障處理的具體操作指導(dǎo)性不強(qiáng),當(dāng)故障發(fā)生時(shí),運(yùn)維人員往往比較緊張,容易犯一些常見錯(cuò)誤,給故障處理帶來(lái)不必要的損失。建議借鑒外科手術(shù)清單方式,給每個(gè)信息系統(tǒng)建立故障處理清單,清單按照“簡(jiǎn)單至上”原則列出故障處置的步驟和注意事項(xiàng),并確定故障處置核對(duì)人,在運(yùn)維人員進(jìn)行故障處置時(shí),一方面可以提醒運(yùn)維人員不要錯(cuò)過(guò)關(guān)鍵步驟,另一方面有專人核對(duì)提醒,避免由于處置不當(dāng),而將故障人為放大,錯(cuò)過(guò)故障處理最佳時(shí)機(jī)。
(6)從人員能力角度推行專業(yè)化現(xiàn)階段信息系統(tǒng)運(yùn)維人員一般都是系統(tǒng)的開發(fā)或者實(shí)施人員,這些人參與了系統(tǒng)的研發(fā)建設(shè),對(duì)系統(tǒng)比較熟悉,能夠勝任運(yùn)維工作,但是研發(fā)人員往往承擔(dān)多項(xiàng)任務(wù),隨著多年來(lái)不斷參與研發(fā),需要負(fù)責(zé)運(yùn)維的項(xiàng)目會(huì)很多,造成沒(méi)有精力負(fù)責(zé)所有系統(tǒng)的維護(hù),一方面造成對(duì)負(fù)責(zé)運(yùn)維的系統(tǒng)維護(hù)不及時(shí),另一方面也由于精力分散而不能全力投入應(yīng)用軟件研發(fā)工作中,弊端很大。建議推行專業(yè)化運(yùn)維隊(duì)伍建設(shè),負(fù)責(zé)研發(fā)的人員僅負(fù)責(zé)研發(fā)和系統(tǒng)功能性升級(jí),將日常運(yùn)維工作交由專業(yè)運(yùn)維人員負(fù)責(zé),研發(fā)轉(zhuǎn)運(yùn)維階段通過(guò)詳細(xì)的交接文檔和專項(xiàng)培訓(xùn),確保運(yùn)維人員具備系統(tǒng)運(yùn)維能力,通過(guò)推行運(yùn)維人員專業(yè)化,一方面可以將研發(fā)人員從日常運(yùn)維工作中解放出來(lái),專心從事研發(fā)工作,另一方面運(yùn)維人員可以負(fù)責(zé)多個(gè)項(xiàng)目的維護(hù)工作,做到分工負(fù)責(zé)、各司其職,提高運(yùn)維工作質(zhì)量。(7)從應(yīng)急指揮角度推行調(diào)度化重要信息系統(tǒng)一旦出現(xiàn)故障,需要組織多方面的力量進(jìn)行應(yīng)急處置,信息部門按照應(yīng)急預(yù)案啟動(dòng)應(yīng)急程序,調(diào)動(dòng)相關(guān)人員判斷故障原因,甚至需要請(qǐng)行業(yè)專家參與故障排查,進(jìn)行必要的處置,業(yè)務(wù)管理部門啟動(dòng)專業(yè)應(yīng)急方案,組織人員脫離信息系統(tǒng)進(jìn)行業(yè)務(wù)組織,這個(gè)過(guò)程是緊張且時(shí)間緊迫的,需要各部門做好協(xié)調(diào)。一旦故障排除,也需要信息部門確認(rèn)并第一時(shí)間通知業(yè)務(wù)部門,其間一旦溝通協(xié)調(diào)不到位,就會(huì)發(fā)生應(yīng)急指揮失誤,造成業(yè)務(wù)損失和經(jīng)濟(jì)損失。建議建立信息系統(tǒng)應(yīng)急調(diào)度指揮機(jī)制,通過(guò)統(tǒng)一的調(diào)度管理,實(shí)現(xiàn)運(yùn)維人員、應(yīng)急資源、應(yīng)急協(xié)調(diào)的統(tǒng)一指揮,并指揮進(jìn)行統(tǒng)一應(yīng)急評(píng)估,啟動(dòng)應(yīng)急預(yù)案等工作,通過(guò)統(tǒng)一調(diào)度,使信息系統(tǒng)故障應(yīng)急工作有序開展。
5結(jié)束語(yǔ)
信息系統(tǒng)運(yùn)維是信息系統(tǒng)應(yīng)用的重要組成部分,決定信息系統(tǒng)應(yīng)用效果,如果沒(méi)有運(yùn)維好,建得再好的系統(tǒng)也產(chǎn)生不了業(yè)務(wù)價(jià)值。因此需要信息技術(shù)部門高度重視信息系統(tǒng)運(yùn)維工作,通過(guò)加強(qiáng)信息系統(tǒng)運(yùn)維,提高系統(tǒng)運(yùn)行穩(wěn)定性,降低系統(tǒng)故障發(fā)生率,縮短故障處置時(shí)間,并以適當(dāng)方式建立應(yīng)急備份和容災(zāi)系統(tǒng),保障信息系統(tǒng)不間斷運(yùn)行,加強(qiáng)信息系統(tǒng)對(duì)集團(tuán)公司各項(xiàng)業(yè)務(wù)的支持和保障,為集團(tuán)公司各項(xiàng)業(yè)務(wù)開展提供優(yōu)質(zhì)、穩(wěn)定的信息化服務(wù)。
作者:劉其韜 陳國(guó)劍 單位:中國(guó)鐵路哈爾濱局集團(tuán)有限公司數(shù)據(jù)分析中心