지난해 발생한 굵직했던 금융기관 전산장애는 여덟 차례. 지난 1월에는 우리은행 전 지점의 창구업무가 6시간이나 마비되는 초유의 사태도 발생했다. 금융권의 전산장애는 올해에도 끊이질 않을 것이라는 불안감이 커지고 있다. 왜 전산장애는 반복되고 있을까.
 소기업을 운영하고 있는 김모씨(43)는 얼마 전 거래처에 급하게 부품 구매 대금을 송금하려다 낭패를 겪었다. 이는 김씨가 은행 인터넷뱅킹을 이용해 송금하려 했는데 전산장애로 인해 인터넷뱅킹이 중단됐기 때문이다. 급한 마음에 다른 거래 방법을 이용하려 했으나 모두 이뤄지지 않았다. 결국 김씨는 근처 영업점을 찾아가 오랜 시간을 기다려 송금을 해야 했다.

 한모씨(73)는 올해 초 친구들과의 점심식사 값을 내려고 자식들이 보낸 준 용돈을 찾으려 한 은행 영업점 창구를 들렀다가 전산장애로 인해 창구업무가 중단됐다는 소리를 듣고 당황해 했다. 한씨는 늘 창구를 통해 돈을 넣거나 찾았기 때문에 그 외의 방법은 잘 알지 못했다. 더욱이 한씨는 카드를 갖고 있지 않아 통장으로 ATM(자동화기기)을 이용해 돈을 찾아야 했지만 이 역시 창구에 먼저 신청을 해야 가능한 것이기 때문에 ATM을 통해서 돈을 찾을 수가 없었다. 결국 이날 한씨는 친구들에게 점심을 사겠다는 약속을 지키지 못하게 됐고 미안한 마음으로 친구들과 헤어져야 했다.

 금융기관들은 매년 많게는 수천억원에서 작게는 수백억원대의 전산투자 비용을 집행하고 있다. 그럼에도 전산 시스템장애로 인한 업무 중단 사고는 꾸준히 발생하고 있다. 더욱이 인터넷뱅킹 등 전자금융 거래 사용비율이 창구거래를 앞지르고 있는 상황에서 전산 시스템장애는 심각한 문제를 야기시키고 있다.

 이러한 문제는 금융거래를 이용하는 소비자들에게 비용·시간 낭비와 불쾌감까지 일으키게 하는 불편함을 초래하고 은행에게는 막대한 비용손실과 대외 신뢰도 하락이라는 엄청난 타격을 가져다준다.

 실제 전산장애로 인한 은행 업무중단은 불과 얼마 전인 지난 1월20일 우리은행에서 일어났다. 이 외에도 국민, 조흥, 외환은행 등 대부분의 시중은행과 금융결제원, 한국은행 등 금융기관에서 일어난 바 있다.



 급변하는 IT환경 못 따라잡는 인력

 지난 1월 우리은행은 전산장애로 인해 창구업무가 6시간 동안 전면 중단됐다. 이로 인해 우리은행은 피해를 본 고객에게 2800여만원을 보상했다.

 이처럼 실제적인 비용 손실과 대외 이미지 추락을 가져다주는 금융기관의 전산 시스템장애는 무엇보다도 인력에 의한 문제가 가장 크다고 전산 전문가들은 지적하고 있다. 이는 금융기관 전산 시스템이 급변하는 금융환경에 맞춰 복잡해지고 다양해지는 반면 시스템 운영인력들은 그러한 환경을 따라가지 못하고 있기 때문이라는 것이다.

 우리나라의 금융환경은 외환위기 이후부터 급변하기 시작했다. 많은 시중 은행들의 M&A(인수합병), 융·복합화에 따른 업무 확대, 치열한 은행 간의 무한경쟁 등이 시작되게 됐다. 이에 따라 전산 시스템들도 여러 차례 시스템 업그레이드가 진행됐고 신규 시스템 개발이 이뤄지는 등 크고 작은 전산 프로젝트들이 수행되기 시작했다.

 이처럼 전산 프로젝트들이 많아지자 과거 내부 인력 중심으로 이뤄지던 개발이 2000년대부터는 외부 전문 IT업체 인력에 의한 개발 위주로 전환됐다. 이러한 외부업체 인력을 통한 시스템 개발이 시스템 구축 이후 운영상에 있어 가장 큰 문제라고 전문가들은 지적한다.

 즉, 시스템 개발 및 구축이 외부업체 인력 중심으로 이뤄지다 보니 내부 인력들은 시스템에 대한 이해도가 떨어지게 된다는 것이다. 또 시스템 구축 후 개발을 담당한 외부업체 인력은 본래 소속의 업체로 복귀하게 돼 시스템 운영에 차질이 생기게 된다. 더욱이 외부업체 인력의 잦은 이동으로 인해 시스템을 개발한 인력이 어디에 근무하고 있는지 조차 파악이 안 돼 긴급한 경우 이들을 찾을 수 없는 경우도 허다하다.

 하지만 IT업체들은 외부 업체 인력만의 문제는 아니라고 말한다. 은행 내부의 전산 인력들이 급변하는 추세에 맞춰 도입된 IT신기술과 제품들에 대한 충분한 사전지식과 운영기술을 습득하지 못한 것이 전산장애가 발생되는 원인으로 지적하고 있다. 실제 은행들은 전산부서 직원 대상의 전산 신기술 교육 등을 강화하고 있지만 과다한 업무 등으로 인해 잘 이뤄지지 않거나 미흡한 것으로 파악되고 있다.

 이와 함께 치열한 경쟁 환경으로 인해 잦은 신상품 출시와 타 은행과 경쟁적으로 진행되는 프로젝트 등으로 인한 짧은 구축기간 때문에 적절한 테스트가 이뤄지지 않은 채 가동되는 전산 개발 환경도 문제로 지적되고 있다.   이렇게 짧은 시간에 수행된 변경작업은 핵심 시스템인 주전산 시스템에 영향을 미쳐 장애 발생요인이 되기도 한다.

 최근에 발생된 금융기관의 전산장애는 장애가 최초 발생된 이후 장애 원인을 찾아내는데 적지 않은 시간이 소모되고 있다. 이는 장애 발생 후 복구 시간을 더디게 하고 결국 업무 재개 시간을 지연시켜 장애 발생 금융기관의 큰 문제가 되고 있다.

 이처럼 장애 발생 후 원인을 파악하는데 오랜 시간이 걸리는 가장 큰 이유로 하드웨어(HW)업체와 소프트웨어(SW)업체간, SW업체들끼리의 책임공방 때문이라는 것이 은행권 시스템 운영자의 중론이다.

 실제 HW장애 시 대부분 이중화에 의해 서비스 중단 없이 복구가 완료되고 있지만 이중화에 의해 극복하지 못한 HW장애의 경우 원인 분석이 어렵고 많은 시간이 소요되고 있다.

 여기에 HW업체와 SW업체가 다를 경우 시스템장애에 대해 IT 전체를 조망하지 못하고 부분적 견해만을 가지고 접근하기 때문에 원인분석이 어렵고 복구가 지체되게 된다.

 SW장애일 경우 다양한 회사의 SW로 시스템이 구성되기 때문에 장애 발생 시 정확한 원인분석이 어렵다. 관련 회사들의 부분적인 분석이 완료된 후 전체 원인분석이 이뤄지기 때문에 많은 시간이 걸리고 있다. 특히 최근에는 미리 개발된 패키지SW를 많이 사용하는 추세이기 때문에 패키지 내부 버그에 의한 장애 발생 시 원인 파악이 쉽지 않고 복구 시간도 많이 걸린다.

 또 시스템에서 사용한 각종 SW의 벤더 업체들이 기술정보 공개를 하지 않은 경우도 문제다. 지나친 사용자 편리성 위주의 시스템 개발에 따른 업무 복잡도가 증가한 것도 장애 원인분석이 늦어지는 한 이유라고 시스템 운영자들이 제시하고 있다.

 이밖에도 내부인력의 역량 부족으로 인해 외부 전문 인력에 의존하거나 일부 해외 솔루션의 경우 국내 상주지원 개발자의 분석능력 한계로 외국 개발자를 통해 분석하는 경우도 있어 장애 원인분석이 늦어지고 있다.

 은행의 한 시스템운영 팀장은 “은행이 왜 신기술을 적용해 시스템을 구축했는지에 대해 알고 있지 못한 경우가 많은 것도 문제”라며 “또 시스템 개발자와 운영자가 다른 것도 장애 원인을 알지 못하게 하는 이유”라고 말했다.

 현재 대부분의 은행들은 재해복구 시스템(DRS)을 구축해 전산 시스템 이중화를 갖추고 있지만 정작 필요한 때 제 역할을 하지 못하고 있다.



 전산장애 예방책은 없나

 대부분 은행의 전산시스템 운영 관리자들은 전산장애를 예방하기 위해서는 무엇보다도 내부인력의 장애 감지 및 장애 징후 사전 발견 등의 역량 증대와 시스템 이중화 등을 꼽고 있다.

 시스템 구성 및 네트워크가 복잡해지고 다양해짐에 따라 발생되는 장애를 예방하기 위해서는 자동 장애 감지, 서버 모니터링, 네트워크관리시스템(NMS) 구축 등을 통해 시스템 관리체계를 강화해야 한다는 것이다. 이를 위해서는 전산인력 대상의 교육을 통해 인력 개개인의 역량도 높여야 한다.

 HW 기반 안정성이 메인프레임에 비해 낮아짐에 따라 발생되는 장애에 대해서는 네트워크 및 HW 장비 등에 대한 이중화를 구성하고 백업 시스템 및 재해복구 시스템 구축도 진행해야 한다.

 이밖에도 거래량 증가에 따른 지속적인 적정 규모의 장비 도입과 다양한 프로젝트를 통한 시스템 가동 시 개발단계부터 이행 완료까지 체계적인 품질관리 및 이행분석을 수행해야 한다고 전문가들은 제시하고 있다.

 한 은행 CIO는 “전산장애를 줄이려면 무엇보다도 전산인력 관리에 신경을 써야 한다”며 “전산장애 예방이 곧 인력관리”라고 말했다.