국방품질연구회(DQS)가 전하는 품질 인사이트
DQS 매거진
빅데이터 분석을 통한 국방품질경영
2022. 03. 30
글. 창원대학교 산업시스템공학과 김흥섭 교수
빅데이터의 정의
빅데이터(Big data)는 사물인터넷(IoT), 인공지능(AI: Artificial intelligence), 블록체인(Blockchain), 3D 프린팅 등과 함께 4차 산업혁명의 핵심 원동력으로 인식되고 있으며, 이에 따라 최근 많은 관심이 집중되고 있는 분야이다. 하지만 빅데이터를 단순히 규모적 측면에서의 대용량 데이터셋(Dataset)을 지칭하는 용어로 오해하는 경우가 빈번하다. 빅데이터(Big data)의 보다 정확한 정의는 “기존의 데이터 관리, 분석 도구(소프트웨어 등)의 능력을 넘어서는 수십 TeraByte(TB) 이상의 대용량 데이터셋으로부터 가치를 추출하고 결과를 분석하는 기술”이다. 즉, 빅데이터를 저장, 관리, 분석하고 시각화(Visualization)하는 기술 등을 포괄하는 개념이다. 또한, 빅데이터의 개념은 그림 1과 같이 데이터 특성에 기반한 3V(Volume, Variety, Velocity)에서 진실성(Veracity)과 가치(Value)가 추가된 5V, 그리고 최근에는 유효성(Validity)과 휘발성(Volatility)을 포함하여 7V로 지속 확장되고 있다. 여기서, 정확성(Validity)은 데이터 상에 오류(Error)가 없어야 한다는 개념이다. 진실성과 구분이 모호할 수 있어 예를 들자면, 임의의 고양이 사진이 기술적 결함에 의해 잡음(Noise)이 포함되어 고양이를 인식할 수 없다면 진실성이 저하된 데이터이며, 고양이 사진을 강아지로, 강아지 사진을 고양이로 명시한 데이터는 정확성이 저하된 것이다. 휘발성(Volatility)은 데이터가 얼마나 오래 저장될 수 있고 타당하여 오랫동안 활용될 수 있는지에 대한 특징으로, 단기적으로 활용하기 보다는 장기적인 관점에서 유용한 가치를 창출할 수 있어야한다는 의미이다.
빅데이터 분석 기획
국방품질경영에서 성공적인 빅데이터 활용을 위해서는 치밀한 빅데이터 분석 기획부터 시작하여야 한다. 또한, 빅데이터 분석을 위해 ① 분석대상의 발굴 및 구체화, ② 다양한 데이터 원천의 통합/활용, ③ 분석 운영관리체계의 정규화, ④ 데이터 기반 의사결정 문화 정착, ⑤ 빅데이터 요소 기술(수집, 저장, 공유, 처리, 분석 및 시각화)에 대한 역량이 준비되어야 한다. 빅데이터 분석 기획은 실제 분석을 수행하기에 앞서 분석과제를 정의하고, 빅데이터 분석의 목적을 달성하기 위한 최적의 전략을 사전에 계획하는 작업으로, 위와 같은 빅데이터 활용의 선행조건들을 해결하기 위한 분석 질문, ICT 거버넌스, 데이터, 역량, 프로세스, 문화 등 전반에 걸친 구체화된 방안을 수립하는 것이다. 빅데이터 분석 기획에서 자주 활용되는 ‘질문 먼저(Question first)’ 방법은 빅데이터 분석의 목적, 즉, 의사결정을 위해 필요한 질문들을 먼저 정의하고, 각 질문들에 대한 정보를 추출하기 위해 필요한 데이터, 분석 방법론 등이 무엇인지를 정의하는 방식이다.
빅데이터 활용 방안(예시)
군수품 품질정보 분석/관리
국방품질경영은 무기체계, 부품 등의 군수품에 대해 소요군의 주요 요구성능을 정확히 파악하고, 개발 및 양산 단계에서 목표한 성능이 발휘될 수 있도록 품질향상을 도모하기 위한 제반 활동이다. 품질경영 활동들을 효과적으로 수행하기 위해서는 현재의 실태를 정확하게 파악하고, 식별된 문제점들을 지속적으로 개선해 나가는 것이 중요하다. 이때, 군수품 품질에 관련된 데이터는 객관적이고 정확한 현실태 파악에 중요한 재료가 된다. 또한, 4차 산업혁명의 화두로 최근 활발히 연구되고 있는 기계학습(Machine learning)을 포함한 데이터 과학(Data science) 분야의 발전으로 정형, 비정형데이터의 수집, 저장, 융합, 분석 등을 위한 다양한 방법론이 등장하고 있다. 특히, 기존에는 활용이 제한되었던 방대한 양의 보고서, 이미지 등과 같은 비정형 데이터를 분석하기 위한 방법론도 다양하게 제공되고 있다. 비정형 데이터가 정형 데이터보다는 분석 난이도가 높으나, 분석을 통해 얻을 수 있는 정보량은 많은 것으로 판단하고 있다.
정형 데이터에 대해서는 이미 활용도가 높을 것으로 예상되기에 텍스트 마이닝(Text mining), 자연어처리(NLP: Natural language processing)와 같은 기술을 이용하여 보고서와 같은 비정형 데이터의 활용 방안에 대해 살펴보고자 한다. 첫 번째 예시로는, 대부분의 메일 시스템이 채용하고 있는 스팸 메일 필터링 알고리즘을 응용하여 군수품 사용자 불만 보고서와 같은 민원 보고서 상의 주요 키워드들을 통해 담당자를 자동으로 분류하고 알림을 제공하는 시스템이다. 이러한 시스템은 품질 민원에 대한 처리시간 단축에 기여할 것이다. 두 번째는, 그림 2와 같이 수많은 보고서에 등장하는 키워드들에 대한 네트워크 분석(Network analysis)을 통해 각종 품질 키워드 간의 관련성, 중심적인 품질 문제, 그리고 주요 관리대상(무기체계, 부품 등) 파악 등 다양한 정보를 추출하여 활용할 수 있다. 세 번째로는, 토픽 모델링(Topic modeling)과 미래신호탐지(Future sign detection) 기법을 이용해 잠재적 품질 문제를 예측하고, 선제적으로 대응하는 것이다. 즉, 그림 3에서 약신호(Weak signal)에 관심을 갖는 것이다. 약신호란 미래 변화를 예상할 수 있는 특이(Oddities)하면서 이상한(Strange) 이슈를 의미한다. 대부분의 품질 문제 분석에서는 발생 빈도가 높은 강신호(Strong signal)에 집중하는 경향이 있다. 물론, 현재의 문제는 강신호를 통해 식별이 가능하다. 하지만 약신호는 미래에 강신호로 성장할 수 있는 문제에 대해 선제적으로 대응할 수 있는 기회를 제공할 것이다. 마지막으로, 위와 같은 보고서 등의 텍스트 분석에 있어 최근의 자연어처리(NLP) 기술을 이용면, 동의어, 동음이의어 처리 등의 정확성을 향상시킬 수 있다.
무기체계 신뢰성 설계
신뢰도(Reliability)란 임의의 시스템이 주어진 환경에서 계획된 기간 동안 의도한 목적의 기능을 정상적으로 발휘할 확률을 의미하며, 시스템의 가용도(Availability)와 운영유지비용에 직접적으로 영향을 미치기 때문에 다양한 산업분야의 시스템 설계에서 중요한 척도로 고려되고 있다. 일반적으로, 시스템의 신뢰도를 향상시키기 위해 ① 사용된 부품의 신뢰도를 향상시키거나, ② 부품을 병렬적으로 중복 설계(Redundant design), ③ 활성 중복(Active redundancy)과 대기 중복(Standby redundancy) 등의 중복 전략의 선택적 적용 등과 같은 방법들이 적용되고 있다. 여기서, 현재까지의 신뢰도 최적 설계에 대한 한계점을 생각해볼 수 있다. 신뢰도 설계에 대한 대부분의 연구에서는 시스템의 모든 구성품들의 작동 시간이 시스템의 운영시간과 동일한 것으로 가정하고, 위와 같은 방법들을 적용하여 적절하게 적용하고 있다. 다만, 단계적 임무시스템(PMS: Phased mission system)에서는 각 임무 단계에서 사용되는 구성품들이 상이하고, 단계별 임무들은 수행 시간과 주기가 사전에 결정되어 있는 것으로 가정한다.
하지만 대부분의 무기체계들은 다양한 기능들을 수행하는 수많은 부체계의(Subsystems)의 복합체, 즉, 다기능 시스템(Multi-functional system)이며, 그림 4와 같이 각각의 기능 수행에는 각기 다른 부체계들이 사용된다. 또한, 각 기능의 수행 시간과 주기는 사전에 결정될 수 없는 확률적인 요소이다. 예를 들어, 작전에 투입되는 전차의 임무 수행 절차를 간단하게 살펴보면, 전차는 작전지역으로 이동을 위해 기동을 하고, 작전지역에 도착하면 표적을 탐지하고 사격을 통해 작전을 마무리하게 된다. 이때, 기동, 표적 탐지, 그리고 사격이라는 임무(기능)를 수행하는 동안 모두 다른 부체계들이 사용이 될 것이다. 또한, 각각의 임무 수행 빈도와 소요 시간은 전차별, 작전부대별 모두 상이할 것이이며, 이는 각각의 임무를 위한 부체계들의 작동 빈도와 시간의 차이로 이어진다.
이와 같은 환경에서, 현재까지의 신뢰도 설계 개념과 같이 모든 부체계의 작동시간을 무기체계의 운용시간과 동일하게 고려하는 경우, 사용 빈도(시간)가 낮은 부체계에는 신뢰도 자원(비용 등)이 과다하게 할당된 것이다. 따라서 무기체계 운용에 대한 빅데이터를 통해 추정되는 각각 의 기능들의 사용 빈도와 시간을 무기체계 신뢰도 설계에 반영한다면, 신뢰도 자원을 효율적으로 배분하여 보다 높은 신뢰도를 달성할 수 있을 것이다. 이는 앞서 언급한 바와 같이 무기체계 가용도 향상과 운영유지비 절감에 기여할 것이다.
무기체계 예지정비 시스템
무기체계의 가동률은 전투준비태세, 작전/훈련, 군수(정비) 등 군 운영의 전반에 영향을 미치게 된다. 따라서 군은 무기체계의 고장을 유발할 수 있는 요소들을 정확하게 파악하고, 효과적으로 대응하기 위해 노력해오고 있다. 이와 관련하여 실제 고장이 발생하기 전에 문제 요소를 식별/조치하는 예방정비(Preventive maintenance) 개념은 그림 5에서와 같이 정기정비(Time base maintenance), 상태기반정비(CBM: Condition base maintenance), 그리고 현재 가장 진보된 기술로 인식되고 있는 예지정비(PdM: Predictive maintenance)로 발전하고 있다. 정기 정비는 사전에 정해진 주기(운용시간, 주행거리, 비행시간 등)에 따라 무기체계의 중요 항목을 점검하고, 부품을 교체하거나 정비하는 방식이다. 이에 따라 부품의 상태와 무관하게 교체하는 등 과잉 정비 가능성이 높다. 이를 보완한 개념인 상태기반정비(CBM)는 사전에 분석된 고장의 초기 단계 징후를 포착하여 실제 고장이 발생하기 전에 대응하는 개념이다.
즉, 부품의 피로(Fatigue) 누적 등 고장 진행에 대한 물리적 증거를 바탕으로 고장 직전의 신호 탐지에 집중한다. 예지정비(PdM)를 센서를 기반으로 시스템의 상태를 지속 모니터링하는 개념에서 상태기반정비(CBM)의 발전된 형태로 보는 관점도 존재한다. 하지만, 데이터 분석 목적 관점에서, 상태기반정비(CBM)의 고장 징후 감지는 이상치 탐지(Outlier detection) 또는 정상/비정상을 분류(Classification)하는데 목적을 두고 있다면, 예지정비(PdM)는 고장 징후보다는 임의 시스템 또는 구성품의 잔여 수명(Residual lifetime)을 예측(Prediction)하고, 예고된 고장 원인을 분석하여 대응 방안을 제시하는 것까지를 포함한다.
예지정비(PdM) 서비스의 대표적 사례로는, GE(General Electric)사의 발전용 가스터빈, 롤스로이스(Rolls-royce)사의 항공기 엔진 원격 모니터링 및 진단, 유지보수 서비스가 있다. GE사는 세계 58개국 502개 발전소의 발전용 가스터빈 1,500기에 기당 약 400개 이상의 소음, 진동, 온도 등의 센서를 통해 수집되는 가동 데이터를 기반으로 문제예측 및 조기경보시스템 서비스를 운영하고 있다. 또한, 롤스로이스사는 약 500개 항공사의 항공기 엔진 1,400기에 기당 약 100개의 센서를 부착하여 매일 6.5만 시간 분량의 가동 데이터를 수집하고 있으며, 수집된 데이터는 영국 더비 중앙제어센터로 전송된다. 중앙제어센터의 약 200명의 엔지니어들은 전송된 데이터의 분석을 통해 각 항공기가 위치한 공항 서비스팀에게 원격 예지정비(PdM) 서비스를 제공하고 있다.
이와 같은 사례를 바탕으로, 우리 국방분야에는 그림 6과 같은 무기체계 예지정비(PdM) 서비스 구조가 추천된다. 성공적인 무기체계 예지정비 플랫폼 구축을 위해서는 데이터 전문가 그룹과 현장 전문가 그룹의 유기적인 협력이 필요하다. 따라서 국방 연구기관(국방기술품질원, 국방과학연구소 등)과 체계종합(SI: System Integration) 기업에서 데이터 사이언티스트, 데이터 엔지니어, 데이터 분석가, 어플리케이션 개발자 등 데이터 전문가 그룹을 조직하고, 무기체계를 운용하는 야전부대들이 현장 전문가 그룹의 역할을 수행하는 것이다. 또한, 예지정비 플랫폼은 개발/배포된 이후에도 야전 운용 데이터를 바탕으로 지속적인 업데이트 및 유지보수가 이루어져야 한다.
결론
4차 산업혁명이라는 키워드와 함께 최근 빅데이터 활용에 대한 관심이 급부상하고 있다. 데이터는 우리 주변에서 일어난 일들을 기록한 사료이다. 즉, 빅데이터에 대한 관심은 우리가 역사를 공부한 이유와 같이 이제는 빅데이터를 통해 현재를 이해하고, 지혜를 얻고자 하는 노력이라고 할 수 있다. 또한, 이러한 노력은 빅데이터를 축적하고 관리할 수 있는 하드웨어의 발전과 데이터 분석을 통해 유용한 정보를 추출할 수 있는 방법론과 소프트웨어적 발전으로 현실화가 가능하게 되었다. 이에 따라 국방품질경영 분야에서도 빅데이터를 활용하기 위해 적극적으로 노력하고 있다. 이러한 노력에 조금이라도 도움이 되고자 본 기고문을 집필하였지만, 많은 부족함이 있다. 다만, 본 기고문을 통해 국방품질경영 분야의 현장 전문가들이 빅데이터를 조금 더 이해하고, 현장에서 빅데이터 응용 분야를 보다 적극적으로 탐색/발굴하는 동기가 되기를 기대한다.
- 참고문헌
-
- 1. 서석준, 김흥섭, 빅데이터 기반 시스템의 사용 패턴을 고려한 신뢰도 최적 설계 프레임워크, 신뢰성응용연구, 제22권, 제1호, pp.97-109, 2022
- 2. 송영화, 이수정, 키워드 네트워크 분석을 활용한 의료자동화 산업 연구동향 분석, 경영교육연구, 제33권, 제2호, pp.225-242, 2018
- 3. IDG Korea, 머신러닝 기반 예지 정비 플랫폼 구축 가이드, IDG Tech Insight, pp.1-10, 2020