Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1598-4095(Print)
ISSN : 2287-7401(Online)
Journal of The korean Association For Spatial Structures Vol.21 No.3 pp.85-92
DOI : https://doi.org/10.9712/KASS.2021.21.3.85

Understanding Facility Management on Tunnel through Text Mining of Precision Safety Diagnosis Data

Jeong-eun Seo*, Jintak Oh**
*Korea Authority of Land & Infrastructure Safety
**School of Architecture, Kyungil University
* Tel: 053-600-5432 Fax: 053-600-5459 E-mail: jintak5@kiu.kr
August 17, 2021 August 25, 2021 August 27, 2021

Abstract


The purpose of this paper is to understand the key factors for efficient maintenance of rapidly aging facilities. Therefore, the safety inspection/diagnosis reports accumulated in the unstructured data were collected and preprocessed. Then, the analysis was performed using a text mining analysis method. The derived vulnerabilities of tunnel facilities can be used as elements of inspections that take into account the characteristics of individual facilities during regular inspections and daily inspections in the short term. In addition, if detailed specification information and other inspection results(safety, durability, and ease of use) are used for analysis, it provides a stepping stone for supporting preemptive maintenance decision-making in the long term.



터널시설물 점검진단 데이터의 텍스트마이닝 분석을 통한 유형별・지역별 중점 유지관리요소의 이해

서 정 은*, 오 진 탁**
*정회원, 국토안전관리원, 차장, 공학석사
**정회원, 경일대학교 건축학부 조교수, 공학박사

초록


    1. 서론

    국내의 기반 시설물들은 1980~90년대 급속한 산업화 와 함께 집중적으로 건설되었다. 2020년 기준 시설물통 합정보관리시스템(이하 FMS)에 등록되어 있는 기반 시 설물 54,441개 중 30년 이상인 노후 시설물은 9,768개 (17.9%) 이지만 향후 10년 이내에 준공 후 30년 이상 된 시설물은 24,618개(45.2%)로 앞으로 노후 시설물은 급격히 증가할 것으로 추정된다(<Fig. 1>, <Fig. 2>).1) <Table 1>의 최근 들어 지속적으로 발생하는 노후 기반 시설물 관련 사고에서 확인할 수 있듯이 사용연수가 30 년 이상이 넘어가는 노후 시설물에 발생되는 다양한 사 회문제를 대비해야 할 때이기도 하다.

    기반 시설물은 국민 삶의 질을 결정하는 기초이자 경 제 성장의 핵심 공공재이므로 성능 유지를 위해 충분한 관리 비용이 지속적으로 투입되어야 하지만2) 앞서 살펴 보았듯이 노후 시설물의 급증으로 인해 안전성을 확보 하기 위한 충분한 재원 마련과 전문 관리 인력의 확충 이 어렵기 때문에 유지관리 효율화 방안이 강구 되어야 한다.

    특히 점검보고서에 기록된 손상 정보는 해당 시설물 의 공용 중 유지관리 이력을 설명해주며, 발생할 수 있 는 손상을 사전에 예측하고 이를 미리 방지하기 위한 대 책을 세우는 데 활용될 수 있다.3)

    점검보고서에 포함된 손상 정보를 수집, 분석, 활용하 는 것은 국내외적으로 많은 관심을 끌고 있으며,4),5),6) 효 율화 방안의 일환으로 디지털 정보 기반의 효율적인 유 지관리 기술이 필요하지만 국내의 데이터는 안전점검 및 진단 결과가 비정형 데이터인 PDF 텍스트 형태로 관 리되고 있어 데이터 활용이 어려운 실정이다.7)

    활용하기 어려운 비정형 데이터이지만 안전점검 및 정밀안전진단 결과와 같이 정해진 손상유형과 손상부재 단어를 사용하는 문서 데이터의 경우 단어의 빈도수를 기반으로 자주 등장하는 단어를 도출하는 텍스트마이닝 분석 기법을 적용할 수 있고8) 이를 통해 손상의 전체적 인 경향을 파악하는데 적합하다.

    따라서 본 연구에서는 터널 시설물의 안전점검 및 정 밀안전진단 보고서의 책임기술자 종합의견을 대상으로 텍스트마이닝 분석 기법을 활용하여 손상과 관련된 단 어 빈도수를 분석하여 터널 시설물의 주요 손상유형과 손상부재를 도출하고 유지관리 시 중점적으로 고려해야 하는 중점관리요소를 제안하고자 한다.

    2. 연구 방법론

    본 연구에 활용한 3가지 분석 절차로 이루어진 연구 방법을 <Fig. 3>에 나타내었다. 연구의 첫 번째 절차는 FMS에서 관리하고 있는 터널의 안전점검 및 정밀안전 진단 데이터의 수집이다. 두 번째 절차는 수집된 데이터 를 분석 가능하도록 하는 전처리 과정으로 텍스트 데이 터를 분석하기 위해서는 토큰화(Tokenization)와 불용 어 처리(Stopword Removal) 등의 전처리를 수행해야 한다.9) 마지막 세 번째 절차는 데이터 분석으로 단어 빈 도 분석, 시각화 및 워드 네트워크 분석으로 손상의 유 형과 손상부재를 도출하고 연계성을 확인하는 과정이 다.8),10),11)

    2.1 데이터 수집

    본 연구의 분석 데이터는 2019년 9월을 기준으로 FMS에 등록된 터널 시설물 안전점검 및 정밀안전진단 요약보고서이다. 요약보고서는 총 4,336건으로 터널 시 설물의 기본제원, 상세제원, 점검 및 진단 결과 등을 포 함하고 있으며, 데이터에서 결측치가 없고 책임기술자 종합 의견이 충실히 작성되어 데이터 분석이 가능하다 고 판단되는 정밀안전점검, 긴급안전점검, 정밀안전진단 데이터 2,068건을 선별하였다.

    터널 시설물은 용도에 따라 도로터널과 철도터널로 구분되며 라이닝 시공방법에 따라 개착터널과 굴착터널 (재래식터널, NATM터널, SHIELD터널), 재료형식에 따 라 조적식, 무근콘크리트, 철근콘크리트 라이닝 등으로 구분된다.12) 이와 같은 용도, 라이닝 시공방법, 재료형식 등의 구분에 따라 취약요소 및 유지관리 관점의 차이가 있을 것이나 주요 공법과 대표 형식 데이터만 수집할 수 있었기에 세분화하여 분석할 수 없는 한계가 있어 터널 용도(도로터널/철도터널)에 따른 분류 기준만을 적용하 여 분석에 활용하였다(<Fig. 4>, <Table 2>).

    2.2 데이터 전처리 과정

    2,068건의 요약보고서를 분석하기 위하여 데이터 입 력 값의 적정성 검토, 키워드 자동 추출을 위한 사용 용 어 정리의 2단계로 구분하여 전처리 과정을 실시하였다.

    1단계 입력값 적정성 검토는 시설물 관리대장, 점검・ 진단 보고서에 입력된 값을 중심으로 준공년도, 시설물 종류, 책임기술자 종합의견 등에 결측치가 없고 일관된 수준으로 작성되었는지 확인하고 정제하였다. 2단계 사 용 용어 정리는 파이썬 프로그램을 사용하여 문장・단 어・품사 태깅(Tagging)을 실시하고 점검・진단 책임기술 자 종합의견에서 사용되는 명사가 효과적으로 추출될 수 있도록 사용자 용어를 정의하였으며, 복합명사가 각 각의 명사가 아닌 하나의 명사로 추출되도록 명사 추출 규칙을 정의하였다.

    2.3 데이터 분석

    비정형 데이터인 FMS 요약 보고서의 책임기술자 종 합의견을 전처리 후 터널 유형별, 공용 연수별, 지역별 주요 단어에 대해 전체 빈도(Total Frequency, 이하 TF) 및 역문서빈도(Total Frequency-Inverse Document Frequency, 이하 TF-IDF)를 도출하고 이를 바탕으로 결과치를 직관적으로 살펴볼 수 있는 Word Cloud와 Word Network 분석을 수행하였다.

    점검・진단 요약보고서 내 책임기술자 종합의견에서 많이 언급되는 TF의 의미도 중요하지만 이는 모든 문서 마다 공통적으로 많이 사용되는 ‘내구성’, ‘상태평가’와 같은 손상과는 관련도가 낮은 단어의 중요도도 높게 평 가할 수 있기 때문에 여러 문서로 이루어진 문서 군에서 해당 단어가 특정 문서 내에서 얼마나 자주 등장하는지 나타내는 TF-IDF의 빈도 패턴 변화 분석이 더욱 의미 가 있을 것으로 판단하여 중점적으로 분석하였다.

    TF-IDF의 경우 점검 데이터가 상대적으로 적을 경 우 약간의 차이에 의해 값이 크게 증가할 수 있기 때문 에 함께 자주 등장하는 단어를 보여주는 Word Network 분석을 함께 수행하여 TF-IDF 분석을 보완 하고자 하였다.

    Word Network 분석은 함께 등장하는 횟수의 정도에 따른 occurrence 분석, 함께 등장하는 거리에 가중치를 부여한 distance 분석이 있는데, 책임기술자 종합의견에 서 함께 등장하는 단어가 문장 내에서 가까울수록 상호 연관성이 큰 것으로 사전 검토되어 distance 분석 방법 을 채택하였다.

    3. 분석 결과

    3.1 데이터 전처리 결과

    <Table 3>에서 표현한 바와 같이 1단계 입력값 적정 성 검토를 진행하였다. 책임기술자 종합의견은 작성자에 따라 상이한 수준으로 작성되어 있고 터널의 위치, 제원 정보 등의 일반적인 내용이 포함되어 있거나 점검・진단 에 대한 구체적인 결과가 아닌 모호한 내용으로 작성된 부분이 다수 확인되어 육안으로 스크리닝(screening) 후 불필요한 내용을 삭제하였다. 그 외에도 준공년도, 시설물 종류를 잘못 입력한 정보를 직접 확인하여 수정 하였다.

    1단계 처리를 마친 데이터로 <Table 4>에서 확인 할 수 있듯이 사용자 용어와 명사 추출 규칙을 정의하고 유 사단어의 동의어 사전을 구축하는 2단계 처리과정을 진 행하였다.

    3.2 터널유형별 데이터 분석

    터널 유형별(도로터널, 철도터널) TF-IDF, Word Cloud 분석 결과를 <Fig. 5>, <Fig. 6>에 나타내었다.

    터널 유형별 TF-IDF 분석 결과, 도로터널에서 높은 빈도로 조사된 손상부재는 ‘배수시설’, ‘타일’, ‘포장’, ‘천 단’, ‘이음부’ 등이고, 주요 손상유형으로는 ‘파손’, ‘박리’, ‘박락’, ‘철근노출’, ‘백태’ 등으로 나타났다. 철도터널의 경우 손상부재는 ‘배수시설’, ‘측벽’, ‘이음부’, ‘천단’, ‘슬 래부’ 순이었고, 주요 손상유형은 ‘박락’, ‘백태’, ‘망상균 열’, ‘철근노출’, ‘누수’ 등으로 조사되었다.

    ‘배수시설’은 도로 및 철도 터널 모두에서 손상빈도가 높았는데 지하구조물 특성상 배수 기능이 중요하지만 이물질 퇴적 등으로 성능 저하가 우려되는 경우가 많이 조사되어 빈도수가 높은 것으로 추정되고, ‘이음부 (joint)’ 및 ‘단면 변화부(단면)’가 점검 대상 부재가 아님 에도 도출된 것은 이 부분에서 결함 및 손상이 많은 것 으로 유추할 수 있으며 실제로 구조적으로도 취약한 부 위이므로 점검・진단 시 유의해서 관리할 필요가 있을 것 으로 판단된다.

    손상유형으로는 도로터널에서는 ‘파손’이 높은 빈도로 나타났는데 ‘라이닝’, ‘포장’, ‘타일’, ‘공동구’ 및 ‘배수로 덮개’ 등 다양한 부재가 차량통행으로 인한 외부 환경에 노출되어 발생하는 것으로 추정된다. 철도터널에서는 ‘백태’와 ‘누수’가 도로터널에 비해 높은 순위로 나타났 는데 분석에 활용된 철도터널 데이터의 68%가 도시철 도 터널이고 개착박스 형식으로 시공된 경우가 대부분 이어서 이음부를 통한 누수가 많이 발생한 것으로 추정 된다.

    <Fig. 7>은 책임기술자 종합의견에서 문장 내 함께 자주 가까이 등장하는 단어 관계를 보여주는 Word Network 분석 결과이다.

    도로터널의 경우 ‘균열’과 ‘파손’을 중심으로 키워드 간 네트워크가 형성되어 있으며 ‘배수시설’, ‘공동구’, ‘포 장’, ‘타일’ 등의 손상부재가 비교적 높은 연결성을 가지 고 있고, 철도터널은 경우 ‘균열’, ‘누수’ 및 ‘백태’를 중심 으로 키워드 간 네트워크가 형성되어 있으며 ‘천단(슬래 브)’, ‘측벽(벽체)’, ‘배수시설’ 등이 손상유형과 높은 연결 관계를 가지는 것으로 나타나 모두 TF-IDF 분석 결과 와 일치함을 확인할 수 있다.

    그리고 터널 주요 점검대상 부재는 아니지만 ‘타일’, ‘포장’, ‘공동구’(이상 도로터널), ‘환기구’, ‘승강장’(이상 철 도터널) 등이 Word Network상 여러 손상 유형과 밀접한 연결성을 가지는 것으로 나타났다.

    3.3 지역별 데이터 분석

    3.3.1 도로터널 지역별 데이터 분석

    도로터널의 지역별 TF-IDF, Word Cloud 분석 결과 를 <Fig. 8>, <Fig. 9>에 나타내었다.

    지역과 관계없이 주요 손상유형으로 ‘파손’, ‘박락’, ‘박 리’, ‘철근노출’ 등이 높은 빈도로 조사되었고 주요 손상 부재(부위)로는 ‘배수시설’, ‘타일’, ‘포장’ 등의 키워드가 나타났다.

    강원지역은 전국 평균보다 낮은 기온으로 인해 날씨 와 관련된 ‘우기’, ‘결빙’ 키워드를 확인할 수 있다. 특히 동결-융해로 인한 터널 ‘갱구’, ‘포장’, ‘사면’ 및 ‘옹벽(지 반)’의 내구성능 저하 등을 유의하여 점검할 필요가 있 다.

    수도권에서는 차량 통행량이 많은 특성으로 인해 주 행과 관련된 키워드가 높은 빈도로 출현하였다. 차량에 서 배출되는 가스의 영향으로 이산화탄소 및 아황산가 스의 농도가 상대적으로 높아 탄산화의 진행속도가 이 론 추정치 대비 빠른 것으로 추정되며 이로 인해 ‘탄산 화’, ‘환기’ 등의 키워드가 순위권에서 같이 조사되었다.

    경상지역도 수도권과 같이 차량 통행량이 많아 주행 과 관련된 키워드가 높은 빈도로 출현하였는데, 고속도 로가 집중되어 있고 부산과 같은 대도시가 집중되어 있 는 영향일 것으로 판단된다.

    수도권과 경상지역에서 타 지역 대비 덕트부가 높은 빈도로 출현한 것을 확인할 수 있는데, 차량 통행으로 인한 매연 및 미세먼지 등은 철근콘크리트 구조체의 열 화를 촉진시키며, ‘균열(망상 균열)’, ‘박락’, ‘파손’ 또는 보수부 재손상 등이 빠르게 진행될 우려가 있으므로 덕 트부에서 진행된 열화가 라이닝 또는 주행 도로 2차 피 해로 확산되지 않도록 특별한 주의관찰이 필요하다.

    이와 같이 지역별로 일부 특징을 가지고 있지만 책임 기술자 종합의견만으로 지역 간 차이를 명확하게 분류 하기 어려웠는데, 이는 대부분 지역에서 ‘균열’, ‘파손’, ‘박리’ 등의 손상유형과 ‘라이닝’, ‘포장’, ‘타일’, ‘공동구’, ‘배수시설’ 등의 손상부재가 비교적 높은 중심성 및 연결 성을 가지는 Word Network 분석 결과를 통해 확인할 수 있다.

    3.3.2 철도터널 지역별 데이터 분석

    철도터널의 지역별 TF-IDF, Word Cloud 분석 결과 를 <Fig. 10>, <Fig. 11>에 나타내었다.

    강원지역의 경우 분석에 활용된 요약보고서가 26건으 로 전체 특성을 대변한다고 단정하기 어렵지만 지반과 관련된 ‘지반’, ‘파쇄대’, ‘절리’ 등의 키워드가 다수 확인 되었다. Raw data를 확인한 결과 터널이 위치한 지반 내 절리 및 파쇄대가 발견되는 등 지반이 불안정한 경우 가 다수였고, 도로터널과 마찬가지로 시・종점부가 외부 환경조건(결빙, 동상, 동결-융해 등)의 영향을 많이 받아 ‘망상균열’, ‘박락’, ‘파손’ 등의 열화가 집중적으로 발생 한 것으로 나타났다.

    경상지역에서는 배수시설 관련한 키워드들이 높은 순 위로 분석되었는데, 이물질 퇴적 등으로 배수 기능저하 와 체수 등이 높은 비중으로 조사되었다. 또한 부산지역 도시철도 터널들은 해안가에 인접한 지리적 특성으로 터널 내 수질검사에서 염화물 함유량이 높은 편으로 조 사되었으며 콘크리트 내구성능 저하 등의 영향을 미칠 수 있으므로 외부 유입수가 들어오지 못하도록 원인 부 위를 확인하여 보수・보강하고 지속적인 관찰을 해야 할 것으로 판단된다.

    철도터널의 지역별 Word Network 분석 결과, 대부 분 지역에서 ‘균열’, ‘누수’ 및 ‘백태’를 중심으로 단어 간 네트워크가 형성되어 있는 것으로 나타났으며, 손상 부 재(부위)로는 ‘라이닝’, ‘배수시설’, ‘시공 이음부’ 등이 비 교적 높은 중심성과 연결성을 가지는 것으로 나타나 TF-IDF 기반의 출현빈도 분석 결과와 일치하는 것을 확인할 수 있다.

    4. 결론

    급속히 노후화 되는 시설물의 효율적 유지관리를 위 한 중점요소를 파악하기 위해 비정형 데이터로 축적되 어 있는 안전점검・진단 보고서를 수집하여 데이터 전처 리 과정을 거친 후, 텍스트마이닝 분석 기법을 이용해 분석하였다.

    높은 빈도로 언급된 단어를 워드 클라우드 및 네트워 크 분석을 통해 손상유형과 손상부재를 시각화 하는 한 편 손상유형 및 부재 간 영향거리를 파악하여 향후 유지 관리 시 중점적으로 고려해야 할 요소를 터널 유형별(도 로터널/철도터널), 지역별(강원도, 수도권, 경상도, 전라 도, 충청도)로 확인하였다.

    • 1) 터널 유형별 분석결과를 살펴보면 손상유형으로는 도로터널에서는 ‘파손’, 철도터널에서는 ‘백태’와 ‘누수’가 가장 많이 확인되었고, 손상부재는 공통적으로 ‘배수시 설’의 빈도수가 가장 높았다.

    • 2) 지역별 터널의 손상유형 및 손상부재는 강원도 지 역의 ‘우기’, ‘결빙’ 키워드, 수도권과 경상도 지역의 ‘탄 산화’, ‘환기’ 키워드와 같이 일부 지역적인 특징을 확인 할 수 있었지만 전반적으로 유사한 결과를 보이고 있을 확인할 수 있었다.

    본 연구에서 도출된 시설물의 취약요소는 터널 시설 물에 대한 기본 제원정보와 정밀안전점검 및 정밀안전 진단 책임기술자 종합의견 데이터로 분석한 결과로, 단 기적으로 정기점검 및 일상점검 시 개별 시설물의 특성 을 고려한 점검요소로 활용할 수 있을 것이다. 나아가 중·장기적으로 자원을 효율적으로 투입하기 위한, 보 수・보강의 우선순위를 판단하는 선제적 유지관리 의사 결정을 지원하는 기초 자료로 활용하기 위해서는 상세 제원에 대한 정보와 안전성, 내구성, 사용성에 대한 점 검 결과의 종합적 분석과 보수・보강에 따른 비용에 대 한 빅 데이터 분석을 포함한 추가 연구가 필요할 것으 로 보인다.

    감사의 글

    본 연구를 수행할 수 있도록 데이터를 제공해주신 국토 교통부에 감사의 말씀을 드립니다.

    Figure

    JKASS-21-3-85_F1.gif

    Aging Infrastructure Facility Status (2020.12.)

    JKASS-21-3-85_F2.gif

    The increment prospect of infrastructure within 10yr(2020.12.)

    JKASS-21-3-85_F3.gif

    Research methodology

    JKASS-21-3-85_F4.gif

    Data collection and categorization

    JKASS-21-3-85_F5.gif

    TF-IDF comparision by Tunnel type

    JKASS-21-3-85_F6.gif

    Word Cloud comparision by tunnel type

    JKASS-21-3-85_F7.gif

    Word Network comparision by tunnel type

    JKASS-21-3-85_F8.gif

    TF-IDF comparision of regional road tunnel

    JKASS-21-3-85_F9.gif

    Word Cloud comparision of regional road tunnel

    JKASS-21-3-85_F10.gif

    TF-IDF comparision of Regional rail tunnel

    JKASS-21-3-85_F11.gif

    Word Cloud comparision of regional rail tunnel

    Table

    Safety accidents of aging infrastructure within10yr

    Summary reports of Tunnel

    Example of appropriate investigation of input data

    Example of semantic relationships in thesaurus

    Reference

    1. Korea Authority of Land & Infrastructure Safety(KALIS) “Facility statistical yearbook 2021”, 2021 (in Korean)
    2. Kobayashi, K., & Kaito, K., “Big data-based deterioration prediction models and infrastructure management: towards assetmetrics”, Structure and Infrastructure Engineering, Vol.13 No.1 pp.84~93, 2017
    3. Chung, S. H., Moon S. H. & Chi, Seokho., “Bridge Damage Factor Recognition from Inspection Reports Using Deep Learning”, Journal of the Korean Society of Civil Engineers, Vol.38, No.3: pp.621-625., 2018
    4. Liu, K., & El-Gohary, N., “Ontology-based semi-supervised conditional random fields for automated information extraction from bridge inspection reports.” Automation in Construction, Vol.81, pp.313-327., 2017
    5. Ryu, J. M., & Shin, E. C., “Database construction plan of infrastructure safety inspection and in-depth inspection results.”, Journal of Korean Geosynthetics Society, Vol.13, No.4, pp.133-141., 2014
    6. Lee, I. K., Moon, M. K, Park, H. S., Jeon, J. C. & Lee, H. H., “Statistical analysis of damages in expressway bridges.” Magazine of the Korea Institute for Structural Maintenance and Inspection, Vol.18, No.2, p.2-9., 2014
    7. Korea Authority of Land & Infrastructure Safety(KALIS), “Facility standardization of code System & development and management of integrated information system for safety management”, 2018 (in Korean)
    8. Baker, H., Hallowell, M. R., & Tixier, A. J. P., “Automatically learning construction injury precursors from text”, Automation in Construction, Elsevier B.V., Vol.118, 103145., 2020
    9. Manning, C. D., Raghaven, P. & Schutze, H., “Introduction to Information Retrieval”, Cambridge University Press, 2008
    10. Jung, H., & Lee, B. G., “Research trends in text mining: semantic network and main path analysis of selected journals”, Expert Systems With Applications, Elsevier Ltd, Vol.162, 113851, 2020
    11. Berry, M. W., & Kogan, J. (2010). “ Text Mining: Applications and Theory” John Wiley & Sons Ltd, Chichester
    12. Ministry of Land, Infrastructure and Transport (MOLIT), “Detailed guideline for Safety and maintenance of facilities(safety inspection・ diagnosis)”, 2019 (in Korean)