논문 초록
Research Article

복지대상 사각지대 해소를 위한 점진적 변수 확장 기반 분류 모형: TVAE를 활용한 변수 생성과 재현율 최적화를 중심으로

박영식1 · 이동원1 · 이형용1

1 한성대학교 경영학부

발행: 2026년 1월 · 55권 2호 · pp. 583-611

DOI: https://doi.org/10.17287/kmr.2026.55.2.583

본문 보기

초록

본 연구는 복지사각지대의 핵심 원인인 변수 결측과 예측 누락 문제를 해결하기 위해, TVAE(Tabular Variational AutoEncoder) 기반 구조적 결측 대치 기법을 적용하고 재현율(Recall)을 중심으로 한 분류모형을 설계하였다. 2018년 1월부터 2023년 11월까지의 복지행정 데이터를 활용하여, 변수 확장 및 합성데이터 결합 효과를 단계적으로 검증하였다. Phase 1에서는 실제 변수 확장을 통해 재현율이 소폭 향상(약 0.4~1.0%p)되었고, Phase 2에서는 TVAE로 대치된 데이터를 결합함으로써 재현율이 57.7%에서 94.4%로 대폭 개선되었다. 또한 합성데이터 결합비율 민감도 분석(Test 1~4)을 통해 약 10~20% 수준의 합성비율에서도 안정적인 예측 성능이 유지됨을 확인하였다. 시간 블록(Time-block) 검증 결과, ROC-AUC(0.66~0.67)와 PR-AUC(0.31~0.32)가 일정하게 유지되어 시계열적 강건성이 입증되었다. 본 연구는 TVAE 기반 결측 대치가 복지행정 데이터의 품질과 예측 신뢰성을 실질적으로 개선함을 실증적으로 제시하며, 재현율 중심의 데이터 기반 복지정책 의사결정의 타당성을 뒷받침한다.
키워드: 복지사각지대TVAE점진적 변수 확장재현율 최적화머신러닝