우리는 지금
성범죄 데이터
채굴 중
(Data Mining)
'20세기에는 석유가 가장 가치 있는 자원이었지만 21세기에 가장 중요한 자원은 데이터다'(이코노미스트)
우리는 지금도 알게 모르게 빅데이터 기반의 기술과 상업적 서비스를 받으며 생활하고 있습니다. 빅데이터 분석기술인 데이터 마이닝(Data Mining)에 대해 들어보셨나요?
데이터, 21세기에 가장 중요한 자원
데이터 마이닝은 대량의 데이터 속에서 발견할 수 있는 유의미한 관계, 규칙 패턴 등을 분석하여 유용한 정보를 자동 또는 반자동방식으로 추출하는 분석 기법을 말합니다. 범죄정보, 유동인구, 지역속성 등의 빅데이터를 분석하여 범죄발생 위험도가 높은 지역을 파악하고 CCTV를 설치하면 범죄예방 효과가 매우 클 것입니다.
국민이 가장 불안해하는 범죄 중 하나가 성범죄입니다. 성범죄자의 재범을 방지하기 위한 데이터 기반의 체계적 관리와 사전 예방 활동이 매우 중요합니다. 이를 위해서 성범죄자의 특성과 행동양식 등의 데이터 수집, 분석, 재범위험성 평가모델 개발, 운영, 성능평가, 피드백의 선순환 체계 구축이 필요합니다.
성범죄 데이터의 거대한 광산
법무부 범죄예방정책국에는 성범죄 데이터의 거대한 광산이 있습니다. 성범죄자의 범죄사실, 조사서, 면담기록 등의 정보 대부분이 비정형데이터입니다. 성범죄자에 대한 빅데이터 분석을 위한 첫걸음으로 ’22. 5. ‘데이터 마이닝 TF’가 발족되어 활동하고 있습니다.
먼저 성범죄데이터 분류기준을 개발하고 판결문의 범죄사실에서 범죄 발생 장소, 수법, 피해자 특성 등을 텍스트마이닝(Text Mining)을 통해 정보화 처리가 가능한 정형 데이터 추출을 모색하고 있습니다. 이러한 TF 활동을 바탕으로 향후 빅데이터 기반 관리‧분석플랫폼 구축을 계획하고 있습니다.
체계적인 성범죄자 관리 기반 마련
파편화된 데이터의 정제와 통합, 선별과 변환 등에 어려움이 있으나, 데이터 마이닝으로 체계적인 성범죄자 관리 기반을 마련해 과학적 지도감독을 지원하고 이를 통해 재범억제 역량을 높여 범죄로부터 안전한 사회를 구현하도록 최선을 다하겠습니다.