UNIST 컴퓨터공학과 김정훈 교수팀은 사용자가 지정한 대상을 반드시 포함하면서도, 정해진 크기 안에서 의미 있는 집단만 찾아내는 새로운 커뮤니티 탐색 기법을 개발했다고 28일 밝혔다.
커뮤니티 탐색은 방대한 네트워크 데이터 안에서 내부 연결이 강한 집단을 찾아내는 데이터 분석 기술이다. 기존 기술들은 네트워크 데이터가 크거나 개인 정보보호 문제로 일부 관계만 볼 수 있는 상황에서는 쓰기 어렵고, 관계가 밀접하지 않음에도 집단에 포함되는 문제가 있었다.
하나씩 고르는 과정에서 놓칠 수 있는 관계는 주변의 연결된 작은 묶음을 함께 살펴보는 방식으로 보완했다. 혼자 놓고 보면 눈에 띄지 않지만, 함께 묶였을 때 집단의 성격을 더 분명하게 하는 후보들을 반영하기 위해서다.
실제 네트워크 데이터를 이용한 실험에서도 기존 최고 성능 기법보다 F1 점수는 최대 1.39배, ARI 점수는 최대 5.95배 높게 나타났다. 이는 찾고자 한 집단을 더정확하게 골라내면서도, 관계가 약한 대상을 덜 포함했다는 의미다.
김정훈 교수는 “이번 연구는 사용자가 관심 있는 대상 주변에서 의미 있는 관계만 빠르게 찾아내는 데 초점을 맞춘 기술로, 고객군 분석, 이상거래 탐지, 생물학 단백질 관계망 분석 등 다양한 분야에 적용될 수 있을 것”이라고 말했다.
이번 연구에는 UNIST 김다희 연구원이 제1저자로 참여했으며, 한국연구재단의 지원을 받아 수행됐다.
