피싱도 골라내나?…UNIST, 고성능 커뮤니티 탐색 기술 개발

컴퓨터공학과 김정훈 교수팀 성과 사기 계좌 추적부터 신약 개발까지 복잡한 네트워크서 ‘알짜’만 쏙쏙 알고리즘 정확도 최대 5.9배 급증

2026-05-28     정수진 기자
[연구그림] 실제 관계망 데이터에서 검증한 커뮤니티 식별 성능 비교. UNIST 제공
복잡하게 얽힌 네트워크에서 사용자가 관심을 갖는 사람이나 대상을 중심으로 진짜 의미 있는 집단만을 효율적으로 찾아내는 알고리즘이 개발됐다. 소규모 열성 고객군에 집중하는 마케팅, 사기 의심 계좌와 엮인 관련 계정 집단 추적, 생물학 단백질 관계망 분석을 통한 신약 개발 단서 발굴 등에 도움이 될 것으로 기대된다.

UNIST 컴퓨터공학과 김정훈 교수팀은 사용자가 지정한 대상을 반드시 포함하면서도, 정해진 크기 안에서 의미 있는 집단만 찾아내는 새로운 커뮤니티 탐색 기법을 개발했다고 28일 밝혔다.

커뮤니티 탐색은 방대한 네트워크 데이터 안에서 내부 연결이 강한 집단을 찾아내는 데이터 분석 기술이다. 기존 기술들은 네트워크 데이터가 크거나 개인 정보보호 문제로 일부 관계만 볼 수 있는 상황에서는 쓰기 어렵고, 관계가 밀접하지 않음에도 집단에 포함되는 문제가 있었다.

[연구진사진] 김정훈 교수(좌측)과 김다희 연구원. UNIST 제공
연구팀의 기술은 전체 네트워크 정보를 모두 확보하지 않아도, 사용자가 정한 크기 안에서 내부 연결이 촘촘하고 바깥과는 비교적 잘 구분되는 집단을 골라낼 수 있다. 사용자가 지정한 노드에서 출발해 주변 후보를 차례로 확인하며 집단을 넓혀가는 방식이기 때문이다. 이때 후보를 넣었을 때 전체 결과가 좋아지는지를 계산하고, 집단이 불필요하게 커질수록 점수가 쉽게 올라가지 않도록 크기 조건을 반영하게 된다.

하나씩 고르는 과정에서 놓칠 수 있는 관계는 주변의 연결된 작은 묶음을 함께 살펴보는 방식으로 보완했다. 혼자 놓고 보면 눈에 띄지 않지만, 함께 묶였을 때 집단의 성격을 더 분명하게 하는 후보들을 반영하기 위해서다.

실제 네트워크 데이터를 이용한 실험에서도 기존 최고 성능 기법보다 F1 점수는 최대 1.39배, ARI 점수는 최대 5.95배 높게 나타났다. 이는 찾고자 한 집단을 더정확하게 골라내면서도, 관계가 약한 대상을 덜 포함했다는 의미다.

김정훈 교수는 “이번 연구는 사용자가 관심 있는 대상 주변에서 의미 있는 관계만 빠르게 찾아내는 데 초점을 맞춘 기술로, 고객군 분석, 이상거래 탐지, 생물학 단백질 관계망 분석 등 다양한 분야에 적용될 수 있을 것”이라고 말했다.

이번 연구에는 UNIST 김다희 연구원이 제1저자로 참여했으며, 한국연구재단의 지원을 받아 수행됐다.