공지사항
이재성 교수 연구팀 NAACL(Annual Conference of the North American Chapter of the Association for Computational Linguistics) 2025 논문 게재 승인
우리 대학 AI대학원의 참여 대학원생인 이한용 박사과정과 한국전자기술연구원에서 근무하고 있는 이채린 석사가 인공지능 기술 관련 세계 최고 학회 중 하나인 NAACL (Annual Conference of the North American Chapter of the Association for Computational Linguistics)에 논문 게재 승인을 받는 성과를 일궈냈다. NAACL은 자연어 처리(NLP) 분야 최상위 학술대회로, 인공지능 분야에서 그 명성이 높다.
이한용 박사과정과 이채린 석사가 발표한 연구는 사회공학적 공격(Social Engineering Attacks), 특히 피싱(Phishing) 공격에서 사용되는 시각적 텍스트 변형(Visually Perturbed Texts)을 정밀하게 분석하여 언어 모델의 복원 성능을 향상시키는 기술로, 최근 학계와 산업계에서 주목받고 있는 보안과 NLP의 융합 분야를 다룬다.
두 연구자는 실제 피싱 사례를 포함한 대규모 데이터셋을 구축하고, 이를 기반으로 시각적 변형 텍스트 복원 모델의 성능을 실험하여 기존 방식 대비 약 96%의 높은 정확도를 달성하였다. 이를 통해 기존 연구에서 사용하던 합성 데이터셋이 가진 한계를 극복하고, 현실적이고 신뢰할 수 있는 데이터 기반의 연구를 가능하게 했다.
피싱 공격에서 사용되는 시각적 변형은 보안 시스템을 우회하고 피해자를 속이기 위한 적대적 공격(Adversarial Attack)으로 작용하며, 이는 언어 모델의 해석 능력을 방해하는 주요 원인으로 지목되어왔다. 하지만 기존 연구는 실제 사례 부족으로 인해 주로 합성 데이터를 활용해왔다. 이한용 박사과정과 이채린 석사가 이러한 한계를 해결하고자, 실제 피싱 사례와 인공적 변형 데이터를 모두 포함한 데이터셋을 설계했다.
이번 연구에서 제안한 복원 모델은 변형 텍스트의 시각적 노이즈를 효과적으로 제거하고, 원래 의미를 복원하는 데 탁월한 성능을 보였다. 연구진은 특히 실제 사례와 합성 데이터 간의 성능 차이를 분석하여, 실제 데이터를 포함한 학습이 왜 중요한지를 입증하였다. 이 모델은 사회공학적 공격에 대한 방어뿐만 아니라, 언어 모델의 신뢰성과 보안성을 높이는 데 중요한 기여를 할 것으로 기대된다. 이 연구는 언어 모델을 기반으로 한 보안 기술뿐만 아니라, 실시간 텍스트 복원과 같은 다양한 응용 분야에서도 활용 가능성이 크다.
이번에 게재 승인된 논문은 아래 링크를 통해 공개될 예정이다.
Hanyong Lee, Chaelyn Lee, Yongjae Lee, Jaesung Lee
BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks
Annual Conference of the North American Chapter of the Association for Computational Linguistics
April 29–May 4, 2025, Albuquerque, New Mexico
이전글 | 강유진 박사과정(데이터사이언스연구실) AAAI 논문 게재승인(oral presentation) |
---|---|
다음글 | 다음 글이 없습니다. |