커뮤니티

학과소식

[동정] 컴퓨터공학과 학부생 및 졸업생(지도교수 이세영) 2026 ACM SAC 학술대회 논문 게재 승인

  • 작성자 컴퓨터공학과
  • 작성일 2025.12.17
  • 조회 128

컴퓨터공학과 권석재, 이정호 학부생 및 졸업생 류나연 (융합보안학과 석사과정), AI융합학과 서희영(제1저자) 학생(지도교수: 이세영)이 수행한 「LOKI: Alias-based Semantic Jailbreak Strategy for Large Language Models」 연구가 2026년 3월 그리스에서 개최될 예정인 ACM/SIGAPP Symposium On Applied Computing (ACM SAC 2026) 에서 정규 논문(Oral session)으로 채택되었다. 

ACM SAC는 응용 컴퓨팅 분야를 대표하는 국제 학술대회로, 국내에서는 BK21 등재 우수학회로 분류된다.


본 연구는 기존 키워드·표현 수준의 방어 기법을 우회하는 의미 기반(semantic) LLM 탈옥 공격 기법 LOKI를 제안하였다. 의미를 보존한 별칭(alias)을 활용해 모델의 개념적 추론을 유도함으로써 안전 필터를 우회하는 전략을 체계화하였으며, GPT-4o, Claude, Gemini 등 주요 상용 LLM을 대상으로 실험한 결과 기존 자동화 공격 기법 대비 압도적으로 높은 공격 성공률을 보였다. 이를 통해 현행 LLM 안전 메커니즘의 구조적 한계를 실증적으로 드러내고, 의미 수준의 의도 탐지를 고려한 차세대 AI 안전 기술의 필요성을 제시하였다.