html LLM01: 프롬프트 인젝션 (Prompt Injection)

LLM01: 프롬프트 인젝션 (Prompt Injection)

LLM에 의도치 않은 프롬프트를 주입하여 모델의 사전 의도를 오버라이드하거나 무시하게 만드는 공격입니다. 이는 직접적인 프롬프트 조작 또는 간접적인 데이터 소스를 통해 발생할 수 있습니다.

개인 정보 유출, 민감한 정보 접근, LLM의 의도하지 않은 행동 유발, 보안 메커니즘 우회.

프롬프트 격리 및 샌드박싱, 입력 유효성 검사, 출력 필터링, 권한 부여 시스템 적용, 휴먼-인-더-루프(Human-in-the-Loop) 검토.