중급개념
가드레일
Guardrails
LLM의 출력이 지정된 제약 조건과 안전 가이드라인을 준수하도록 보장하는 다층적 안전 메커니즘이다. '가드레일'이라는 명칭은 도로의 가드레일이 차량이 도로를 벗어나는 것을 방지하듯, AI가 허용된 범위를 벗어나는 행동을 차단한다는 비유에서 유래했다. 바이브 코딩에서 가드레일은 세 가지 수준으로 나뉜다: 코드 수준(린터로 스타일 위반 감지, TypeScript 타입 체크로 타입 오류 방지), 실행 수준(터미널 명령어 허용 목록 관리, 'rm -rf /' 같은 위험 명령 차단, 특정 디렉토리 밖 접근 금지), 출력 수준(생성된 코드에 보안 취약점이 없는지 스캔, 민감 정보 노출 방지). YOLO Mode(자동 실행)를 사용할 때는 가드레일이 특히 중요하며, 가드레일 없는 YOLO Mode는 에이전트에게 '검증 없이 아무거나 실행해도 된다'고 허락하는 것과 같다. 하네스 엔지니어링의 핵심 구성 요소로, 가드레일의 수준과 정밀도가 에이전틱 워크플로의 안전성을 결정한다.