중급개념
검색 증강 생성
RAG (Retrieval-Augmented Generation)
외부 데이터 소스에서 관련 정보를 먼저 검색(Retrieval)한 뒤, 이 정보를 LLM의 컨텍스트에 포함시켜(Augmented) 응답을 생성(Generation)하는 기술이다. 2020년 Meta AI의 Patrick Lewis 등이 발표한 논문에서 처음 제안되었으며, AI의 환각(Hallucination) 문제를 해결하는 가장 효과적인 방법 중 하나로 자리잡았다. LLM은 훈련 데이터에 포함되지 않은 정보(사내 코드, 비공개 API 문서, 최신 라이브러리 변경사항 등)를 알 수 없지만, RAG를 통해 관련 문서를 실시간으로 검색하여 컨텍스트에 주입하면 최신·정확한 정보를 기반으로 코드를 생성할 수 있다. 바이브 코딩에서의 활용 예시: AI 코딩 에이전트가 사내 API 문서 데이터베이스를 RAG로 검색하여, 정확한 엔드포인트 URL, 인증 방식, 요청/응답 스키마를 확인한 후 코드를 생성한다. Grounding의 핵심 구현 방식이며, Corrective RAG(검색 결과의 관련성을 평가하여 재검색하는 변형) 등의 발전된 형태도 존재한다.