본 사이트는 파트너스 활동으로 수수료를 받을 수 있으며, 서버 운영과 무료 앱 개발에 사용됩니다. 본 사이트는 파트너스 활동으로 수수료를 받을 수 있으며
서버 운영과 무료 앱 개발에 사용됩니다.
중급 개념 📎 컨텍스트 엔지니어링

검색 증강 생성

RAG (Retrieval-Augmented Generation)

설명

외부 데이터 소스에서 관련 정보를 먼저 검색(Retrieval)한 뒤, 이 정보를 LLM의 컨텍스트에 포함시켜(Augmented) 응답을 생성(Generation)하는 기술이다. 2020년 Meta AI의 Patrick Lewis 등이 발표한 논문에서 처음 제안되었으며, AI의 환각(Hallucination) 문제를 해결하는 가장 효과적인 방법 중 하나로 자리잡았다. LLM은 훈련 데이터에 포함되지 않은 정보(사내 코드, 비공개 API 문서, 최신 라이브러리 변경사항 등)를 알 수 없지만, RAG를 통해 관련 문서를 실시간으로 검색하여 컨텍스트에 주입하면 최신·정확한 정보를 기반으로 코드를 생성할 수 있다. 바이브 코딩에서의 활용 예시: AI 코딩 에이전트가 사내 API 문서 데이터베이스를 RAG로 검색하여, 정확한 엔드포인트 URL, 인증 방식, 요청/응답 스키마를 확인한 후 코드를 생성한다. Grounding의 핵심 구현 방식이며, Corrective RAG(검색 결과의 관련성을 평가하여 재검색하는 변형) 등의 발전된 형태도 존재한다.

추가 정보

등장 시기
2020-05
관련 인물·조직
Meta AI (Patrick Lewis et al.)
조회
217

태그

RAG검색증강지식검색