본 사이트는 파트너스 활동으로 수수료를 받으며, 서버 운영과 무료 앱 개발에 사용됩니다.

본 사이트는 파트너스 활동으로 수수료를 받으며,서버 운영과 무료 앱 개발에 사용됩니다.

큐레이터 단비's 웹앱 아이디어 창고

홈 무료 앱 큐레이터 단비 프롬프트 칼럼 PPT 위키 AI 이미지 AI 툴 프로그램 쇼핑 핫딜 부업 백과 RSS 개발 용어 사전

큐레이터 단비's 웹앱 아이디어 창고

🧰 웹앱 · 📺 단비 · 📰 이슈트래커 · 📄 기타 페이지를 한 곳에서. 모든 도구를 쉽고 빠르게 사용하세요.

사이트 방문

전체-오늘-고유 전체-고유 오늘-

방문 통계 / 인기 앱 순위 보러 가기→

제품

모든 도구
카테고리
인기 도구
새로운 도구
사이트맵

지원

통계
업데이트
도움말
문의하기
버그 신고
FAQ

법적 고지

개인정보처리방침
이용약관
쿠키 정책

웹앱 아이디어 창고 - 모든 도구를 한 곳에서 © 2025 큐레이터 단비. All right reserved.

Built with ❤️ using Next.js & Vercel

지연시간 (Latency) | 바이브 코딩 용어 사전

용어 사전/지연시간

초급개념

지연시간

Latency

키워드로 바로 검색

|

클릭하면 각 플랫폼에서 바로 검색됩니다.

한글「지연시간」구글네이버유튜브

영어「Latency」

설명

요청을 보낸 후 응답을 받기까지 걸리는 시간으로, AI 코딩 도구에서는 프롬프트를 전송한 후 코드가 생성되기 시작할 때까지의 대기 시간을 의미한다. 밀리초(ms)에서 수 초(s)까지 다양하며, 개발자의 작업 흐름과 생산성에 직접적 영향을 미친다. AI 모델의 지연시간은 여러 요인에 의해 결정된다: 모델 크기(파라미터 수가 많을수록 느림), 입력 토큰 수(컨텍스트가 길수록 느림), 출력 토큰 수(긴 응답일수록 느림), 서버 부하(동시 사용자 수), 네트워크 거리(API 서버 위치). 바이브 코딩에서의 트레이드오프: Claude Opus 4.6은 가장 정확한 코드를 생성하지만 응답이 느리고, Codex mini나 Claude Sonnet은 빠르지만 복잡한 작업에는 부족하다. 이로 인해 많은 개발자가 '빠른 모델로 초안 생성 → 정확한 모델로 검증·수정'이라는 이중 모델 전략을 사용한다. 스트리밍 응답(streaming)은 전체 응답을 기다리지 않고 토큰이 생성되는 대로 표시하여 체감 지연을 줄이는 기법이며, 대부분의 AI 코딩 도구에서 기본으로 사용된다.

추가 정보

조회: 48

모델 크기가 클수록 일반적으로 지연시간 증가.

태그

지연시간응답속도레이턴시

관련 용어

토큰Token
컴팩션Compaction

목록으로 돌아가기