도구 설명
AI 숏폼 대본 생성기는 주제와 타겟 시청자를 입력하면 약 30~60초·1분 미만 분량의 쇼츠·릴스·틱톡 대본을 12개 생성합니다. 각 대본에는 첫 장면 훅(Hook), 핵심 메시지 전달부, 마무리 행동 유도(CTA)가 구조적으로 분리되어 있어, 촬영·편집·자막 입력 단계에 바로 투입할 수 있습니다. 유튜브 쇼츠뿐 아니라 인스타 릴스, 틱톡, 네이버 클립 등 모든 세로형 숏폼에 동일한 리듬으로 옮기기 좋습니다.
내부 규칙상 첫 문장에 시청자 감정을 건드리는 데 무게를 두고(호기심·공감·충격·질문), 마지막에 질문·좋아요·팔로우 같은 참여 유도가 자연스럽게 오도록 맞추는 구조입니다. 이모지·괄호 안 연출 지시 등은 넣지 않는 쪽으로 설계되어, 생성된 문장을 자막으로 그대로 올리기 쉽습니다.
문장은 구어체·쉬운 단어·짧은 호흡을 지향하므로, 전문 용어가 많거나 복잡한 설명이 필요한 주제는 사람이 한 번 더 다듬어야 할 수 있습니다. AI가 생성한 대본은 "말할 수 있는 초안"이지, 완성된 영상 자체가 아닙니다.
숏폼 콘텐츠에서 대본이 중요한 이유는, 30~60초라는 극히 짧은 시간 안에 "보게 만들고 → 이해시키고 → 행동하게 하는" 세 단계를 모두 달성해야 하기 때문입니다. 한 문장이 낭비되면 전체 리듬이 무너집니다. 이 도구는 그 밀도 높은 구조를 빠르게 잡는 데 초점을 맞추고 있습니다.
이럴 때 쓰면 좋아요
- "N가지 팁", "체크리스트", "전후 비교", "하루 루틴"처럼 "한 가지를 빠르게 전달"하는 숏폼 포맷을 만들 때
- 매일 또는 주 3~5회 올리는 숏폼의 뼈대(구조·리듬)를 고정하고, 주제만 바꿔 반복할 때
- 자막 길이와 읽는 속도를 미리 맞추기 위해, 문장 단위로 쪼개진 대본이 필요할 때
- 대본은 있는데 "말하기 어려운 문어체" 문장을 자연스러운 구어체로 바꾸고 싶을 때
- 팀원·외주 편집자에게 "이 대본대로 촬영·편집해 주세요"라고 넘길 표준 포맷이 필요할 때
- 롱폼 영상의 핵심 장면을 숏폼 클립으로 재편집할 때, 독립적으로 완결되는 30초 대본이 필요할 때
- 광고·프로모션 숏폼 영상의 스크립트를 여러 앵글(유머·정보·감성·긴급)로 뽑아 비교하고 싶을 때
사용법 가이드
- 훅(Hook) 설계: 시청자가 스크롤을 멈추는 이유를 "질문형·숫자형·반전형·공감형" 중 하나로 의식적으로 선택합니다. 대상을 좁힐수록("여러분" → "퇴근 후 운동 시작한 30대") 훅이 날카로워집니다. 훅의 역할은 "다음 문장을 읽게 하는 것"이지, 모든 정보를 전달하는 것이 아닙니다.
- 전개(Body) 구성: "문제–원인–해결", "팁1–팁2–팁3", "전(Before)–후(After)–비결", "질문–답–증거"처럼 3블록으로 압축합니다. 블록이 4개를 넘으면 30~60초 안에 소화하기 어려워 시청자가 이탈할 수 있습니다. 한 블록에 정보 하나만 넣는 것이 원칙입니다.
- 클로징(Closing) 구성: 핵심 메시지를 한 문장으로 반복 요약하고, 다음 행동(좋아요·팔로우·댓글·다음 영상 보기)은 마지막에 한 번만 자연스럽게 말합니다. 행동 요청이 여러 번 반복되거나 길면 오히려 이탈률이 올라갑니다.
- 말투 설정: "친구에게 알려 주듯", "뉴스 앵커처럼 간결하게", "선배가 조언하듯" 등 "말하는 관계"를 한 줄로 지정하면 문장 길이·존칭·어미가 자동으로 조정됩니다. 같은 정보라도 말투에 따라 시청 대상과 체감 길이가 달라집니다.
- 길이 제어: 목표 초수(30초/45초/60초)를 명시합니다. 대략 한국어 기준으로 초당 3~4글자, 분당 약 200~250자 정도가 자연스러운 말하기 속도입니다. 60초 대본이면 240~300자 정도가 적정 범위입니다.
결과 읽는 법
- 첫 문장에 "대상(누구)", "이득(무엇을 얻는지)", "호기심(왜 계속 봐야 하는지)" 중 최소 하나가 명확히 들어 있는지 확인합니다. 세 가지 모두 있으면 가장 강한 훅입니다.
- 각 문장마다 전달하는 정보가 딱 하나인지 봅니다. 한 문장에 두 가지 정보가 들어가면 자막이 두 줄로 쌓여 가독성이 떨어지고, 시청자가 처리하지 못해 넘깁니다.
- 전개가 일정한 리듬("질문–답–팁, 질문–답–팁")으로 반복되는지 확인하면, 편집 시 컷 포인트를 잡기 쉽고 시청자도 패턴을 예측해 끝까지 봅니다.
- 마지막 1~2문장은 새로운 정보 없이 "정리 + 행동 요청"만 있는지 확인합니다. 끝에 새 정보를 넣으면 "아직 안 끝났나?" 싶어 시청자가 혼란스러워합니다.
- 소리 내어 읽어 보고, 총 소요 시간이 목표 초수에 맞는지 스톱워치로 확인합니다. 글로 읽을 때와 말할 때의 체감 길이는 상당히 다릅니다.
관련 지식 콘텐츠
숏폼 시청의 상당 부분은 무음·자막 의존 환경입니다. 입으로 읽히는 리듬(말하기 호흡)과 눈으로 읽히는 길이(자막 글자 수)를 동시에 맞추는 것이 중요합니다. "말로는 자연스러운데 자막으로 보면 너무 긴" 문장은 수정이 필요합니다.
유튜브 쇼츠·틱톡 알고리즘은 초반 시청 지속률(첫 3초에 넘기지 않는 비율)과 완시율(끝까지 보는 비율)에 민감합니다. 훅이 과장되어 기대와 다르면 1~2초 만에 스와이프됩니다. "약속한 것을 30초 안에 이행하는" 대본이 알고리즘에도 유리합니다.
같은 주제라도 서사 패턴을 바꾸면("실패담→교훈", "숫자 3개→결론", "질문→답→반전", "비교→분석→추천") 시리즈물의 지루함을 줄일 수 있습니다. 매번 같은 패턴은 구독자에게도 피로감을 줍니다.
촬영 각도·자막 위치·배경음·효과음·전환 효과는 대본과 별개로 시선을 잡는 시각·청각 요소입니다. 좋은 대본이 있어도 이 요소들이 약하면 이탈이 발생합니다. 반대로 대본 리듬이 좋으면 편집이 간단해도 완시율이 높을 수 있습니다.
숏폼과 롱폼의 대본 구조는 근본적으로 다릅니다. 롱폼은 "도입→전개→심화→정리"의 점진적 구조이지만, 숏폼은 "훅→핵심→마무리"의 압축 구조입니다. 롱폼 대본을 단순히 앞부분만 잘라서 숏폼에 쓰면 완결성이 없어 이탈이 높아집니다.
실용 팁
- 자막 기준으로 문장을 15~25자 전후로 나누고, 한 화면에 자막 두 줄을 넘기지 않게 조정합니다. 모바일에서 세 줄 이상은 화면을 가려 시청 경험이 나빠집니다.
- 숫자("3가지", "30초 안에", "10만 원 이하")와 대조 표현("전/후", "해도 되는 것/안 되는 것")은 훅과 본문 모두에서 이해 속도를 높이고, 시청자가 "구체적인 정보가 있다"고 기대하게 만듭니다.
- 예시는 하나만 넣고, 나머지는 "2편에서 이어집니다" 또는 "댓글로 알려 드릴게요"로 넘기면 시리즈 유도와 길이 조절이 동시에 됩니다.
- 대본을 완성한 후 반드시 소리 내어 읽어 보세요. 숨 쉴 곳이 없는 긴 문장은 반으로 나누고, 혀가 꼬이는 발음은 쉬운 단어로 바꿉니다.
- 같은 주제로 "정보 전달형"과 "스토리텔링형" 두 버전을 만들어 보고, 어떤 패턴이 채널에 더 맞는지 데이터로 비교하세요.
- 촬영 전에 대본을 타이머로 읽으며 "여기서 화면 전환", "여기서 자막 강조" 같은 편집 큐를 미리 적어 두면 후반 작업이 빨라집니다.
관련 문제/대처법
- 초반 이탈률이 높을 때: 훅에 구체적 대상("퇴근 후 운동 시작한 직장인")과 상황을 넣고, 첫 3초 안에 결론의 일부 또는 결과 미리보기를 드러내 보세요. "끝까지 보면 알게 됩니다"는 숏폼에서는 작동하지 않는 경우가 많습니다.
- 내용이 산만하게 느껴질 때: 이 영상의 핵심 메시지를 한 문장으로 적어 보세요. 한 문장으로 안 된다면 주제를 쪼개야 합니다. 그 한 문장만 남기고 나머지를 다시 생성합니다.
- 행동 유도(CTA)가 어색할 때: "구독해 주세요~"를 직접 말하기보다, 내용과 자연스럽게 연결되는 질문("여러분은 어떤 방법 쓰세요? 댓글로 알려 주세요")이나 다음 편 예고로 대체해 보세요.
- 대본이 너무 길어 60초를 넘길 때: 목표 초수(30/45/60)를 정하고, 초당 3~4글자 기준으로 총 글자 수를 역산한 뒤, 넘치는 문장을 삭제합니다. "좋은 문장 빼기"가 아니라 "핵심만 남기기"입니다.
- 말투가 딱딱하거나 너무 가벼울 때: 타겟 시청자와의 관계를 한 줄로 명시합니다. "초등학생에게 설명하듯" vs "같은 업계 동료에게 공유하듯"은 완전히 다른 톤을 만듭니다.
- 여러 벌 나온 대본이 다 비슷할 때: 서사 패턴을 지정해서 재생성하세요. "정보 나열형", "실패담→교훈형", "질문→답변형", "전후 비교형" 등 구체적 패턴을 요청하면 다양성이 올라갑니다.
자주 묻는 질문
몇 초 길이의 숏폼이 가장 좋나요?
정답은 없지만, 처음에는 30~45초로 고정해 촬영·편집·반복 테스트의 진입 장벽을 낮추는 경우가 많습니다. 알고리즘은 "길이 자체"보다 "완시율"에 더 민감하므로, 짧더라도 끝까지 보게 만드는 구조가 중요합니다.
말투는 어떻게 결정하나요?
시청자가 익숙한 커뮤니케이션 수준(일상 대화/전문 용어)과 관계감(친구/선배/전문가)을 먼저 정합니다. 그 다음 문장 끝 어미를 통일하고("~해요" vs "~합니다" vs "~함"), 질문형과 단정형 중 하나를 메인 패턴으로 정하면 자연스러워집니다.
롱폼 영상 대본을 줄이면 숏폼 대본이 되나요?
단순히 줄이면 맥락이 잘려 불완전한 대본이 됩니다. 롱폼에서 "가장 강한 메시지 하나"를 뽑아내고, 그것을 중심으로 훅→전개→마무리를 3블록으로 새로 구성하는 편이 리듬이 살아납니다.
유머가 반드시 있어야 하나요?
필수가 아닙니다. 정보·공감·호기심·놀라움·감동 등 숏폼에서 작동하는 감정 트리거는 다양합니다. 채널 톤에 맞는 한 가지에 집중하고, 그 감정이 "이 영상을 끝까지 보게 하는 힘"인지만 점검하세요.
자막을 직접 편집해야 하나요?
대본이 자막 길이에 맞게 문장 단위로 쪼개져 나오므로, 그대로 자막 편집기에 붙여 넣으면 기본 자막 세팅이 됩니다. 다만 강조(볼드·색상)·타이밍·위치는 편집 단계에서 직접 조정해야 합니다.
한 번 만든 대본 구조를 계속 재사용해도 되나요?
네, 잘 작동하는 구조(예: 훅→3가지 팁→마무리)를 템플릿으로 고정하고 주제만 바꿔가는 것은 일관성 있는 시리즈 운영에 매우 효과적입니다. 다만 구독자 피로를 막기 위해 2~3가지 패턴을 번갈아 쓰는 것을 권장합니다.