2026년 5월 7일, 텔레그램이 자체 블로그를 통해 발표한 업데이트는 단순한 기능 개선을 넘어 자율 AI 에이전트 인프라의 표준 통로를 노린 선언에 가깝습니다. 파벨 두로프(Pavel Durov)는 같은 날 자신의 X 계정에 "Huge Telegram update is out — 10+ major new features, 200+ improvements"라고 짧게 올렸지만, 글의 진짜 무게는 게스트 봇(Guest Bots)과 봇 간 통신(Bot-to-Bot Communication)이라는 두 가지 기능 변화에 있습니다. 메신저가 자율 에이전트의 실행 환경이 된다는 의미이기 때문입니다.
현재 텔레그램은 월간 활성 사용자 10억 명을 넘긴 글로벌 메신저이며, 2024–2025년 처음으로 연 매출 10억 달러를 돌파했습니다. 정직원은 약 30~40명 수준으로 알려져 있고, 운영의 상당 부분을 봇 생태계와 자율 모더레이션에 위임해 왔습니다. 이런 구조 덕분에 Bot API가 매우 개발자 친화적이고, TON 결제·Stars·Mini App 같은 수익화 레일이 이미 깔려 있습니다. 자율 AI 에이전트 진영이 텔레그램을 선택하는 것은 우연이 아닙니다.
실제로 2026년 자율 AI 에이전트 시장에서 가장 빠르게 성장한 두 프로젝트가 모두 텔레그램을 1순위 메시징 채널로 문서화하고 있습니다. 하나는 Peter Steinberger가 만든 OpenClaw(오픈클로)로, GitHub 역사상 가장 빠르게 성장한 오픈소스 AI 에이전트 프레임워크입니다. 다른 하나는 Nous Research가 2026년 2월 25일 출시한 헤르메스 에이전트(Hermes Agent)로, 자기 학습·자기 개선 루프를 갖춘 자율 에이전트입니다. 두 프로젝트 모두 디스코드·슬랙·시그널·왓츠앱을 지원하지만, 공식 문서에서 가장 비중 있게 다루는 채널은 텔레그램입니다.
이 글은 텔레그램 공식 블로그(telegram.org/blog/ai-bot-revolution-11-new-features) 발표를 기준으로 신기능을 정리하고, OpenClaw·헤르메스의 공식 문서를 교차 분석해 두 에이전트가 텔레그램을 통로로 선택한 구조적 이유를 짚어봅니다.
1. 텔레그램 AI 봇 혁명의 핵심 11가지 신기능
공식 블로그가 "AI Bot Revolution"이라는 제목을 단 이유는 명확합니다. 봇이 더 이상 채널 내 자동응답기가 아니라, 임의의 채팅에 호출 가능한 외부 자율 에이전트로 격상됐기 때문입니다. 두로프는 텔레그램을 "모든 AI 모델이 자유롭게 경쟁하고 사용자가 경험을 완전히 통제하는 유일한 플랫폼"이라고 표현했습니다.
1.1 핵심 5대 기능: 자율 에이전트 인프라
- 게스트 봇(Guest Bots) — 봇이 채팅방의 멤버가 아니어도
@username멘션만으로 호출 가능. 봇은 자신이 태그된 메시지와 그 답글만 볼 수 있고, 채팅방 멤버 목록이나 다른 메시지에는 접근 불가 - 봇 간 통신(Bot-to-Bot) — 봇이 사용자뿐 아니라 다른 봇의 메시지에도 응답 가능. 완전 자율 멀티 에이전트 워크플로우 구성에 직접 활용
- 스트리밍 텍스트(Streaming Text) — Bot API 9.x에서 LLM 응답을 토큰 단위로 스트리밍. 새 애니메이션과 함께 ChatGPT 수준의 체감 응답 속도 제공
- 프로필 채팅 자동화(Chat Automation in Profiles) — 모든 사용자가 봇을 자기 프로필에 연결해 본인 대신 메시지에 응답하도록 설정 가능. 어떤 채팅에 접근할지 세밀하게 제한
- 커스텀 AI 스타일(Custom AI Styles) — 텍스트 에디터에서 본인 프롬프트로 고유 스타일을 만들고, 공유 링크로 다른 사용자에게 즉시 전달
1.2 부가 6대 기능: 운영·검색·모더레이션
- 1억 이모지·스티커 검색 — 36개 언어 키워드 검색을 Cocoon Network에서 동작하는 커스텀 AI 모델이 처리
- 투표 통계 그래프 — 100표 이상 투표에 대해 시간별 옵션별 득표 추이 표시
- 투표 참가 제한 — 채널 구독자만 또는 특정 국가만 투표 가능하도록 제한
- 무음 예약 메시지 — 예약된 메시지를 알림 없이 조용히 발송
- 그룹 리액션 삭제 — 모더레이터가 특정 사용자의 리액션을 두 탭으로 일괄 제거
- 200개 이상 버그 수정 — 텔레그램의 Bug and Suggestion Platform 기반 개선
핵심 포인트: 11가지 중 가장 파급력이 큰 것은 게스트 봇과 봇 간 통신입니다. 이 둘은 "채팅방 = 자율 에이전트 실행 환경"이라는 새로운 패러다임을 만들고, 한 번 멘션으로 멀티 에이전트가 협업하는 시나리오를 OS 수준 권한 분리 없이도 구현하게 합니다.
2. OpenClaw와 헤르메스, 두 자율 에이전트의 정체
텔레그램 신기능을 제대로 활용하는 주체가 자율 AI 에이전트입니다. 2026년 자율 에이전트 시장의 양대 산맥인 OpenClaw와 헤르메스를 먼저 정확히 짚어야 텔레그램이 왜 통로로 부상했는지 이해됩니다.
2.1 OpenClaw(오픈클로): 채널 통합과 생태계 폭의 강자
- 창시자: Peter Steinberger(전 PSPDFKit 창업자)
- 첫 공개: 2025년 후반, 2026년 들어 GitHub 역사상 가장 빠른 성장 곡선 기록
- 컨셉: "실제로 일을 하는 AI" — 인박스 정리, 이메일 발송, 캘린더 관리, 항공 체크인까지 메신저에서 직접 실행
- 메모리 구조:
SOUL.md파일이 에이전트의 정체성·가치·행동 원칙을 정의하고,AGENTS.md가 도구·스킬을 선언적으로 묶음 - 확장: ClawHub라는 스킬 마켓플레이스에 205개 이상의 production-ready 템플릿 누적(awesome-openclaw-agents 기준)
- 채널 지원: WhatsApp, Telegram, Discord, Slack, Web UI, CLI를 단일 메모리로 통합
- 실행 모델: 자체 호스팅(로컬 또는 VPS), grammY 기반 텔레그램 게이트웨이, long polling 기본·webhook 옵션
2.2 헤르메스 에이전트(Hermes Agent): 자기 개선 루프의 강자
- 개발사: Nous Research(Hermes·Nomos·Psyche 모델 패밀리 개발사)
- 출시: 2026년 2월 25일, 오픈소스(GitHub: nousresearch/hermes-agent)
- 컨셉: "the agent that grows with you" — 사용자의 사용 패턴을 학습해 스킬을 스스로 작성·개선
- 자기 개선 루프: 약 15회 도구 호출마다 자기 성능을 평가하고 프롬프트·스킬을 변이(mutation)
- 메모리·세션: 채널·사용자·토픽별 격리, SQLite 기반 영속화, ChatGPT 스타일 멀티 세션
- 채널 지원: Telegram(가장 자세히 문서화), Discord, Signal, Slack, Matrix, Feishu, WhatsApp
- 음성·미디어: 다양한 STT·TTS 백엔드 지원, PDF·DOCX·XLSX·EPUB·APK까지 native 첨부
2.3 두 에이전트 비교: 어떤 작업에 강한가
| 항목 | OpenClaw | Hermes Agent |
|---|---|---|
| 핵심 강점 | 채널 통합 폭·스킬 마켓 | 자기 개선·메모리 깊이 |
| 메모리 정의 | SOUL.md + AGENTS.md 선언형 |
에이전트가 직접 작성하는 스킬 |
| 스킬 출처 | ClawHub 등 외부 템플릿 위주 | 자기 사용 경험에서 자동 생성 |
| 텔레그램 게이트웨이 | grammY 기반, 다계정 지원 | python-telegram-bot 기반 |
| DM 토픽 멀티 세션 | 지원(threadReplies 옵션) |
Bot API 9.4 Private Chat Topics 활용 /topic |
| 그룹 권한 분리 | groups·groupAllowFrom·topics 트리 구조 |
TELEGRAM_ALLOWED_USERS·GROUP_ALLOWED_CHATS |
| 자기 학습 루프 | 외부 스킬 추가에 의존 | 15회마다 자체 평가·변이 |
| 진입 난이도 | 낮음(노코드 UI 다수) | 중간(개발자 친화) |
| 대표 적용처 | 비즈니스 자동화·다채널 운영 | 1인 개발자·연구자·자기 비서 |
The New Stack의 비교 기사는 "OpenClaw는 통합의 폭, 헤르메스는 학습의 깊이"라고 정리합니다. 두 진영 모두 텔레그램을 1순위 채널로 두고 있고, 결과적으로 텔레그램이 자율 에이전트 시장의 사실상 표준 인터페이스가 됐습니다.
3. 텔레그램이 발표문에서 강조한 권한 모델
게스트 봇과 봇 간 통신이 위협적으로 들리지 않는 이유는 권한 모델이 좁고 명시적이기 때문입니다. 텔레그램은 게스트 봇의 가시성을 다음과 같이 한정했습니다.
3.1 게스트 봇 권한 범위
- 봇은 자신이 태그된 메시지와 그 답글만 읽을 수 있음
- 채팅방 참가자 목록이나 다른 사용자 메시지는 접근 불가
- 답변은 태그된 채팅방 안에서 직접 표시됨
- 봇 운영자는 Guest Mode를 명시적으로 활성화해야 함
- 사용자가 멘션을 그만두면 즉시 노출이 차단됨
이 설계는 Slack 앱, Discord 봇, WhatsApp Business API와 비교했을 때 매우 가볍습니다. 슬랙 앱은 워크스페이스 단위 권한, 디스코드 봇은 서버 단위 권한이 필요하고, 왓츠앱 비즈니스 API는 Meta 승인을 받아야 합니다. 반면 텔레그램은 사용자 멘션 한 번으로 권한이 발생하고 멘션이 끝나면 사라집니다. 자율 에이전트 호출의 진입 장벽이 사실상 0에 가깝습니다.
OpenClaw의 텔레그램 채널 문서가 강조하는 dmPolicy와 groupPolicy 구조도 텔레그램의 이런 설계에 그대로 맞춰져 있습니다. pairing(기본)·allowlist·open·disabled 4단계 DM 정책과, 그룹·토픽별 별도 allowlist를 모두 config로 분리해, 1인 운영자도 권한 누수 없이 다중 그룹·다중 사용자에 봇을 안전하게 배포할 수 있습니다.
4. OpenClaw·헤르메스가 텔레그램을 1순위 통로로 삼은 이유
같은 자율 에이전트 진영이 다른 메신저보다 텔레그램을 우선하는 이유는 단순 인기 때문이 아닙니다. 메신저 자체의 구조적 특성이 자율 에이전트의 요구사항과 정확히 맞아떨어지기 때문입니다.
4.1 5가지 구조적 우위
- 사용자 1인당 봇 인스턴스화 비용이 0 — 누구나 BotFather에서 두 번의 탭으로 토큰을 발급받아 자기 에이전트와 연결 가능. 슬랙·디스코드는 관리자 권한, 왓츠앱은 Meta 검증 필요
- Bot API의 일관성과 문서화 — HTTP 기반 단순 인터페이스, 첨부·인라인 키보드·웹훅·롱폴링이 모두 동일 API에 정리. 신기능도 9.x 시리즈로 빠르게 누적되며 OpenClaw(grammY)·헤르메스(python-telegram-bot)가 모두 안정적으로 추적
- TON 블록체인과 Telegram Stars 결제 레일 — 사용자가 봇 안에서 즉시 결제 가능. Forbes 보도(2026.04.28)에 따르면 두로프는 "AI 에이전트가 곧 유료 고객"이라는 비전을 공식화
- 10억 사용자 + 30~40명 운영의 자율 규제 문화 — 플랫폼이 콘텐츠를 일일이 심사하지 않기 때문에 봇·자동화의 정책적 마찰이 적음(이는 동시에 규제 리스크의 다른 면)
- 모델 중립성 — 텔레그램 자체가 AI 모델을 운영하지 않고 "모든 AI 모델이 자유롭게 경쟁"한다는 입장. OpenClaw는 ClawHub의 스킬 다양성, 헤르메스는 Nous 모델 + 외부 모델 혼합을 모두 동일 채널에 띄울 수 있음
4.2 비교: 자율 에이전트 통로로서의 메신저
| 항목 | Telegram | Discord | Slack | |
|---|---|---|---|---|
| 글로벌 MAU | 10억+ | 30억+ | 1.5억+ | 0.6억+ |
| 봇 생성 진입장벽 | 매우 낮음 | 높음(Meta 승인) | 중간 | 중간 |
| 봇이 임의 채팅에 호출 | 게스트 봇으로 가능 | 비즈니스 채널만 | 서버 멤버만 | 워크스페이스만 |
| 봇 간 자율 통신 | 공식 지원(2026.05) | 매우 제한 | 가능하나 우회 | 제한 |
| 결제 레일 | TON·Stars·외부 결제 | 외부 결제 | 외부 결제 | 외부 결제 |
| 콘텐츠 모더레이션 강도 | 낮음 | 매우 높음 | 중간 | 중간 |
| 자율 에이전트 1순위 채택 | OpenClaw·헤르메스 모두 | 보조 채널 | 보조 채널 | 보조 채널 |
특히 "봇이 채팅방 멤버가 아니어도 멘션으로 호출 가능"한 게스트 봇 기능은 다른 메신저에서 찾기 힘듭니다. 한 채팅방에 여러 자율 에이전트를 상주시키지 않고, 필요할 때 부르고 끝나면 떠나보내는 라이트 호출 패턴을 가능하게 만듭니다. 이는 OpenClaw의 "멀티 채널 단일 메모리" 철학과, 헤르메스의 "세션 격리" 철학 모두에 잘 맞습니다.
5. Cocoon Network와 분산 GPU 인프라의 의미
발표문에서 눈에 잘 띄지 않지만 중요한 부분이 "이모지·스티커 검색이 Cocoon Network에서 동작하는 커스텀 AI 모델로 구현됐다"는 문장입니다. Cocoon은 텔레그램이 추진하는 분산 GPU 컨피덴셜 컴퓨팅 네트워크로, TEE(Trusted Execution Environment) 기반에서 모델을 돌립니다. 즉 텔레그램은 자체 데이터센터에 모델을 가두는 대신, 외부 GPU 노드에 작업을 분산시켜 비용과 검열 위험을 동시에 낮추려 합니다.
5.1 Cocoon이 의미하는 변화
- AI 추론 비용을 텔레그램이 직접 부담하지 않는 구조
- 모델 가중치와 데이터가 TEE 안에서 격리되어 운영자도 열람 불가
- 봇·게스트 봇·스티커 검색 같은 신기능이 동일 인프라에서 확장
- 외부 모델 운영자에게 GPU 보상이 흘러가는 토큰 경제 결합
- 글로벌 검열 환경에서 단일 실패점 없이 AI 기능을 유지하기 위한 설계
이 인프라가 자리잡으면 텔레그램은 단순 메신저가 아니라 자율 에이전트 추론의 분산 라우팅 레이어가 됩니다. OpenClaw와 헤르메스 같은 자체 호스팅 에이전트는 사용자 측 추론을 담당하고, 텔레그램은 채널·검색·모더레이션 같은 플랫폼 측 추론을 Cocoon에 분산시키는 이중 구조가 만들어집니다.
6. 개발자·운영자가 지금 취해야 할 행동
신기능이 흥미롭다고 해서 모든 채널 운영자가 곧바로 봇 자동화에 뛰어들 필요는 없습니다. 다만 자기 워크플로우에 적용 가능한 영역을 빠르게 파악해두는 편이 유리합니다.
6.1 개인 사용자 단계
- Settings > Chat Automation에서 어떤 봇이 자기 프로필에 연결되어 있는지 점검
- 게스트 봇 사용 시 멘션한 메시지와 답글만 노출된다는 점 인지
- 본인 정보가 노출되지 않도록 신뢰 가능한 봇만 사용
- 자체 LLM API 키 보관 시 봇 토큰과 분리 저장
6.2 팀·커뮤니티 운영자 단계
- 그룹에서 사용 중인 봇의 Privacy Mode 설정 재확인(BotFather
/mybots) - 봇을 그룹 어드민으로 승격할지, mention-only로 동작할지 정책 결정
- 포럼 토픽이 있다면 토픽별 스킬·프롬프트 분리(OpenClaw의
groups.*.topics.*또는 헤르메스의group_topics패턴 참고) - 새 게스트 봇 도입 전 데이터 보안 영향 평가
- 봇 운영자에게 프라이버시 정책 등록 요구
6.3 자율 에이전트 사용자 단계
- OpenClaw 채택 시 —
SOUL.md와AGENTS.md에 본인 작업 컨텍스트와 도구 권한을 명확히 선언, ClawHub에서 검증된 스킬만 가져오기 - 헤르메스 채택 시 —
TELEGRAM_ALLOWED_USERS에 본인 user ID만 등록,/topic으로 작업별 세션 분리, STT·TTS 백엔드는 비용·프라이버시 기준으로 선택 - 두 에이전트 모두 — 클라우드 배포 시 webhook 모드로 sleep-when-idle 활용해 인프라 비용 절감
- DNS 차단 환경에서는 헤르메스의 DoH 폴백 IP, OpenClaw의
apiRoot·proxy옵션을 활용
6.4 봇 개발자 단계
- Bot API 9.x로 마이그레이션해 스트리밍 텍스트와 게스트 봇 활성화
- 게스트 봇 가이드(core.telegram.org/bots/features#guest-bots)에 따라 Guest Mode 명시적 등록
- 봇 간 통신을 활용한 멀티 에이전트 파이프라인 설계(라우터·실행자·검증자 분리)
- Webhook 모드 + 클라우드 auto-wake로 인프라 비용 절감
- TON·Stars 결제 도입 검토(에이전트별 유료 기능 분리)
- 자체 프라이버시 정책 작성 후 BotFather
/setprivacy_policy로 등록 - Cocoon Network나 자체 GPU 클러스터로 추론 분산 검토
7. 마무리
위에서 살펴본 텔레그램 AI 봇 혁명과 OpenClaw·헤르메스의 통로화 핵심 내용을 정리하면 다음과 같습니다.
핵심 요약:
- 2026년 5월 7일 텔레그램 업데이트의 핵심은 게스트 봇·봇 간 통신·채팅 자동화 등 11가지 신기능, 그중 자율 에이전트 인프라 변화가 가장 파급력이 큼
- 게스트 봇은 채팅방 멤버가 아닌 봇을 멘션으로 호출하는 기능이며, 봇은 태그된 메시지만 볼 수 있도록 권한이 좁게 설계됨
- 봇 간 통신은 라우터·실행자·검증자로 구성된 자율 멀티 에이전트 파이프라인을 메신저 안에서 직접 구현하게 함
- Peter Steinberger의 OpenClaw는 SOUL.md 기반의 채널 통합 폭이 강점, Nous Research의 헤르메스는 자기 개선 루프와 메모리 깊이가 강점
- 두 에이전트 모두 텔레그램을 1순위 채널로 두는 이유는 BotFather 진입장벽 0, Bot API의 일관성, TON·Stars 결제, 모델 중립성, Cocoon 분산 인프라 다섯 가지
- 개인은 Chat Automation 설정 점검, 운영자는 Privacy Mode·토픽 분리, 자율 에이전트 사용자는 SOUL.md 또는
/topic세션 분리, 개발자는 Bot API 9.x 마이그레이션을 우선순위로 다뤄야 함
자율 에이전트가 메신저로 이동하는 흐름은 이미 시작됐고, 텔레그램은 그 입구를 가장 넓게 열어둔 플랫폼입니다. OpenClaw든 헤르메스든 한 번이라도 자기 워크플로우에 연결해 본 사람이라면, 이번 업데이트는 단순 기능 변화가 아니라 인프라 전환의 신호로 읽는 편이 정확합니다.