Zůstaňte s námi

Ship From Your Phone: Vlastní AI delivery
Jedna zpráva z mobilu a AI delivery systém rozjede celou flow od review po release na vlastní infrastruktuře.

Jedna zpráva z mobilu a spustí se celý delivery stroj: review PR, incident flow, fix i preview release. Během minut dostanete analýzu, patch návrh, výsledky testů a auditní stopu. Vše běží self-hosted, takže server, pravidla, integrace i data zůstávají plně pod vaší kontrolou.
V praxi.
Do Slacku / WhatsApp / e-mailu napíšu:
- Líbilo by se mi, kdyby aplikace měla dark mode, implementuj to a nasaď preview, ať to můžu demovat.
- Dostal jsem review comments u mého PR, koukni na to, navrhni řešení, po mém approval to fixni a okomentuj v PR.
- Jak funguje TameTeq? Udělej research, vytvoř mi PDF a pošli mi ho na e-mail.
- Hey, appka failuje, koukni do logů, zjisti co se stalo, založ task a nasaď preview s fixem.
- Prozkoumej konkurenci na webu, porovnej jejich pricing a positioning s námi, připrav 1stránkové doporučení a pošli na e-mail managementu.
- Z interních dokumentů a wiki vytvoř onboarding plán pro nového člena týmu na první 2 týdny.
- Zjisti které meetingy tento týden nemají jasný outcome, navrhni agendu a zruš low-value cally.
Jak to funguje?
Jedna zpráva, celý workflow. Napíšu zprávu na interní Slack channel s žádostí o review PR a agent během chvíle napíše review report klidně přímo do githubu: rizikové změny, výsledky testů a návrhy konkrétních patchů, které může on sám přímo začít zpracovávat. Při incidentu aplikace stačí krátký příkaz. Agent sesbírá logy incidentu, založí ticket v task management systému, zreprodukuje chybu, připraví fix branch a pošle preview URL s nasazeným fixem, changelog i odhad dopadu na produkci. Stejně funguje i delivery nové feature. Popíšete požadovanou funkcionalitu, agent založí task, připraví změny v kódu, spustí testy, udělá základní kontrolu kvality a otevře PR s návrhem implementace. Ráno se zeptám, jaké důležité e-maily přišly. Agent vytáhne prioritní zprávy, připraví návrhy odpovědí v kontextu projektu a navazující úkoly automaticky zapíše do interního Slacku.
Tohle jsou jen ukázky. Ve skutečnosti je rozsah použití velmi široký: agent může pracovat s nástroji přes CLI, přes MCP integrace i s webem, pokud má správně nastavené přístupy. Jakýkoliv systém, který agent dokáže pochopit a bezpečně ovládat, lze zapojit do workflow.
Výsledek: Vyšší produktivita týmu, protože tým se soustředí na to důležité a zbaví se rutinních kroků. Zrychlí se operativa (review, fixy, reporty, handoffy), zkrátí se time-to-fix, a zároveň můžete orchestrací vykonávat více úloh paralelně a stihnout toho víc.
Proč mít execution vrstvu pod vlastní střechou.
SaaS platformy jsou fajn start. Jakmile ale agenti sahají na produkční repozitáře, incidenty a interní nástroje, začne rozhodovat něco jiného: audit, přístupová práva a bezpečnostní odpovědnost.
Self-hosted systém drží kritickou execution vrstvu uvnitř vašeho systému. Přístupy, logování, guardrails i volba model providerů jsou pod kontrolou od prvního příkazu po finální deploy.
- Žádný black-box mezi vámi a produkční exekucí
- Auditovatelný tok rozhodnutí a akcí
- Bezpečnostní policy a guardrails podle vlastních pravidel
- Flexibilní nastavení, integrace vlastních systémů
- Vlastní kontrola kvality, latence a ceny modelů
Playbook: 6 kroků k vlastnímu AI delivery systému.
Quick start: základní pilot je reálně hotový za 1-2 hodiny. Pokud máte připravený server, přístupy a API klíče, první funkční verzi rozběhnete během jednoho pracovního bloku. Neřešte perfekci na první dobrou, cílem je rychle spustit bezpečný základ, který funguje, a pak ho ladit za provozu.
1) Kupte server a připravte prostředí. Pro pilot stačí jeden stroj typu Ubuntu LTS, 4 vCPU, 8-16 GB RAM a SSD 80+ GB, například Hetzner, Vultr, DigitalOcean nebo AWS. Ceny u těchto providerů typicky začínají v nižších jednotkách eur měsíčně. Volitelně oddělte runtime, logy a secrets, aby se systém dal škálovat bez přepisování infrastruktury.
2) Nastavte server - přístupy, porty a firewall. Zaveďte SSH key-only, oddělené účty/role, minimálně otevřené porty (3000) a základní ochranu přes firewall. Zapněte audit logy, aby bylo dohledatelné, kdo a kdy spustil kritickou akci. Dále nainstalujte potřebný software pro AI delivery systém a váš software, který používáte, aby to Agent taky mohl používat - např. python, npm, docker, git, etc.
3) Nainstalujte agentní systém a orchestrace vrstvu. U pokročilejších setupů (např. Hermes) může být dostupná i gateway logika pro řízení nástrojů, přístupů a workflow kroků. Prakticky tím získáte mozek systému, který rozpadá tasky, deleguje práci a vrací konzistentní výstupy. Podle zvolené platformy navíc můžete ukládat statusy, držet oddělený kontext pro jednotlivé uživatele/projekty a průběžně upravovat instrukce.
4) Nastavte Hermes agenta, harness vrstvu a software stack. Nejdřív nastavte model providera, API klíče, oprávnění a role mezi orchestrační vrstvou a exekučními workery. Pak nastavte routing, fallback při výpadku a případně cost limity. Volitelně (advanced) přidejte orchestrační pravidla pro více uživatelů a více agentů, aby měl každý projekt oddělený kontext, memory i instrukce. Doporučeně nasaďte gateway vrstvu jako most mezi Hermes systémem a 3rd-party komunikačními kanály (Slack, Discord, WhatsApp), ať neřídíte systém jen z terminálu. Nakonec připravte software stack, který potřebuje tým i agent, aby mohl pracovat s dalšími systémy: git, GitHub CLI (PR flow), případně Linear, MCP servery (e-mail, dokumenty, kalendář), interní CLI pro deploy a observability a další software.
5) Spusťte systém jako službu. Agentní runtime se provozuje přes process management, health-check a jasné logování, aby byl použitelný každý den, ve dne v noci.
6) Komunikujte s agentem přes svoji aplikaci. Použijte Slack, Discord, WhatsApp, e-mail, terminál nebo vlastní appku. Doporučujeme nastavit instrukce, skills a guardrails (review standard, approval pravidla, reporting) pro agenta, ať máte konzistentní výstupy. Skills je vhodné průběžně ladit podle reálných systémů a jak je používáte. Praktické je to dělat přes agenta, který návrhy skills umí generovat z vašich instrukcí. U Hermes setupu lze navíc skills upravovat poloautonomně na základě konverzace a feedbacku.
Závěr playbooku: Začněte jednoduše, ale od začátku oddělte orchestrace, exekuci a přístupy. Právě to vám dá rychlost AI agentů bez ztráty kontroly nad kvalitou, bezpečností a náklady.
Hermes a Harness: jak spolu fungují
Hermes je orchestrace, tedy řídicí mozek systému. Přijme zadání od uživatele, drží kontext, rozpadne úkol na kroky, vybere nástroje a kontroluje guardrails. Jednoduše: Hermes rozhoduje, co se má udělat, v jakém pořadí a za jakých pravidel.
Harness není jeden univerzální produkt, ale architektonický pojem. V jednom týmu může znamenat hlavně exekuční vrstvu se specializovanými workery, jinde může fungovat i jako wrapper/orchestrace nad více agenty. Proto je klíčové si v projektu explicitně definovat, co přesně slovem harness označujete.
Providers jsou poskytovatelé modelů a služeb, které systém používá pod kapotou. Typicky jde o LLM providery (např. OpenAI, Anthropic nebo lokální endpoint), případně další služby pro embedding, reranking nebo tool API. Orchestrace pak může podle pravidel routovat požadavky podle ceny, latence, kvality nebo dostupnosti.
Jak to funguje dohromady v provozu: uživatel zadá úkol -> orchestrace ho naplánuje -> zvolí providera a vhodnou exekuční vrstvu/worker -> proběhne exekuce -> výstup se vrátí na kontrolu pravidel, kvality a bezpečnosti -> uživatel dostane finální odpověď. Při výpadku provideru nebo nástroje se použije fallback varianta, pokud je nadefinovaná.
Praktické shrnutí: Hermes je konkrétní příklad orchestrace; harness je role/pattern, jak organizovat exekuci. V dobře navrženém systému se tyto vrstvy doplňují a dávají rychlost agentů i provozní kontrolu nad daty, náklady a bezpečností.
- Hermes = orchestrace, kontext, pravidla, routing
- Harness = způsob, jak organizovat exekuci (podle architektury může být worker vrstva i wrapper)
- Claude Code / Codex = silní coding executeři, které lze zapojit do orchestrace
- Gateway + skills + guardrails = konzistentní provoz bez ručního přepínání
Kde to přinese největší ROI?
Největší ROI je tam, kde potřebujete mít provoz pod kontrolou: guidelines, přístupy, repozitáře, auditní stopu i bezpečnostní pravidla. Nečekáte na prostředníka, který za vás řídí AI systém, ale nastavujete vlastní standardy a rozhodování držíte interně.
Ekonomika je přímočařejší: typicky platíte hlavně server a model providera, ne další cloudovou AI vrstvu třetí strany. Výpočty i provoz běží na vašem serveru, takže lépe kontrolujete náklady, latenci i datový tok.
Současně získáte flexibilitu: napojíte libovolný software stack a k systému se připojíte odkudkoliv, přes terminál, oblíbenou aplikaci nebo vlastní interní appku.
"Nepronajímáme si cizí AI továrnu. Stavíme vlastní delivery engine pod plnou kontrolou, od instrukce po produkční výsledek."
Zdroje
Číst dále

RAG vs. File-Based Agents.
Místo File-based search agent vs RAG je užitečnější praktické srovnání: co je rychlejší na start, co dává lepší kontrolu a co škáluje. Tento článek shrnuje aktuální data z roku 2026 a převádí je do jednoduchého rozhodovacího rámce.

The Real 2026 Playbook: Orchestrating Coding Agents in Production
V roce 2026 už nejde o to, který coding agent je absolutně nejlepší. Každému týmu může sedět jiný styl asistenta. Důležité je AI asistenty skutečně používat v reálném delivery procesu, měřit dopad a držet seniorní kontrolu nad kvalitou i bezpečností.

AI-asistovaný vývoj: Proč budujeme rychleji?
Claude Code dnes generuje přes 134 tisíc GitHub commitů denně. Nejlepší vývojáři Spotify nenapsali od prosince ani řádek kódu, většinu píše AI. Vysvětlujeme, co se konknrétně mění ve vývoji software, a jak na to reagujeme.