Zůstaňte s námi

Získejte nejnovější novinky a nabídky přímo do vaší schránky.

Ship From Your Phone — vlastní AI delivery

Zpět na novinky

ai-agentsself-hostedmobile-devopshermesharnessmcpcto-playbook

Ship From Your Phone: Vlastní AI delivery

Jedna zpráva z mobilu a AI delivery systém rozjede celou flow od review po release na vlastní infrastruktuře.

14. května 2026

8 min čtení

napsal Marian Krotil

Jedna zpráva z mobilu a spustí se celý delivery stroj: review PR, incident flow, fix i preview release. Během minut dostanete analýzu, patch návrh, výsledky testů a auditní stopu. Vše běží self-hosted, takže server, pravidla, integrace i data zůstávají plně pod vaší kontrolou.

V praxi.

Do Slacku / WhatsApp / e-mailu napíšu:

Líbilo by se mi, kdyby aplikace měla dark mode, implementuj to a nasaď preview, ať to můžu demovat.
Dostal jsem review comments u mého PR, koukni na to, navrhni řešení, po mém approval to fixni a okomentuj v PR.
Jak funguje TameTeq? Udělej research, vytvoř mi PDF a pošli mi ho na e-mail.
Hey, appka failuje, koukni do logů, zjisti co se stalo, založ task a nasaď preview s fixem.
Prozkoumej konkurenci na webu, porovnej jejich pricing a positioning s námi, připrav 1stránkové doporučení a pošli na e-mail managementu.
Z interních dokumentů a wiki vytvoř onboarding plán pro nového člena týmu na první 2 týdny.
Zjisti které meetingy tento týden nemají jasný outcome, navrhni agendu a zruš low-value cally.

Jak to funguje?

Jedna zpráva, celý workflow. Napíšu zprávu na interní Slack channel s žádostí o review PR a agent během chvíle napíše review report klidně přímo do githubu: rizikové změny, výsledky testů a návrhy konkrétních patchů, které může on sám přímo začít zpracovávat. Při incidentu aplikace stačí krátký příkaz. Agent sesbírá logy incidentu, založí ticket v task management systému, zreprodukuje chybu, připraví fix branch a pošle preview URL s nasazeným fixem, changelog i odhad dopadu na produkci. Stejně funguje i delivery nové feature. Popíšete požadovanou funkcionalitu, agent založí task, připraví změny v kódu, spustí testy, udělá základní kontrolu kvality a otevře PR s návrhem implementace. Ráno se zeptám, jaké důležité e-maily přišly. Agent vytáhne prioritní zprávy, připraví návrhy odpovědí v kontextu projektu a navazující úkoly automaticky zapíše do interního Slacku.

Tohle jsou jen ukázky. Ve skutečnosti je rozsah použití velmi široký: agent může pracovat s nástroji přes CLI, přes MCP integrace i s webem, pokud má správně nastavené přístupy. Jakýkoliv systém, který agent dokáže pochopit a bezpečně ovládat, lze zapojit do workflow.

Výsledek: Vyšší produktivita týmu, protože tým se soustředí na to důležité a zbaví se rutinních kroků. Zrychlí se operativa (review, fixy, reporty, handoffy), zkrátí se time-to-fix, a zároveň můžete orchestrací vykonávat více úloh paralelně a stihnout toho víc.

Proč mít execution vrstvu pod vlastní střechou.

SaaS platformy jsou fajn start. Jakmile ale agenti sahají na produkční repozitáře, incidenty a interní nástroje, začne rozhodovat něco jiného: audit, přístupová práva a bezpečnostní odpovědnost.

Self-hosted systém drží kritickou execution vrstvu uvnitř vašeho systému. Přístupy, logování, guardrails i volba model providerů jsou pod kontrolou od prvního příkazu po finální deploy.

Žádný black-box mezi vámi a produkční exekucí
Auditovatelný tok rozhodnutí a akcí
Bezpečnostní policy a guardrails podle vlastních pravidel
Flexibilní nastavení, integrace vlastních systémů
Vlastní kontrola kvality, latence a ceny modelů

Playbook: 6 kroků k vlastnímu AI delivery systému.

Quick start: základní pilot je reálně hotový za 1-2 hodiny. Pokud máte připravený server, přístupy a API klíče, první funkční verzi rozběhnete během jednoho pracovního bloku. Neřešte perfekci na první dobrou, cílem je rychle spustit bezpečný základ, který funguje, a pak ho ladit za provozu.

1) Kupte server a připravte prostředí. Pro pilot stačí jeden stroj typu Ubuntu LTS, 4 vCPU, 8-16 GB RAM a SSD 80+ GB, například Hetzner, Vultr, DigitalOcean nebo AWS. Ceny u těchto providerů typicky začínají v nižších jednotkách eur měsíčně. Volitelně oddělte runtime, logy a secrets, aby se systém dal škálovat bez přepisování infrastruktury.

2) Nastavte server - přístupy, porty a firewall. Zaveďte SSH key-only, oddělené účty/role, minimálně otevřené porty (3000) a základní ochranu přes firewall. Zapněte audit logy, aby bylo dohledatelné, kdo a kdy spustil kritickou akci. Dále nainstalujte potřebný software pro AI delivery systém a váš software, který používáte, aby to Agent taky mohl používat - např. python, npm, docker, git, etc.

3) Nainstalujte agentní systém a orchestrace vrstvu. U pokročilejších setupů (např. Hermes) může být dostupná i gateway logika pro řízení nástrojů, přístupů a workflow kroků. Prakticky tím získáte mozek systému, který rozpadá tasky, deleguje práci a vrací konzistentní výstupy. Podle zvolené platformy navíc můžete ukládat statusy, držet oddělený kontext pro jednotlivé uživatele/projekty a průběžně upravovat instrukce.

4) Nastavte Hermes agenta, harness vrstvu a software stack. Nejdřív nastavte model providera, API klíče, oprávnění a role mezi orchestrační vrstvou a exekučními workery. Pak nastavte routing, fallback při výpadku a případně cost limity. Volitelně (advanced) přidejte orchestrační pravidla pro více uživatelů a více agentů, aby měl každý projekt oddělený kontext, memory i instrukce. Doporučeně nasaďte gateway vrstvu jako most mezi Hermes systémem a 3rd-party komunikačními kanály (Slack, Discord, WhatsApp), ať neřídíte systém jen z terminálu. Nakonec připravte software stack, který potřebuje tým i agent, aby mohl pracovat s dalšími systémy: git, GitHub CLI (PR flow), případně Linear, MCP servery (e-mail, dokumenty, kalendář), interní CLI pro deploy a observability a další software.

5) Spusťte systém jako službu. Agentní runtime se provozuje přes process management, health-check a jasné logování, aby byl použitelný každý den, ve dne v noci.

6) Komunikujte s agentem přes svoji aplikaci. Použijte Slack, Discord, WhatsApp, e-mail, terminál nebo vlastní appku. Doporučujeme nastavit instrukce, skills a guardrails (review standard, approval pravidla, reporting) pro agenta, ať máte konzistentní výstupy. Skills je vhodné průběžně ladit podle reálných systémů a jak je používáte. Praktické je to dělat přes agenta, který návrhy skills umí generovat z vašich instrukcí. U Hermes setupu lze navíc skills upravovat poloautonomně na základě konverzace a feedbacku.

Závěr playbooku: Začněte jednoduše, ale od začátku oddělte orchestrace, exekuci a přístupy. Právě to vám dá rychlost AI agentů bez ztráty kontroly nad kvalitou, bezpečností a náklady.

Hermes a Harness: jak spolu fungují

Hermes je orchestrace, tedy řídicí mozek systému. Přijme zadání od uživatele, drží kontext, rozpadne úkol na kroky, vybere nástroje a kontroluje guardrails. Jednoduše: Hermes rozhoduje, co se má udělat, v jakém pořadí a za jakých pravidel.

Harness není jeden univerzální produkt, ale architektonický pojem. V jednom týmu může znamenat hlavně exekuční vrstvu se specializovanými workery, jinde může fungovat i jako wrapper/orchestrace nad více agenty. Proto je klíčové si v projektu explicitně definovat, co přesně slovem harness označujete.

Providers jsou poskytovatelé modelů a služeb, které systém používá pod kapotou. Typicky jde o LLM providery (např. OpenAI, Anthropic nebo lokální endpoint), případně další služby pro embedding, reranking nebo tool API. Orchestrace pak může podle pravidel routovat požadavky podle ceny, latence, kvality nebo dostupnosti.

Jak to funguje dohromady v provozu: uživatel zadá úkol -> orchestrace ho naplánuje -> zvolí providera a vhodnou exekuční vrstvu/worker -> proběhne exekuce -> výstup se vrátí na kontrolu pravidel, kvality a bezpečnosti -> uživatel dostane finální odpověď. Při výpadku provideru nebo nástroje se použije fallback varianta, pokud je nadefinovaná.

Praktické shrnutí: Hermes je konkrétní příklad orchestrace; harness je role/pattern, jak organizovat exekuci. V dobře navrženém systému se tyto vrstvy doplňují a dávají rychlost agentů i provozní kontrolu nad daty, náklady a bezpečností.

Hermes = orchestrace, kontext, pravidla, routing
Harness = způsob, jak organizovat exekuci (podle architektury může být worker vrstva i wrapper)
Claude Code / Codex = silní coding executeři, které lze zapojit do orchestrace
Gateway + skills + guardrails = konzistentní provoz bez ručního přepínání

Kde to přinese největší ROI?

Největší ROI je tam, kde potřebujete mít provoz pod kontrolou: guidelines, přístupy, repozitáře, auditní stopu i bezpečnostní pravidla. Nečekáte na prostředníka, který za vás řídí AI systém, ale nastavujete vlastní standardy a rozhodování držíte interně.

Ekonomika je přímočařejší: typicky platíte hlavně server a model providera, ne další cloudovou AI vrstvu třetí strany. Výpočty i provoz běží na vašem serveru, takže lépe kontrolujete náklady, latenci i datový tok.

Současně získáte flexibilitu: napojíte libovolný software stack a k systému se připojíte odkudkoliv, přes terminál, oblíbenou aplikaci nebo vlastní interní appku.

"Nepronajímáme si cizí AI továrnu. Stavíme vlastní delivery engine pod plnou kontrolou, od instrukce po produkční výsledek."
— Tameteq

Zdroje

[1]

Hetzner Cloud Docshttps://docs.hetzner.com/cloud/

[2]

Model Context Protocol (MCP)https://modelcontextprotocol.io/docs/getting-started/intro

[3]

Anthropic Tool Use Overviewhttps://platform.claude.com/docs/en/agents-and-tools/tool-use/overview

[4]

Claude Code Overviewhttps://code.claude.com/docs/en/overview

[5]

Claude Code CLI Referencehttps://code.claude.com/docs/en/cli-reference

[6]

GitHub CLI Manualhttps://cli.github.com/manual/

[7]

OpenAI Codex CLI Docshttps://developers.openai.com/codex/cli

[8]

OpenAI Codex Cloud Docshttps://developers.openai.com/codex/cloud

[9]

OpenAI: Codex for (almost) everything (Apr 16, 2026)https://openai.com/index/codex-for-almost-everything/

[10]

Nous Research Hermes Agent (GitHub)https://github.com/nousresearch/hermes-agent

[11]

Nous Research Hermes Agent Releaseshttps://github.com/NousResearch/hermes-agent/releases

[12]

Anthropic: Building Effective AI Agentshttps://www.anthropic.com/engineering/building-effective-agents

[13]

LangGraph Workflows & Agentshttps://docs.langchain.com/oss/python/langgraph/workflows-agents

[14]

LangGraph Supervisor Referencehttps://reference.langchain.com/python/langgraph-supervisor

[15]

Hermes Agent Providers Integrationhttps://github.com/NousResearch/hermes-agent/blob/main/website/docs/integrations/providers.md

[16]

Google Workspace MCP Server (Gmail, Calendar, Drive)https://github.com/ngs/google-mcp-server

Číst dále

aiworkflow

2. června 2026

AI workflow pro interní procesy: nejrychlejší cesta k vyšší produktivitě

Většina firem dnes řeší AI příliš od viditelného povrchu. Chatbot, copilota do inboxu, jednu chytrou funkci na web. Jenže nejrychlejší obchodní dopad často leží jinde: v interních procesech, které každý týden stojí desítky hodin ruční práce. Právě tady dává smysl stavět malé interní systémy a workflow nad vašimi daty. Systémy, které sbírají podklady, třídí požadavky, připravují výstupy, hlídají návaznosti a zrychlují nudnou operativu. Výsledek není jen úspora času. Je to rychlejší firma, čistší provoz a tým, který se může soustředit na důležitější práci.

Číst článek

Coding agenti v květnu: co se skutečně změnilo

coding-agentsenterprise

20. května 2026

Coding agenti v květnu: co se skutečně změnilo

Květnové novinky kolem Codexu, Claude, Gemini a Cursoru mají společný směr: agenti dostávají víc kontextu, běží v řízených prostředích a lépe se napojují na pracovní systémy. Pro firmy to není signál koupit další chatové rozhraní, ale upravit workflow, přístupy a schvalování změn.

Číst článek

RAG vs file-based agents v enterprise architektuře

ragfile-search

4. května 2026

RAG vs. File-Based Agents.

Místo File-based search agent vs RAG je užitečnější praktické srovnání: co je rychlejší na start, co dává lepší kontrolu a co škáluje. Tento článek shrnuje aktuální data z roku 2026 a převádí je do jednoduchého rozhodovacího rámce.

Číst článek

Nová aktualizace•2026-06-02

AI workflow pro interní procesy: nejrychlejší cesta k vyšší produktivitě