11. června 2026

Nasazení za zdmi regulace: On-prem, hybrid a SQL, kterému se dá věřit

O stavbě bota, který se dotazuje skutečných firemních dat, platí nepříjemná pravda: organizace, které ho potřebují nejvíc, jsou ty, které vám to dovolí nejmíň. Nemocnice sedící na desítkách let zdravotnické dokumentace je dokonalým kandidátem na datového asistenta na přirozený jazyk — a zároveň jí zákon zakazuje pustit ta data přes hranici její sítě. Totéž platí pro banky, pojišťovny, veřejné instituce. Nejbohatší use-casy žijí za nejpřísnějšími zdmi.

Tohle není detail nasazení, který přišroubujete na konec. Je to omezení, které formuje architekturu od prvního commitu, a tahá za tři vlákna naráz: kde běží model, co smí dotazovací vrstva dělat a jak dokážete, že se to celé chová. Trefte je a prodáte do regulovaných odvětví. Zkazte je a vaši nejlepší zájemci se vašeho produktu nemůžou ani dotknout.

Cloud je snazší — pro vás, ne pro ně

Kdyby bylo po našem, většina týmů by stavěla čistě v cloudu. Spravované modelové endpointy, spravované databáze, elastické škálování, žádné servery k hlídání. Je to opravdu cesta nejmenšího odporu a pro neregulovaného klienta je to správná volba.

A zároveň je to nemožné pro klienty, na kterých tu záleží nejvíc. „Pošlete naše data pacientů do cizího cloudu" ukončí rozhovor. Disciplína proto velí navrhovat od prvního dne pro nasazení kamkoli — nikdy nepředpokládat konkrétní cloud, nikdy natvrdo nedrátovat spravovanou službu, kterou nedokážete replikovat uvnitř klientova firewallu. Ve chvíli, kdy vaše architektura předpokládá cloud, jste se tiše diskvalifikovali z každého regulovaného obchodu.

Hybridní rozdělení: data nechte doma, pronajměte si jen mozek

Nemusíte volit mezi „všechno v cloudu" a „všechno on-prem". Vzorec, který provleče nit uchem jehly, odděluje data od inteligence.

Data zůstanou přesně tam, kde legálně musí — uvnitř klientovy sítě, nikdy nezkopírovaná ven. Co může žít vzdáleně, je model: uvažující „mozek", který mění otázku na dotaz. Ty dva jsou propojené bezpečným tunelem, takže se cloudová komponenta může dotazovat on-prem databáze, aniž by ta data kdy spočinula mimo budovu. Nic citlivého se navenek neukládá; model vidí jen to, co potřebuje, za běhu, aby odvedl svou práci.

A když ani to neprojde schválením — některá prostředí zakazují jakékoli externí volání — tatáž architektura pojme i plně lokální model běžící uvnitř klientovy vlastní infrastruktury. Pointa není jedna topologie nasazení. Pointa je, že návrhu je jedno, do které z nich přistane.

Co dělá tuhle přenositelnost skutečnou, je kontejnerizace. Zabalte aplikaci do kontejnerů a orchestrujte je platformami, které regulovaná IT oddělení už provozují — Kubernetes, OpenShift — a „nasaď do našeho cloudu" i „nasaď na vlastní servery nemocnice" se stanou touž operací s jiným cílem. Stavíte a testujete jednou; cíl nasazení se stává konfigurací, ne přepisem.

Dotazovací bot potřebuje tvrdou bezpečnostní vrstvu, ne dobré úmysly

A teď část, která by vás měla budit ze spaní: dáváte jazykovému modelu schopnost spouštět dotazy proti produkční databázi. Model je ochotný, plynulý a — nechaný bez omezení — dokonale schopný nechat se ukecat k něčemu, co by dělat neměl. Nespoléháte na slušné chování modelu. Postavíte zeď, kterou neprojde, a model umístíte na její bezpečnou stranu.

Tou zdí je vyhrazená vykonávací vrstva, kterou musí projít každý vygenerovaný dotaz, a vynucuje, mechanicky:

Vždy jen pro čtení. Agent smí číst. Nesmí zapisovat. Tečka.
Blocklist se zuby. Cokoli destruktivního nebo strukturálního je odmítnuto dřív, než to běží — mazání, updaty a inserty, dropy, truncaty a altery, administrativní a hromadné operace. Model nebezpečný příkaz nikdy ani nezkusí.
Timeouty. Každý dotaz má tvrdý časový rozpočet, takže nic — náhodou ani záměrně — nemůže databázi tlouct.
Automatické stropy na řádky. Neohraničený SELECT dostane limit nasazený za sebe, takže nedbalý dotaz nemůže vytáhnout milion řádků.
Ochrana proti více příkazům. Jeden požadavek je jeden příkaz. Naskládané nebo injektované příkazy se detekují a odmítnou — klasický injekční vektor, zavřený.
Normalizace před validací. Komentáře a obfuskace se odstraní dřív, než se dotaz zkontroluje, takže nikdo nepropašuje nebezpečnou klauzuli kolem filtru tím, že ji schová.

Tvar principu je vždy stejný: model navrhuje, bezpečnostní vrstva rozhoduje. Inteligence radí; deterministická, auditovatelná brána rozhodne, co se skutečně dotkne dat. V regulovaném prostředí ta brána není luxus — je to první věc, na kterou se bezpečnostní prověrka zeptá.

Čistá architektura je to, co dělá bezpečnost auditovatelnou

Existuje architektonická volba, která tohle všechno dramaticky usnadňuje zabezpečit a dokázat: nechte frontend hloupý a backend fasádou.

Frontend by neměl držet žádnou byznys logiku a nemá vědět nic o tom, jak jsou data strukturovaná. Pošle otázku; vykreslí odpověď. To je celá jeho práce. Veškerá složitost — schéma, agent, bezpečnostní vrstva — žije za backendem, který funguje jako jediná transformující fasáda: bere neuspořádanou realitu vašich dat a vrací čisté, předvídatelné objekty. Stabilní kontrakt navenek, všechno soukolí schované uvnitř.

To není jen pořádkumilovnost. Znamená to, že existuje jedno místo, kde se dotazy staví, kontrolují a vykonávají — jediné hrdlo, kde žije každé bezpečnostní pravidlo a každý auditní záznam. Nemůžete zabezpečit systém, jehož přístup k databázi je rozmazaný přes tucet frontendových komponent. Naprosto ale zabezpečíte ten, kde každý dotaz protéká jedinou, pozorovatelnou bránou. V regulovaném kontextu je „ukažte mi přesně, kde se k datům přistupuje a jak je to řízené" otázka, na kterou musíte umět odpovědět jedním dechem. Čistá fasáda je způsob, jak na ni odpovíte.

Dokažte, že se chová: evaluační harness

Tady je selhání, které ukončuje regulované obchody: „fungovalo to, když jsme to testovali". Systém, který se chová v jednom demo běhu, na počítači jednoho inženýra, nedokázal nic o tom, jak se zachová pro jiného uživatele s jinou otázkou příští týden. Ruční namátkové kontroly se neškálují a nepřesvědčí nikoho, jehož prací je být skeptický.

Odpovědí je evaluační harness — automatizované testy na úrovni otázek, ne kódu. Každý testovací případ zachycuje skutečnou otázku a to, co správná odpověď vyžaduje:

Otázka, v přirozeném jazyce: „Kolik zaměstnanců je v oddělení Finance?"
Objekty, kterých se musí dotknout — minimální sada tabulek a sloupců, které správný dotaz musí použít. Kontrolujete, že dotaz agenta je jejich nadmnožinou; smí použít víc, ale nesmí vynechat to podstatné.
Očekávaný výsledek — řádky, nebo pravidlo typu „víc než nula", které správná odpověď vyprodukuje.

Spusťte je proti zmraženému snapshotu testovací databáze — takovému, který se vám nemění pod rukama replikací nebo nočními úlohami — a zapojte je do CI, aby se každá změna měřila proti celé sadě. Teď má „funguje to pořád" skutečnou odpověď, automaticky, při každém commitu. Regrese, která se dřív objevila před uživatelem, se objeví před vývojářem.

Obalte to telemetrií — pokusů na odpověď, úspěšnost, nejčastější způsoby selhání, které asociace si opravdu zaslouží své místo — a máte něco vzácného: důkaz. Ne „obvykle to funguje", ale změřený, reprodukovatelný popis toho, jak se systém chová a kde ne. To je to, co vám umožní zlepšovat se záměrně místo hádání, a to je to, co potřebuje vidět rizikový tým seriózního klienta, než pustí bota k jeho datům.

Důvěra je to, co dodáváte

Udělejte krok zpět a hlavní linka je jasná. Schopnost on-prem, hybridní rozdělení, read-only bezpečnostní brána, čistá fasáda, evaluační harness — nic z toho není o tom udělat bota chytřejším. Je to o tom udělat ho důvěryhodným: udržet data tam, kde musí ze zákona zůstat, učinit ho prokazatelně neschopným škody a podepřít každé tvrzení reprodukovatelným důkazem.

V uživatelském softwaru můžete vydat „obvykle to funguje" a iterovat v produkci. Za zdí regulace je důvěra sama o sobě produktem — a zabudovává se od prvního rozhodnutí o tom, kde běží model, ne dojednává na konci. Stavte pro nejpřísnějšího klienta, jakého kdy budete mít, a každé další nasazení je snazší. Stavte pro toho snadného a klienti, kteří vás potřebovali nejvíc, nikdy nebyli v dosahu.

Prodáváte datového bota do zdravotnictví, financí nebo veřejného sektoru? Rezidence dat, prokazatelná bezpečnostní vrstva a skutečný evaluační harness jsou to, co vás provede bezpečnostní prověrkou. Pojďme zmapovat, co „dost důvěryhodné na nasazení" znamená pro vaše prostředí.