20. června 2026
Asociace: Jak naučit bota mluvit řečí vaší domény
Tady je otázka, která rozbíjí víc znalostních botů než jakékoli omezení modelu: uživatel se zeptá „kolik máme zaměstnanců?" a vaše databáze ukládá lidi v tabulce jménem H_OSOBA. Nic v těch osmi znacích modelu neřekne, že právě tady zaměstnanci bydlí. Sloupec pro jejich titul je TITUL_PRED_KOD. Číselník, který z kódu udělá „inženýr", je H_C_TITUL_PRED. Pro jazykový model — pro kohokoli, kdo tohle schéma nestavěl — jsou to neprůhledné šifry.
Týmy nejdřív sáhnou po zřejmém řešení: určitě má databáze někde lidsky čitelné názvy? Obvykle má, a obvykle jsou k ničemu — automaticky vygenerované, zkrácené nebo špatné. Skutečná doménová znalost — že „personál", „lidi", „stav" i „zaměstnanci" míří na H_OSOBA — ve schématu vůbec nežije. Žije v hlavách těch tří lidí, co tu pracují nejdéle.
Úkolem je dostat tuhle znalost z jejich hlav před model. Artefaktem, který to dělá, je to, čemu říkáme vrstva asociací, a je to ta nejmocnější věc, kterou můžete postavit.
Co asociace vlastně je
Asociace je malý, lidsky napsaný překlad mezi jazykem vaší domény a názvy ve vašem schématu. Přichází ve třech podobách, od nejjednodušší po nejbohatší.
- Aliasy — slova, která uživatelé skutečně říkají. Pro
H_OSOBA: zaměstnanec, osoba, personál, pracovník, lidi, stav. Holá klíčová slova, slovník lidí, kteří se ptají. - Nápovědy — věta kontextu v přirozeném jazyce. „Tato tabulka drží hlavní záznam o každém zaměstnanci." Ne klíčové slovo, ale vysvětlení — to, co byste řekli nováčkovi první den.
- Poznámky ke sloupcům — cílené vysvětlivky k záhadným polím.
TITUL_PRED_KOD: kód titulu před jménem, např. Ing., Mgr. Právě tady leží většina bolesti se záhadným schématem a právě tady jeden řádek textu ušetří model od hádání.
Nic z toho neučí model nové uvažování. Učí model váš slovník. A slovník, jak se ukazuje, je skoro celá bitva.
Pokud jste někdy viděli, jak Rovo od Atlassianu podtrhne v Confluence zkratku a vysvětlí, že „SB" znamená „Stylebot", viděli jste vrstvu asociací v akci. Je to stejný tah: prohledat soukromý jazyk domény a udělat ho čitelným. My to jen děláme pro databázi místo pro wiki.
Proč je tohle knowledge management, ne konfigurace
Je lákavé zařadit asociace pod „konfiguraci" a jít dál. Tím se ale podceňuje, co se děje. Vrstva asociací je akt zachycení znalosti: berete tichou institucionální znalost — nezdokumentovanou, kmenovou, odcházející ze dveří, když někdo dá výpověď — a kódujete ji do trvalé, dotazovatelné podoby.
To mění, jak s ní zacházíte. Slovník, který zachycuje institucionální znalost, si zaslouží být vlastněn, verzován a udržován jako aktivum, kterým je — ne zahrabán v komentáři v kódu. Nejlepší vrstvy asociací umí editovat doménový expert, který nenapíše ani řádek SQL, protože člověk, který ví, že „stav lidí" znamená H_OSOBA, je málokdy ten, kdo napsal dotazovací engine.
Vkládáte ji — neučíte se na ní
Mechanismus je záměrně nudný, a to je přednost. Asociace se doručují přes in-context learning: ve chvíli, kdy se bot rozhoduje, kterých tabulek se otázka týká, vložíte relevantní asociace přímo do promptu. Žádný fine-tuning, žádný tréninkový běh, žádný modelový artefakt k verzování.
Místo holého názvu tabulky ukážete modelu název s briefingem:
Tabulka: H_OSOBA — Aliasy: zaměstnanec, personál, pracovník, lidi — Popis: hlavní záznam o každém zaměstnanci — Sloupce: TITUL_PRED_KOD (titul před jménem, např. Ing., Mgr.), H_OSO_PXID (primární klíč)
Rozdíl v přesnosti výběru tabulek není nenápadný. A protože jde o vkládání, ne o trénink, může doménový expert vylepšit bota v 16:00 a v 16:01 je bot chytřejší — žádný deploy, žádné přeučování, žádné čekání.
Jeden detail stojí za ukradnutí: krmte asociacemi obě fáze. Bot je použije, když vybírá relevantní tabulky, a znovu, když píše samotný dotaz. Tentýž slovník, který mu pomůže najít H_OSOBA, mu zároveň připomene, že tituly se připojují přes H_C_TITUL_PRED, a ne že jsou volným textem.
Stavte ji odzadu, od otázek, na které musíte odpovědět
Instinkt velí napsat asociace pro každou tabulku ve schématu. Nedělejte to. To jsou týdny práce, z velké části promrhané na tabulkách, na které se nikdo nikdy nezeptá. Budujte slovník odzadu, od otázek, které bot musí zvládnout.
- Vezmi otázku, kterou musíš podporovat. „Kolik zaměstnanců má inženýrský titul?"
- Najdi tabulky správné odpovědi. Napiš nebo si půjč dotaz, který na ni odpoví; poznamenej si přesně, kterých tabulek a sloupců se dotýká.
- Napiš asociace přesně pro ně. Dej
H_OSOBAaH_C_TITUL_PREDaliasy a poznámky, které by k nim bota dovedly rovnou. - Opakuj, hnaný selháními. Když skutečná otázka dopadne na špatné tabulky, to je tvoje další asociace. Telemetrie ti řekne, kde je mezera ve slovníku — nemusíš hádat.
Tím se z otevřeného dokumentačního projektu stane těsná smyčka řízená poptávkou. Píšete slovník, který bot opravdu potřebuje, v pořadí, v jakém ho potřebuje.
Ať přežije smazání databáze
Draze zaplacená lekce: vývojové databáze se neustále mažou a stavějí znovu a jakákoli znalost, kterou jste do nich napsali přímo, umírá s nimi. Asociace proto nemají svůj zdroj pravdy v databázi. Žijí ve verzovaném souboru — bohatě stačí JSON — který leží ve verzování vedle kódu.
Malý migrační krok ten soubor přečte a naplní úložiště asociací při každém čerstvém buildu: smaž vše, vlož vše, hotovo. Vaše institucionální znalost je teď stejně trvalá jako váš kód, přežije každý reset a cestuje s repozitářem.
To zároveň řeší obavu z přenositelnosti, která spoustu týmů zastaví. „Stavíme asociace pro demo databázi, ale klient běží na jiné — není tohle práce na jedno použití?" Data jsou per-nasazení, ano. Mechanismus — formát souboru, loader, místo vkládání — je univerzální. Postavíte ho jednou a pro každého nového klienta naplníte nový slovník (zprvu ručně, později poloautomaticky z jeho dokumentace). Těžká část je instalatérská práce, a ta se přenáší dokonale.
Neokázalá věc, díky níž všechno ostatní funguje
Strategie vyhledávání, vektorové vyhledávání, chytrá orchestrace — ty sklízejí pozornost. Ale žádná z nich nenajde H_OSOBA ze slova „zaměstnanec", pokud ty dvě věci v systému nikdy nic nepropojilo. Vrstva asociací je to, co zbytek stroje vůbec umožňuje. Je to skoro podvod: pár set řádků pečlivě napsaného slovníku udělá pro přesnost vašeho bota víc než spousta ladění modelu.
Pište ji odzadu, držte ji ve verzování, předejte klíče doménovému expertovi a vkládejte ji všude tam, kde model musí pochopit, co vaši uživatelé myslí. Je to nejméně okázalý artefakt celého projektu. A zároveň ten, bez kterého bychom odmítli nasadit.
Sedíte na schématu, kterému plně rozumí jen tři lidé? Přesně tuhle znalost vrstva asociací zachytí. Domluvte si hovor a společně namapujeme vaši první sadu asociací proti otázkám, které nejvíc potřebujete zodpovědět.
