- RAG, nebo fine-tuning — co potřebuju?
- Většinou napřed RAG. Když má bot znát váš obsah, retrieval vyhraje nad přetrénováním pokaždé, když se změní dokument.
- Jak zabráníte tomu, aby si bot vymýšlel?
- Každou odpověď ukotvím v nalezených pasážích, naučím ho explicitní „nevím“ a otestuju ho, než se nasadí.
- Umíte pracovat on-prem nebo s našimi vlastními LLM?
- Ano — on-prem LLM infrastrukturu jsem nasazovala v OKlabu. Air-gapped nebo hybridní setup můžeme naplánovat od prvního dne.
- Co od nás potřebujete, abyste mohla začít?
- Vzorové dokumenty nebo datové zdroje, člověka, který zná use-case, a jasno v tom, kdo jsou uživatelé. Architekturu i nasazení řeším já.
- Jak dlouho trvá, než něco běží?
- Funkční prototyp za 2–4 týdny je běžný. Produkce závisí na rozsahu, integracích a tom, jak chaotická jsou zdrojová data.