Retrieval-Augmented Generation (RAG)
Retrieval-Augmented Generation (zkráceně RAG) je způsob, jak využít jazykové modely (AI) tak, aby pracovaly nejen s tím, co samy "znají", ale aby dokázaly čerpat z aktuálních nebo specifických externích dat.
To z nich dělá mocnější nástroje, zejména v situacích, kdy je potřeba přístup k aktuálním nebo rozsáhlým informacím, které nejsou přímo součástí modelu.
Jednoduše řečeno, RAG propojuje umělou inteligenci s "knihovnou" informací. Model nejprve "vyhledá" relevantní údaje v této knihovně (retrieval) a poté je využije k sestavení odpovědí (generation).
Jak to funguje?
- Vyhledání informací (Retrieval): Pokud jazykový model narazí na dotaz, který vyžaduje specifické informace, obrátí se na určený datový zdroj. Tím může být databáze, dokumentace, intranet firmy nebo třeba znalostní báze zákaznické podpory.
- Generování odpovědi (Generation): Model pak získaná relevantní data integruje do své odpovědi. Výsledek je kombinace znalostí modelu a aktuálních či specifických informací z externích zdrojů.
Příklad využití
Představte si firemní systém, který zaměstnancům umožňuje rychle odpovídat na otázky o projektech nebo firemních procesech. Namísto přechodu mezi různými nástroji (Notion, Google Drive, nebo lokální složky) model s RAG jednoduše "dotáhne" informace z vašich vybraných zdrojů a podá přesnou a ucelenou odpověď.