| English |
Metody pro spolupráci v bayesovském rozhodování s více účastníkyJan KracíkÚstav teorie informace a automatizace AV ČR, v.v.i., Oddělení adaptivních systémůÚvodBayesovská teorie rozhodování, plně pravděpodobnostní návrhBayesovská teorie představuje normativní přístup k řešení úloh rozhodování za neurčitosti. V praxi se při návrhu optimální rozhodovací strategie vychází z těchto součástí:
Alternativně lze pro popis cílů a návrh rozhodovací strategie využít takzvaný plně pravděpodobnostní návrh. Jeho princip spočívá v tom, že cíle rozhodování jsou popsány ideální hustotou pravděpodobnosti na celém systému a optimální rozhodovací strategie je pak volena jako znáhodněná a to tak, aby sdružená hustota pravděpodobnosti (daná modelem systému, rozhodovací strategií a apriorní hustotou) byla co nejblíže ideální hustotě ve smyslu Kullback-Leiblerovy divergence. Hlavním přínosem tohoto způsobu návrhu rozhodovací strategie je fakt, že má explicitní řešení, čímž odpadá výpočetně náročná maximalizace očekávané hodnoty užitkové funkce. MotivaceV praxi je však použitelnost bayesovského rozhodování omezena rozsahem rozhodovací úlohy. To je způsobeno zejména výpočetní složitostí, která s rozměrností úlohy rychle narůstá. V případě rozsáhlých úloh je také často obtížné vyjádřit cíle rozhodování i pravděpodobnostní model systému ve tvaru potřebném pro přímé použití bayesovské teorie. Místo toho jsou často k dispozici pouze dílčí cíle a znalosti vztahující se k určitým částem systému, přimž tyto části se mohou zcela libovolně překrývat. V takových případech se přirozeně stává, že pro některé části systému je k dispozici více dílčích cílů které se vzájemně liší. Totéž pak platí i pro jednotlivé dílčí znalosti o chování systému. Potřeba vhodného řešení pro velké rozhodovací úlohy vedla k myšlence návrhu distribuovaného rozhodování s více bayesovskými rozhodovači (účastníky). Tato úloha byla řešena v Oddělení adaptivních sysémů ÚTIA AVČR v rámci projektu BADDYR (Bayesian Adaptive Distributed Decision Making) k němuž prezentovaná disertační práce částečně přispěla. Návrh řešení distribuovaného rozhodování v rámci zmíněného projektu vychází z předpokladu, že v daném systému působí skupina bayesovských rozhodovačů, přičemž
Pokud by ovšem každý z účastníků rozhodoval tak, jako kdyby byl jediným rozhodovačem ve své části systému, rozhodování skupiny jako celku by bylo neefektivní právě kvůli rozdílným cílům a znalostem. Neefektivnost takového rozhodování vyplývá z toho, že každý z účastníků získává informace o cílech a znalostech ostatních účastníků pouze nepřímo a to pozorováním jejich vlivu na chování systému. Takovýto způsob přenosu informací je ovšem velmi pomalý. Lze tak očekávat, že rozhodování celé skupiny se stane efektivnějším v případě, že jednotliví účastníci budou mít možnost mezi sebou komunikovat. Z důvodu požadované absence centrálního rozhodovače je pak jedinou možností přímá komunikace mezi účastníky, jejichž okolí se alespoň částečně překrývají. Dvojici takovýchto účastníků označujeme jako sousedy. Cílem disertační práce byl návrh vhodných metod, které by účastníkům umožnily sdílet a využít informace o cílech a znalostech sousedů a vedly tak ke zlepšení rozhodování celé skupiny. Hlavní část práce se skládá ze tří kapitol:
Rozhodování s více účastníkyV této části je formálně zavedena bayesovská rozhodovací úloha s více účastníky. Každý účastník má vlastní
Přestože hlavním cílem je návrh distribuovaného řešení, ukazuje se že je nezbytné jako mezistupeň uvažovat jistou formu globální rozhodovací úlohy na celém systému. Smyslem této globální úlohy je umožnit jednoznačné porovnání kvality různých distribuovaných řešení, tj. skupin rozhodovacích strategií navržených jednotlivými účastníky. Pouze na základě znalostí a cílů jednotlivých účastníků však nelze globální úlohu sestavit - v každém případě je nutné přijmout řadu dodatečných předpokladů které např. umožní modelovat zdroje nekonzistence znalostí jednotlivých účastníků. Vzhledem k obrovskému množství možných způsobů sestavení globální úlohy je jakékoliv systematické řešení tohoto problému nad rámec možností předložené práce. Místo toho byl zvolen jeden konkrétní postup na kterém byly ilustrovány případné možnosti pro spolupráci účastníků. Navíc tento postup umožnil odhalit některá problematická místa bayesovského rozhodovaní s více účastníky a v některých případech také naznačil možná řešení. Nejdůležitější výsledky získané v této části práce lze shrnout následovně:
Nastavení globálních cílůTato část práce se zabývá návrhem metody, která umožní nalézt cíle globální rozhodovací úlohy tak, aby byly v jistém smyslu co nejblíže dílčím cílům jednotlivých účastníků. Konkrétně se zde předpokládá, že účastníci využívají plně pravděpodobnostní návrh rozhodovací strategie. V takovém případě jsou cíle každého účastníka (lokální cíle) popsány ideální hustotou pravděpodobnosti na jeho okolí. Globální ideální hustota pravděpodobnosti je pak hledána tak, aby vážený součet Kullback-Leiblerových divergencí lokálních ideálních hustot a jim odpovídajících marginál hledané globální ideální hustoty byl co nejmenší. Váhy v tomto součtu představují volitelný parametr - čím větší je určitá váha, tím blíže jsou jsou globální cíle k cílům odpovídajícího účastníka. Výsledky získané v této části práce jsou následující:
Bayesovské skládání znalostíV poslední části práce je navržena metoda, pomocí které může bayesovský rozhodovač využít informaci ve formě hustoty pravděpodobnosti na datech ke zlepšení svých znalostí o systému, tj., úpravě své apriorní hustoty pravděpodobnosti na neznámých parametrech. Ve speciálním případě, kdy předávaná hustota má tvar empirické hustoty z jistého vzorku dat, vede navržená metoda ke stejnému výsledku jako přímé využití těchto dat. V rozhodovacích úlohách s více účastníky pak lze tuto metodu využít pro výměnu znalostí mezi sousedy a to i v případě, že oba sousedé využívají rozdílné parametrické modely a jejich znalosti jsou tak reprezentovány apriorními distribucemi na zcela odlišných parametrech. Ačkoliv je v obecném případě takovýto způsob předávání informací pouze přibližný, lze ukázat, že za jistých předpokladů lze tímto způsobem předávat informaci zcela přesně. Další výhodou je, že pro parametrické modely z exponenciální rodiny se výpočet redukuje na nalezení očekávané hodnoty postačující statistiky. ZávěrHlavní přínosy disertační práce lze shrnout do následujících bodů:
Prezentovaná práce obsahuje rovněž některé otevřené problémy.
|