Úvod do pokročilých algoritmů 1 ⬩ 18UIA1 ⬩ Adamátorovy zápisky

Inteligentní agent je cokoli, co používá umělou inteligenci k rozhodování a provádění úkolů. Skládá se ze senzorů a akčních členů, které mu umožňují interagovat s prostředím. Jeho strategii můžeme brát jako funkci z hodnoty senzorů do množiny akčních členů. V cyklu provede pozorování a na základě strategie vybere akci.

Definice

Algoritmus je sada přesných instrukcí, které říkají nějakému procesoru, jak řešit daný problém. Měl by být

deterministický – v každém kroku je jasné, jak pokračovat;
korektní – vždy vrátí správný výsledek;
konečný – vždy skončí v konečném počtu kroků;
elementální – sestává z elementárních kroků;
obecný – funguje pro všechny možné vstupy;
pokud možno rychlý (v nějakém smyslu).

Algoritmy můžeme navrhovat shora dolů (vzít celý problém a rozdělit ho na jednodušší části) nebo zdola nahoru (postupně budovat složitější procedury).

Příklad

Mějme dvě místnosti, které mohou být čisté nebo špinavé, a čisticího robota, který je v jedné z nich. Celkem je tedy 8 možných stavů: Algoritmus pro čištění by mohl vypadat například takto:

Je-li místnost špinavá, vyčisti ji.
Přesuň se do druhé místnosti.
Je-li místnost špinavá, vyčisti ji.

Prohledávání grafu

Máme graf $𝒢 = (𝒱, ℰ)$ a chceme najít cestu z $s \in 𝒱$ do $t \in 𝒱$ . Budeme udržovat rozdělení $𝒱 = E ⊎ F ⊎ U$ , kde $E$ jsou prozkoumané vrcholy, $F$ jsou hraniční vrcholy a $U$ jsou neprozkoumané vrcholy.

TBD: algoritmus

Existují různé přístupy, jak z hranice zvolit vrchol:

přidáme nejlevnější hranu (Dijkstrův algoritmus)
prodloužíme nejkratší cestu (prohledávání do šířky)
prodloužíme nejdelší cestu (prohledávání do hloubky)
vybereme cestu, která nejvíc sníží odhadovanou vzdálenost od cíle (hladové prohledávání)
vybereme cestu s nejmenším součtem délky a odhadované vzdálenosti od cíle (A*)

K odhadu vzdálenosti do cíle v algoritmu A* potřebujeme nějakou heuristickou funkci na odhad vzdálenosti do cíle. Funkce by měla být optimistická, tedy odhadnutá vzdálenost by neměla převýšit skutečnou vzdálenost. Pokud jako heuristiku vezmeme nulovou funkci, dostaneme jako speciální případ Dijkstrův algoritmus.

Za domácí úkol máme implementovat prohledávání grafu v mřížce (možné různé typy mřížky) s různými algoritmy a heuristikami.

Moje řešení

Patnáctka

Na přesunutí dlaždice máme dvě omezení:

místo, kde je, musí sousedit s místem, kam ji přesouváme;
místo, kam ji přesouváme, musí být prázdné.

Můžeme si to představit jako problém prohledávání grafu. Chceme-li použít A*, nabízí se dvě heuristiky:

počet špatně umístěných dlaždic;
součet manhattanských vzdáleností dlaždic od jejich správné pozice.

Všimněme si, že první heuristiku dostaneme odstraněním obou omezení, zatímco druhou heuristiku dostaneme odstraněním druhého omezení. To je obecně dobrý způsob, jak vymýšlet heuristiky.

Vícerozměrné Gaussovo rozdělení

V jednom rozměru máme Gaussovo rozdělení se střední hodnotou $μ$ a rozptylem $σ^{2}$ :

f (x) = \frac{1}{\sqrt{2 π σ^{2}}} exp (- \frac{1}{2} \frac{{(x - μ)}^{2}}{σ^{2}}) .

To můžeme zobecnit do $N$ rozměrů. Teď už máme vektor středních hodnot $\vec{μ}$ a kovarianční matici $Σ$ .

f (\vec{x}) = {(2 π)}^{- \frac{N}{2}} {(det Σ)}^{- \frac{1}{2}} exp (- \frac{1}{2} {(\vec{x} - \vec{μ})}^{𝖳} Σ^{- 1} (\vec{x} - \vec{μ})) .

Markovovy rozhodovací procesy

Máme nějaké stavy $S = {s_{1}, \dots, s_{n}}$ a abecedu $A = {a_{1}, \dots, a_{m}}$ . Definujeme matici přechodu $T (s, a, s^{'}) ≔ P (s^{'} | a, s)$ . Také mějme účelovou funkci $R : s \to ℝ$ , která v závislosti na konečném stavu určí, jak dobře na tom jsme. Chování agenta bude určeno strategií $π : S \to A$ .

Kdybychom použili klasické rekruzivní plánování, strom by se rychle rozvětvil a nejspíš by ani neskončil.

Formálně se budeme snažit maximalizovat $𝔼 \sum_{t} γ^{t} R_{t}$ , kde $γ \in (0, 1]$ je discount factor. Definujeme si hodnotovou funkci

V^{π} (s) ≔ 𝔼_{π} [\sum_{t} γ^{t} R_{t} | s_{0} = s] .

Praktický algoritmus na nalezení optimální strategie je hledat stacionární bod funkce

V (s) ≔ R (s) + {\begin{cases} 0 & je-li s absorpční stav; \\ {max}_{a} \sum_{s^{'}} P (s^{'} | a, s) V (s^{'}) & jinak. \end{cases}