Zápisky z přednášek prof. Ing. RNDr. Martina Holeni, CSc.
Neuronové sítě původně vznikly z pokusu matematicky modelovat skutečné neurony.
Neurony budeme reprezentovat jako vrcholy a spoje mezi nimi jako orientované hrany . Potom je graf reprezentující neuronovou síť. Její topologie je , kde jsou nějaké hrany navíc mezi neurony a vnějším prostředím. Pro značíme
jsou vstupní neurony (protože mají vstup pouze z vnějšího prostředí), jsou výstupní neurony a jsou skryté neurony. Navíc graf nesmí být redundantní, tedy každý vrchol musí být incidentní s nějakou hranou.
Čas budeme modelovat jako množinu . Pro značíme . Aktivita neuronu je funkce . Je-li , jde o normalizovanou aktivitu. Stav neuronové sítě je .
V čase bude síť reprezentovat nějakou funkci z aktivity vstupních neuronů do aktivity výstupních neuronů. Množinu všech možných takových funkcí značíme . Systém nazveme aktivní dynamika sítě. Musí platit:
Lokální aktivní dynamika sítě je systém funkcí s vlastnostmi:
Každý parametr sítě je přiřazen nějakému neuronu nebo hraně. Typicky má každý neuron práh a každá hrana váhu , přičemž aktivita neuronu je definována jako
kde je nějaká aktivační funkce. (Pro výstupní neurony to bývá identita.)
V praktickém využití se často neuvažuje závislost na čase, čímž se všechno výrazně zjednoduší.
Neuronová síť se nějak adaptuje na základě informací, které dostává od člověka (učitele), což může být jedno z následujících:
Ztrátová funkce je funkce , kde je výstup sítě a je správná hodnota. Nejběžnější ztrátové funkce jsou:
Způsob, jakým budeme ztrátovou funkci minimalizovat, musíme uzpůsobit podle toho, kolikátou derivaci známe.
Nejjednodušší možná „neuronová sít“ je Heavisideova funkce: .
O něco složitější je perceptron (Rosenblatt, 1958):
Učení perceptronu probíhá v epochách. Dostane učicí vzorek a zareaguje nějakým výstupem . Pokud neklasifikuje správně všechny vzorky, potom změníme váhy podle vzorce