Page 107 - Fister jr., Iztok, Andrej Brodnik, Matjaž Krnc and Iztok Fister (eds.). StuCoSReC. Proceedings of the 2019 6th Student Computer Science Research Conference. Koper: University of Primorska Press, 2019
P. 107
ovedovanje nogometnega zmagovalca z rekurentno
nevronsko mrežo LSTM

Nejc Planer Mladen Borovicˇ

Fakulteta za elektrotehniko, racˇunalništvo in Fakulteta za elektrotehniko, racˇunalništvo in
informatiko informatiko

Koroška cesta 46, 2000 Maribor Koroška cesta 46, 2000 Maribor

nejc.planer@student.um.si mladen.borovic@um.si

POVZETEK lige. Najboljˇse rezultati so bili v povpreˇcju okoli 60 odstot-
kov.
Prispevek predstavlja napovedovanje nogometnega zmago-
valca in nekaterih drugih statistik z rekurentno nevronsko Microsoft ima svoj sistem za napovedovanje ˇsportnih rezul-
mreˇzo, ki uporablja celico LSTM. Opisano je tudi kje lahko tatov. Leta 2014 so napovedali vse tekme izloˇcevalnega dela
pridobimo podatke za posamezne lige in tekmovanja, kako te svetovnega prvenstva pravilno [11]. Njihov matematiˇcni mo-
podatke potem preoblikujemo in njihov konˇcen izgled. Po- del vzame v raˇcun veˇc faktorjev, od ˇstevila zmag, porazov
damo tudi uporabljeno nevronsko mreˇzo, ter rezultate. To in neodloˇcenih izidov vse do tipa podlage na igriˇsˇcu in vre-
so ali pade veˇc kot 1,5 gola na tekmo, ali pade veˇc kot 2,5 menskih razmer [10].
gola na tekmo in ali obe ekipi zadeneta. Na koncu podamo
ˇse nekaj idej za moˇzne izboljˇsave uspeˇsnosti napovedovanja. Za napovedovanje bomo uporabili rekurentne nevronske mreˇze,
ki ˇse na tem podroˇcju niso veliko uporabljene, in sicer da vi-
Kjucˇne besede dimo ali lahko z njimi doseˇzemo boljˇse rezultate kot z osta-
limi metodami umetne inteligence.
napovedovanje, rekurentne nevornske mreˇze, celica LSTM,
nogomet, umetna inteligenca V naslednjem poglavju opiˇsemo pridobivanje podatkov, ki
jih potem tudi podrobneje razloˇzimo in povemo njihovo struk-
1. UVOD turo. Sledi njihova preobdelava preden jih poˇsljemo v ne-
vronsko mreˇzo. Zatem v tretjem poglavju opiˇsemo arhitek-
Stave so velik del ˇsporta in pritegnejo veliko ljudi, saj so turo nevronske mreˇze, ki jo uporabljamo. V ˇcetrtem po-
privlaˇcne zaradi moˇznega hitrega zasluˇzka. Problem je, da glavju so predstavljeni rezultati. V petem zakljuˇcnem po-
je ˇsport lahko zelo nepredvidljiv in je teˇzko ugotoviti konˇcen glavju pa podamo smernice za nadaljnje delo.
izid. Zato si pri stavljanju velikokrat pomagamo s statistiko
prejˇsnjih tekem, oziroma prejˇsnjih let. To naredi nevronske 2. PODATKI
mreˇze zelo zanimive, saj lahko poˇsljemo to statistiko kot 2.1 Pridobivanje podatkov
vhod v mreˇzo in potem ta napove rezultate za naprej.
Nekatere zgodovinske podatke o nogometu smo naˇsli na spletu,
Namen dela je ugotoviti, ali lahko z nogometno statistiko druge pa smo si morali zgenerirati sami. Za najveˇcje sve-
in nevronskimi mreˇzami uspeˇsno napovemo, kaj se bo zgo- tovne nogometne lige ˇze obstajajo datoteke CSV za sezone
dilo v prihodnjih tekmah. Za to je potrebno pridobljene od zaˇcetka 90. let naprej [4]. Najdemo lahko tudi datoteke
podatke ustrezno preoblikovati in dodati nove, da si izbolj- CSV za vsa svetovna prvenstva [3].
ˇsamo natanˇcnost. Tudi oblika mreˇze je pomembna, saj vse
ne dosegajo iste natanˇcnosti. Za slovensko nogometno ligo smo si morali napisati svoj pro-
gram [6]. Ta je iz podatkov iz wikipedije [7] in uradne strani
Avtor Korpiˇc je v diplomskem delu [13] uporabil razliˇcne al- Prve slovenske nogometne lige [5] razbral prave informacije
goritme strojnega uˇcenja za napovedovanje zmagovalca no- in jih shranil v datoteko CSV. Najveˇcja teˇzava pri tem je
gometne tekme. Uspeˇsnost napovedovanja je bila med 30 in bila, da so se imena klubov skozi leta veliko spreminjala in
50 odstotki. je bilo potrebno kar nekaj roˇcnega dela, da smo povezali
skupaj prava imena klubov.
Tudi v raziskovalnem delu [9] so uporabili razliˇcne algoritme
strojnega uˇcenja za napovedovanje nizozemske nogometne Prav tako smo morali napisati program za pridobivanje po-
datkov tekmovanja Copa America [1]. Ta je iz podatkov
iz wikipedije [2] ustvaril datoteko CSV, vendar smo morali
podatke za doloˇcene tekme vnesti sami, saj ima wikipedija
nekonsistentno kodo.

2.2 Opis podatkov

Doloˇcene datoteke CSV so imele veliko ˇstevilo podatkov,
zato smo vzeli le kljuˇcne za nas. Prvi podatek je kvote iz

StuCoSReC Proceedings of the 2019 6th Student Computer Science Research Conference DOI: https://doi.org/10.26493/978-961-7055-82-5.107-110 107
Koper, Slovenia, 10 October
   102   103   104   105   106   107   108   109   110   111   112