Tip:
Highlight text to annotate it
X
Bilo bi dobro predstaviti osnovnu terminologiju
koja se obično koristi u domeni Umjetne Inteligencije kako bi se diferencirali različiti tipovi problema.
Prva riječ koju ću vas naučiti je puno u odnosu na djelomično vidljivo.
Okruženje se zove potpuno vidljivo ako je ono što vaš agent može pojmiti,
u bilo kojem trenutku, potpuno dovoljno da bi napravio optimalnu odluku.
Tako, na primjer, u mnogim kartaškim igrama,
kad su sve karte na stolu, trenutnim pogledom na sve te karte
je stvarno dovoljno da bi se napravio optimalan izbor.
To je u suprotnosti s nekim drugim okruženjima, gdje vam je potrebna memorija
na strani agenta kako bi napravili najbolju moguću odluku.
Na primjer, u igri poker, karte nisu otvorene na stolu,
i pamćenje prošlih poteza pomoći će vam donijeti bolje odluke.
Da biste u potpunosti razumjeli razliku, zamislite interakciju agenta,
njegovih senzora i aktuatora sa okruženjem
i kako se ova interakcija odvija kroz više ciklusa,
često nazvanih percepcija-akcija ciklusima.
Za mnoga okruženja, zgodno je pretpostaviti
da imaju neku vrstu unutarnjeg stanja.
Na primjer, u kartaškoj igri u kojoj karte nisu otvorene na stolu,
stanje se može svesti samo na karte u vašoj ruci.
Okruženje je u potpunosti vidljivo ukoliko senzori uvijek mogu vidjeti
cjelokupno stanje okruženja.
Djelomično je vidljivo ukoliko senzori mogu vidjeti samo dio stanja,
i ako memoriranjem zadnjih mjerenja dobivamo dodatne informacije o stanju
koje nije lako uočljivo u datom trenutku.
Dakle, bilo koja igra, na primjer, gdje su posljednji potezi informacije o
tome što bi moglo biti u ruci jedne osobe, djelomično su vidljive,
i one zahtijevaju drukčiji tretman.
Vrlo često agenti koji se bave djelomično vidljivim okruženjima
trebaju steći internu memoriju da bi shvatili što
je stanje okoliša, a mi ćemo govoriti opširno,
kada budemo govorili o skrivenim Markovljevim modelima, o tome kako te strukture
imaju takvu unutarnju memoriju.
Drugi naziv za okruženja odnosi se i ovisi o tome je li okruženje
determinističko ili stohastičko.
Determinističko okruženje je ono gdje akcije agenta
jedinstveno određuju ishod.
Tako, na primjer, u šahu, stvarno nema slučajnosti kada pomjerate figure.
Efekat pomjeranja figure potpuno je predodređen,
i bez obzira gdje pomjeram istu figuru, ishod je isti.
To mi zovemo determinističkim.
Igre s kockicama, na primjer, kao što je backgammon su stohastičke.
Dok još uvijek možete deterministički pomjerati figure,
ishod akcije također uključuje bacanje kockice,
čiji ishod ne možete predvidjeti.
Postoji određeni broj slučajnosti uključen za ishod kockice,
i stoga, mi to nazivamo stohastičkim.
Dopustite mi spomenuti diskretno u odnosu na kontinuirano.
Diskretno okruženje je takvo gdje imate konačno mnogo izbora akcije,
i konacno mnogo stvari koje možete pojmiti.
Tako, na primjer, u šahu, opet, konačno mnogo pozicija ima na ploči,
i konačno mnogo stvari koje možete učiniti.
To se razlikuje od kontinuiranog okruženja
gdje prostor mogućih akcija ili stvari, koje bi mogli pojmiti, može biti beskonačan.
Tako, na primjer, ako bacate pikado, postoji beskonačno mnogo načina da ciljate strelicama
i da ih ubrzavate.
Konačno, napravit ćemo razliku dobroćudnih u odnosu na kontradiktorna okruženja.
U dobroćudnim sredinama, okruženje može biti slučajno.
To bi moglo biti stohastički, ali to nema nikakvu samostalnu objektivnost
koji bi bila u suprotnosti vlastitom cilju.
Tako, na primjer, vrijeme je dobroćudno okruženje.
Može biti slučajno. Može utjecati na ishod vaših akcija.
Ali, ne postoji da bi vas toliko ometalo.
Usporedite to s kontradiktornim okruženjima, kao što su mnoge igre, poput šaha,
gdje je vaš protivnik tu, sa namjerom da vas ometa i pobjedi.
Ispada da je puno teže naći dobre akcije u kontradiktornim sredinama
gdje vas protivnik aktivno promatra i suzbija ono što pokušavate postići
u odnosu na dobroćudna okruženju, gdje okolina samo može biti slučajna
ali zapravo nije zainteresirana da vam zagorča život.
Dakle, da vidimo u kojoj mjeri ovi izrazi imaju smisla za vas
tako što ćemo otići na naš sljedeći kviz.
Dakle ovdje su 4 koncepta ponovo: djelimično uočljiva u odnosu na one u cijelosti uočljive,
stohastički u odnosu na deterministički, kontinuirano u odnosu na diskretne,
kontradiktorna u odnosu na dobroćudna.
I dozvolite mi da vas pitam o igri dame.
Označite jedan ili sve od tih atributa koji se primjenjuju na ovi igru.
Dakle, ako mislite da je igra dame djelomično vidljiva, označite ovaj.
Inače, nemojte označiti.
Ako mislite da je stohastički, označite ovaj,
kontinuirano, označite ovaj, kontradiktorno označite ovaj.
Ako ne poznajete ovu igru, možete provjeriti web i Google
i pronaći nešto više informacija o igri dame.