Tip:
Highlight text to annotate it
X
Dobrze będzie zapoznać was z podstawową terminologią
która jest powszechnie używana w szztucznej inteligencji, abyście mogli rozróżniać pewne typy problemów.
Pierwszym terminem, którego was nauczę jest całkowita i częściowa obserwowalność.
Środowisko nazwiemy całkowicie obserwowalnym, jeżeli to, co agent może odebrać z czujników
w dowolnej chwili czasu jest całkowicie wystarczające dla podjęcia najlepszej decyzji.
Zatem, na przykład, w wielu grach karcianych,
gdy wszystkie karty są na stole, aktualne umiejscowienie tych kart
w zupełności wystarczy do dokonania optymalnego wyboru.
Stoi to w opozycji do innych środowisk, które wymagają od agenta
pamięci, by mógł podjąć najlepszą możliwą decyzję.
Na przykład, w pokerze karty nie są widoczne na stole,
a pamiętanie wcześniejszych ruchów pomaga w podejmowaniu lepszych decyzji.
Aby w pełni zrozumieć tę różnicę, rozważmy interakcję agenta
ze środowiskiem do jego czujników i aktuatorów,
a ta interakcja będzie się odbywała w wielu cyklach,
często nazywanych cyklami postrzegania-działania.
W wielu środowiskach wygodnie jest założyć
że środowisko posiada jakiś stan wewnętrzny.
Na przykład, w grze karcianej, w której karty nie są widoczne na stole
stan może dotyczyć kart na twojej ręce.
Środowisko jest całkowicie obserwowalne, jeżeli czujniki mogą zawsze dostrzec
cały stan środowiska.
Jest częściowo obserwowalne, jeżeli czujniki widzą tylko pewien wycinek tego stanu,
ale zapamiętywanie wcześniejszych pomiarów daje dodatkową informację dotyczącą stanu
który nie jest w tej chwili bezpośrednio obserwowalny.
Zatem dowolna gra, w której, dajmy na to, wcześniejsze ruchy zawierają informację dotyczącą
tego, co dana osoba może mieć na ręce, te gry są częściowo obserwowalne,
i wymagają innego podejścia.
Często agenty mające do czynienia z częściowo obserwowalnymi środowiskami
muszą posiadać wewnętrzną pamięć, aby rozumieć, jaki
jest stan środowiska, i będziemy mówić obszerniej,
kiedy podejmiemy temat ukrytych modeli Markowa, o tym, w jaki sposób ta struktura
posiada wewnętrzną pamięć.
Drugim terminem odnoszącym się do środowisk dotyczy tego, czy środowisko
jest deterministyczne, czy stochastyczne.
Deterministyczne środowisko to takie, w którym działania twojego agenta
jednoznacznie wyznaczają wynik.
Zatem, na przykład, w szachach nie ma żadnej losowości, gdy poruszasz figurą.
Efekt poruszania figurą jest całkowicie określony
i niezależnie od tego, gdzie chcę poruszyć tę sama figurę, efekt jest taki sam.
To nazwiemy deterministycznym.
Gry oparte na rzucie kością, takie jak backgammon, są stochastyczne.
Chociaż nadal możesz poruszać figurami w sposób deterministyczny,
wynik działania zależy również od wyniku rzutu kością,
którego nie możesz przewidzieć.
Istnieje pewna ilość losowości związana z wynikiem rzutu kością,
i takie przypadki nazywamy stochastycznymi.
Teraz pomówię o dyskretnym versus ciągłym.
Dyskretne środowisko to takie, w którym mamy skończenie wiele wyborów działań,
oraz skończenie wiele rzeczy, które można wyczuć.
Na przykład, w szachach istnieje skończenie wiele rozmieszczeń figur na szachownicy,
i skończenie wiele rzeczy, które możesz zrobić.
Różni się to od ciągłego środowiska
w którym przestrzeń możliwych działań albo rzeczy które możesz wyczuć może być nieskończona.
Zatem, na przykład, jeśli rzucasz rzutkami, istnieje nieskończenie wiele sposobów na nachylenie rzutki
i jej przyspieszanie.
Wreszcie rozróżniamy pomiędzy środowiskami łagodnymi i antagonistycznymi.
W przypadku środowisk łagodnych, środowisko może być losowe.
Może być stochastyczne, ale nie ma swojego własnego celu
który byłby sprzeczny z twoim celem.
Zatem, na przykład, pogoda jest łagodna.
Może być losowa. Może mieć wpływ na wynik twoich działań.
Ale jej celem nie jest uprzykrzenie ci życia.
Można to przeciwstawić środowiskom antagonistycznym, takim jak wiele gier w rodzaju szachów,
w których celem twojego przeciwnika jest uprzykrzenie ci życia.
Wybór odpowiednich działań okazuje się znacznie trudniejszy w antagonistycznych środowiskach,
w których przeciwnik aktywnie cię obserwuje i przeciwdziała temu, co próbujesz osiągnąć
niż w łagodnych środowiskach, które mogą być co najwyżej stochastyczne
ale których celem nie jest uczynienie twojego życia gorszym.
Zobaczmy zatem, w jakim stopniu następujące stwierdzenia wydają ci się mieć sens.
Rozwiąż teraz następujący quiz.
Oto 4 przedstawione przed chwilą koncepty: częściowo obserwowalne versus całkowicie,
stochastyczne versus deterministyczne, ciągłe versus dyskretne,
łagodnie versus antagonistyczne.
Zapytam teraz o warcaby.
Wybierz jeden albo wszystkie odpowiedzi poprawne.
Zatem, jeśli uważasz, że warcaby są częściowo obserwowalne, zaznacz tą odpowiedź.
W przeciwnym razie nie zaznaczaj.
Jeżeli uważasz, że jest stochastyczna, zaznacz tą odpowiedź.
Ciągła, zaznacz tę odpowiedź, antagonistyczne, zaznacz tą.
Jeżeli nie wiesz, czym są warcaby, możesz przeszperać sieć i wyguglować to
aby dowiedzieć się czegoś na ich temat.