Expected Value of Binomial Distribution

W poprzednim filmie dowiedzieliśmy się nieco o wartości oczekiwana zmiennej losowej. Zauważyliśmy, że jest to zwykła średnia wszystkich możliwych wyników. Przy rozważaniu zmiennej losowej ciężko jest mówić o wszystkich możliwych wynikach, które dałoby się zsumować i uśrednić. Wiadomo natomiast, że każdy z wyników występuje z pewną częstotliwością/prawdopodobieństwem. Wartość oczekiwana jest średnią ważoną prawdopodobieństw. Koncepcyjnie robimy to samo co w poprzednim filmie, sumujemy wszystkie możliwości i uśredniamy. Druga metoda działa również, gdy mamy do czynienia nie ze skończoną populacją, a zmienną losową. Ciężko jest mówić o skończonej ilości wyników zmiennej losowej, ponieważ znająć rozkład zmiennej losowej możemy ciągle generować kolejne wyniki. W poprzednim filmie obliczyliśmy wartość oczekiwaną, dla rozważanych rozkładów dwumianowych, w szczególności dla przykładu z rzucaniem monetą. W tym filmie odkryjemy ogólny wzór na wartość średnią, lub inaczej wartość oczekiwaną rozkładu dwumianowego. Jeżeli przyjmiemy, że zmienna losowa X jest równa liczbie sukcesów. Liczba sukcesów uzyskiwanych z prawdopodobieństwem P po N próbach. Staram się zapisywać w jak najogólniejszej postaci. Mógłbym oczywiście zapytać o liczbę uzyskanych reszek, uzyskiwanych z prawdopodobieństwem 0.5 po 10 rzutach. Dokładnie to samo jest tutaj, jedynie nieco bardziej ogólnie. Teraz spróbujemy wyznaczyć, czemu będzie równa wartość oczekiwana. Widzieliśmy, że jeżeli obliczy się rozkład prawdopodobieństwa dla tej zmiennej losowej to otrzymuje się ładny rozkład dwumianowy, przypominający nieco krzywą dzwonową. Krzywymi dzwonowymi zajmiemy się później. Zacznę od pokazania jak wygląda odpowiedź. Odpowiedź, jest do pewnego stopnia, całkiem intuicyjna. Wartość oczekiwana zmiennej losowej jest równa NP lub czasem pisze się na odwrót PN. Pozwólcie, że wytłumaczę co to znaczy na przykładzie. Jeżeli powiedziałbym, że X - użyję innego koloru. X jest równe ilości udanych koszów. Oczywiście mówię o trafieniach do kosza, a nie wikliniarstwie. Ilość udanych rzutów po 10 rzutach, gdzie prawdopodobieństwo trafienia dowolnego rzutu wynosi 40%. Wiemy, że oczekiwana ilość trafionych koszów po 10 rzutach... Wiemy, że oczekiwana ilość trafionych koszów po 10 rzutach, gdzie mam 40% szans na trafienie - jedyne co muszę zrobić to przemnożyć prawdopodobieństwo przez liczbę rzutów. Jeżeli przemnożę prawdopodobieństwo przez ilość wykonywanych rzutów - wychodzi 4. Nie powinniśmy zbyt kurczowo trzymać się wartości oczekiwanej jako liczby udanych rzutów której się spodziewamy. Rozkłady prawdopodobieństwa potrafią płatać figle. W rozkładzie dwumianowym jednak można właśnie w ten sposób patrzeć na wartość oczekiwaną, jako liczbę spodziewanych trafień do kosza. Można również patrzyć na nią jako na najbardziej prawdopodobny rezultat. Jeżeli mamy 40% szans na trafienie i wykonamy 10 rzutów, to najprawdopodobniej 4 z nich trafimy. Nadal możemy trafić 6 lub 3 rzuty, ale 4 to będzie najbardziej prawdopodobny wynik. Dla mnie jest to bardzo intuicyjne, mam za każdym razem 40% szansy trafienia w rzucie. Czyli możemy przyjąć, że będziemy trafiać w przybliżeniu 40% rzutów. Jeżeli wykonamy 10 rzutów, to powinniśmy trafić 4 rzuty. Jest to jeden ze sposobów myślenia o wartości oczekiwanej, mam nadzieję że intuicyjny. Teraz udowodnijmy sobie, że wzór jest prawdziwy dla dowolnej zmiennej losowej opisywanej przez rozkład dwumianowy. W rozkładzie dwumianowym, jakie jest prawdopodobieństwo, że X będzie równe k? Zdaję sobie sprawę, że może to wyglądać nieco skomplikowanie. Korzystając z analogii do koszykówki: jakie jest prawdopodobieństwo, że trafię 3 rzuty do kosza lub inną ilość trafień (wstawiamy za k)? O tym właśnie mówimy. Znamy odpowiedni wzór, jeżeli mamy n rzutów wybieramy k spośród nich. Robiliśmy to kilkukrotnie w poprzednich filmach. Następnie mnożymy przez prawdopodobieństwo każdej pojedynczej możliwości. Jeżeli trafiam k rzutów, to będzie prawdopodobieństwo trafienia dowolnego rzutu, czyli P podniesione do k-tej potęgi. P przemnożone przez siebie K razy. To jest prawdopodobieństwo trafienia K rzutów. W pozostałych rzutach muszę chybić. Chybiam z prawdopodobieństwem (1-P). Ile rzutów muszę chybić? Jeżeli trafiłem K rzutów, to muszę chybić w pozostałych. To znaczy, że chybię w N-K rzutach. W dowolnym rozkładzie dwumianowym to jest prawdopodobieństwo uzyskania k sukcesów. Teraz wiemy, że w celu obliczenia wartości oczekiwanej zmiennej losowej należy zsumować kolejne prawdopodobieństwa z odpowiednimi wagami. Nie chcę mieszać wam w głowie i jeżeli wyciągniecie z tego filmu jedynie ten wzór to będzie w porządku. Powinniście czuć się dobrze. Teraz zacznę używać nieco bardziej technicznego słownictwa, mam nadzieję że oswoicie się nieco z dużą sigmą i notacją wykorzystującą sumy. Przy okazji oswoicie się nieco z symbolem Newtona i innymi notacjami matematycznymi. Wracając - wartość oczekiwana jest ważoną sumą prawdopodobieństw. Chcemy wziąć prawdopodobieństwo, że X jest równy K, razy K i następnie zsumować dla każdego możliwego K. Jak to zapisać? Wartość oczekiwana zmiennej losowej X opisywanej według rozkładu dwumianowego jest równa sumie. Będziemy sumować po wszystkich wartościach jakie K może przyjąć. K zaczyna się w 0 -- korzystając z analogii do koszykówki - zero trafień, aż do n, co oznacza że trafię n rzutów. Każde z tych prawdopodobieństw chcemy przemnożyć przez K, czyli mnożę k rzutów przez prawdopodobieństwo, że trafię K rzutów. Jakie jest prawdopodobieństwo, że trafię K rzutów? To jest ten wzór. To będzie K razy N *** K razy P do K-tej razy (1-P) do (N-K)-tej. Teraz pora na trochę algebry, trochę algebry z wykorzystaniem sum. Pierwsze uproszczenie jakie możemy poczynić wynika z tego, że sumujemy od K równego 0 do N. Pierwszy wyraz tej sumy będzie miał K równe 0. Czyli tutaj będzie 0 w pierwszym wyrazie. Pierwszy czynnik jest równy 0 przez co całe wyrażenie będzie równe 0, i wyrażenie z K równym 0 nie dołoży się nic do sumy, ponieważ całe to wyrazenie będzie równe 0. Wiecie co? Rozpiszę całą tą sumę: 0 razy N *** 0 razy P do zerowej razy (1-p) do (n-0)-wej potęgi, plus 1 razy N *** 1 razy P do pierwszej potęgi razy (1-p) do (N-1)-szej potęgi, i możemy tak ciągle dodawać, aż dojdziemy do K równego N. Czyli to będzie N razy N *** N razy P do N-tej razy (1-p) do (n-n)-tej. Jest to kolejny sposób zapisu tej sumy. To o czym przed chwilą mówiłem, czyli ten wyraz, będzie równy 0, ponieważ K jest równe 0. 0 razy cokolwiek daje 0. Możemy zignorować ten wyraz i przepisać tą sumę, jako tą sumę. Jeżeli tak uprościmy, to możemy również przepisać to wyrażenie od nowa. Czyli wartość oczekiwana naszej zmiennej losowej jest równa sumie. I nie musimy zaczynać od K równego 0, możemy teraz rozpocząć od K równego 1. Od K równego 1 do N, w środku to samo: K razy N *** K razy P do K-tej razy (1-P) do (N-K)-tej. Zobaczmy dokąd możemy teraz dojść. Jak dotąd pozbyliśmy się pierwszego wyrazu, ponieważ zastosowaliśmy małą sztuczkę do uproszczenia całej sumy. Rozpiszmy teraz dwumian Newtona i zobaczmy, czy możemy się z nim pobawić. Ojej. Mój iPod chce się synchronizować. Pozwólcie, że się tego pozbędę. W porządku, gdzie skończyłem? To jest równe, rozpiszę dwumian Newtona. K od 1 do N. K razy -- to jest równe N! podzielone przez K silnia i podzielone przez (N-K) silnia. Razy P do K-tej razy (1-P) do (N-K)-tej. I tutaj możemy również nieco uprościć, czemu jest równe K podzielone przez K silnia? Zapiszmy to inaczej. K silnia to K * K-1 * K-2 i tak dalej, aż dojdziemy do 1. To jest K silnia. Czyli K silnia może być zapisane jako K razy (K-1) silnia. Jest to K razy i następnie liczba o jeden mniejsza i dalej wszystkie mniejsze liczby. Pozwólcie, że przepiszę jeszcze raz. To może być zapisane jako K razy (K-1) silnia. Powodem rozpisania silnii jest to, że teraz mogę skrócić to K z tym. Jeżeli je skrócę, to myślę że możemy przepisać jeszcze raz całą sumę. Jeżeli macie mieszane uczucia co do tego, czy rzeczywiście to co zrobiłem jest uproszczeniem wyrażenia to bardzo się wam nie dziwię, to jest równe sumie od K równego 1 do N, N silnia *** (K-1) silnia, razu (N-K) silnia razu P do k-tej razy (1-P) do (N-K)-tej. Zróbmy kolejne uproszczenie. Wiemy na czym nam zależy i dokąd zmierzamy, prawda? To powinno się uprościć do N razy P. Zobaczmy, czy możemy wyciągnąć przed sumę N razy P i później zobaczmy czy reszta uprości się do 1, wtedy będziemy wiedzieć, że się nam udało. Możemy rozpisać N silnia korzystając z tej samej sztuczki co tutaj. N silnia może być zapisana jako N razy (N-1) silnia, podobnie jak wcześniej. Następnie P do K-tej może być rozpisane jako P razy P do (K-1)-tej. I następnie możemy wyciągnąć N i P przed sumę, całość będzie równa NP razy suma od K równego 1 do N z -- zobaczmy. Wyciągnęliśmy N i P. (N-1) silnia *** (K-1) silnia razy (N-K) silnia Razy P do (K-1)-szej. To nie jest w mianowniku. Razy (1-P) do (N-K)-tej. Jesteśmy już blisko. Pamietajcie, chcemy żeby wartość oczekiwana naszej zmiennej losowej i to całe nasze wyprowadzenie były sobie równe. Uda się nam to zrobić, jeżeli uda się nam pokazać, że to całe wyrażenie jest równe 1. By to osiągnąć dokonam upraszczającego podstawienia. Pozwólcie, że dokonam podstawienia -- powiedzmy że zmienna A jest równa k - 1. I B jest równe n - 1. Czemu teraz będzie równe (N-K)? Zobaczmy. Jeżeli A jest równe K-1, to A+1 jest równe K. Oraz B+1 będzie róne N, czyli N - K, będzie równe (A+1) minus to. Minus B-1, to się skróci. Co ostatecznie da A - B. Zobaczmy, czy możemy to uprościć. Ta cała suma przekształci się w NP razy suma od -- w porządku, jeżeli K jest równe 1, to czemu jest równe A? A jest równe 0. Od A równego 0 do -- teraz jeżeli K jest równe N, czemu będzie równe A? Jeżeli to jest równe N, jeżeli K jest równe N, wtedy A jest równe N-1. Czyli mamy A od 0 do N-1. Ale N-1 jest równe B. Czyli możemy przepisać tą sumę inaczej. Rozumiem, że takie przekształcenie zawsze jest nieco zawiłe, Możecie chcieć zapauzować i zastanowić się *** tym chwilę. Ale zdaję sobie sprawę, że już przekroczyłem limit czasowy, więc będę kontynuował bez przerwy. Wiemy, że B jest równe N-1. To będzie B silnia *** K-1, z ustalonej przez nas definicji, wiemy że jest to równe a. Czyli jest to A silnia. I tutaj, N-K zamieni się w... wiecie co? Zamieniłem tutaj miejscami. N-K, powinno być równe B-A. N jest róne B+1, czyli to jest B+1 minus A+1. Minus A, minus 1. Jedynki się skracają i uzyskujemy B-A. Czyli N-K silnia zamieni się na B-A silnia. I następnie P do (K-1) -- to zamieni się w P do A-tej. I następnie (1-P) do (N-K)-tej. Już pokazaliśmy, że N-K to jest to samo co B-A. Teraz tutaj, praktycznie już skończyliśmy -- ten wyraz, co to jest? To jest prawdopodobieństwo -- pozwólcie, że zapiszę to w nieco prostszy sposób. To jest równe NP razy suma od A równego 0 do B. Czym jest to? To jest B *** A. Mamy B rzeczy spośród których chcemy wybrać A rzeczy, (na ile różnych sposobów mogę to zrobić) razy P do A-tej razy (1-P) do (B-A)-tej. Czemu jest to równe? To odpowiada wzięciu każdego możliwego prawdopodobieństwa z rozkładu dwumianowego. Pytamy się przykładowo jakie jest prawdopodobieństwo, że A jest równe 0? Jakie jest prawdopodobieństwo dla każdej z możliwych wartości A, prawda? I sumujemy po wszystkich możliwych do uzyskania wartościach A. Jeżeli narysowałbym teraz na szybko taki rozkład, jeżeli A jest równe 0, to mamy pewne prawdopodobieństwo. Następnie pewnie prawdopodobieństwo osiągnięcia przez A jedynki, następnie kolejne prawdopodobieństwo, najpierw rosną. Dalej zaczynają układać się w krzywą dzwonową, coś mniej więcej takiego. Każdy z tych reprezentuje jeden z tych. Każdy z tych słupków reprezentuje jeden ze składników sumy. Jeżeli A jest równe 0, jest to ten czynnik. Jeżeli A jest równe 1 jest to ten wyraz. Jeżeli A jest równe 2 jest to ten wyraz, aż dla wszystkich B wyrazów. Ale sumujemy je, sumujemy wszystkie prawdopodobieństwa. Sumujemy po wszystkich wartościach jakie może przyjąć nasza zmienna losowa. Jeżeli obliczylibyśmy wszystkie prawdopodobieństwa, które zmienna losowa może przyjąć, jeżeli zsumujemy te wszystkie wartości, dostaniemy 1. To jest podobne do prawdopodobieństwa wypadnięcia reszki plus prawdopodobieństwa wypadnięcia orła. Lub korzystając z innej analogii do monet, to jest prawdopodobieństwo wyrzucenia jednej reszki, plus prawdopodobieństwo wyrzucenia 2 reszek, plus prawdopodobieństwo wyrzucenia 3 reszek, plus prawdopodobieństwo wyrzucenia 4 reszek, aż do prawdopodobieństwa wyrzucenia B reszek w B rzutach. Jest to praktycznie każda okoliczność jaka może zajść. Jest to więc suma po całym rozkładzie prawdopodobieństwa, sumuje się to do 1. I zostaje nam wartość oczekiwana naszej zmiennej losowej X, która jest równa NP. Gdzie N to jest liczba podejmowanych prób i P jest prawdopodobieństwem sukcesu w każdej z prób. Jest to prawdziwe dla wszystkich rozkładów dwumianowych. Ale nie jest prawdziwe dla dowolnej zmiennej losowej X. Jest prawdziwe jedynie dla zmiennej losowej X, które posiada rozkład dwumianowy. Cóż, skończył mi się czas. Do zobaczenia w następnym filmie.