Paradoks Simpsona

Z Wikipedii

Skocz do: nawigacji, szukaj

Paradoks Simpsona jest paradoksem statystycznym opisanym przez E. H. Simpsona w 1951 roku. Polega on na tym, że sukces kilku grup wydaje się być odwrócony, kiedy grupy są połączone. Ten pozornie niemożliwy efekt niespodziewanie pojawia się w naukach społecznych i statystyce związanej z medycyną, kiedy zmienna ważona, która różni się od wartości określonej indywidualnie dla poszczególnych grup, jest używana do oceny połączonych grup.

[edytuj] Wyjaśnienie na przykładzie

Dla zilustrowania paradoksu wyobraźmy sobie dwie osoby, Alę i Janka, które edytują artykuły Wikipedii. W pierwszym tygodniu, Ala poprawia 60% artykułów które edytuje, podczas, kiedy Janek poprawia 90% artykułów. W drugim tygodniu Ala poprawia tylko 10% edytowanych artykułów, a Janek 30%.

W obydwu przypadkach Janek poprawił dużo większy procent artykułów niż Ala. Jednak kiedy połączymy wyniki osiągnięte w obydwu tygodniach, może okazać się, że to Ala poprawiła znacznie większy procent artykułów niż Janek!

Tydzień 1 Tydzień 2 Razem
 Ala   60.0%  10.0%  55.5% 
 Janek  90.0%  30.0%   35.5% 

Przyczyną powyższego paradoksu jest różna liczba artykułów jakie mogły być edytowane przez każdą osobę - ta informacja pierwotnie nie była podana. Te 30% poprawionych artykułów przez Alę może okazać się większą liczbą, niż wszystko co w ogóle Janek poprawił. Przyjmijmy przykładowo, że pierwszym tygodniu Ala edytuje 100 artykułów, poprawiając 60 spośród nich; Janek edytuje tylko 10 artykułów poprawiając wszystkie z wyjątkiem jednego. Czyli procentowo Janek poprawił więcej, ale w liczbach bezwzględnych - mniej. W drugim tygodniu Ala edytuje tylko 10 artykułów poprawiając jeden; Janek edytuje 100 artykułów poprawiając 30. Kiedy połączymy dwutygodniowy rezultat pracy okaże się, że Ala i Janek dokonali edycji takiej samej liczby artykułów, jednak Ala poprawiła 55% z nich (wszystkich 61), a Janek poprawił tylko 35% z nich (wszystkich 39)

Tydzień 1 Tydzień 2 Razem
 Ala   60 / 100  1 / 10  61 / 110 
 Janek  9 / 10  30 / 100   39 / 110 

Podsumowując i wprowadzając niektóre oznaczenia użyte w dalszej treści:

  • W pierwszym tygodniu
  • S_A(1) = 60\% — Ala poprawiła 60% artykułów, ze wszystkich które edytowała.
  • S_B(1) = 90\% — Janek osiągnął wskaźnik sukcesu 90% w tym samym czasie.
Sukces osiągnął Janek.
  • W drugim tygodniu
  • S_A(2) = 10\% — Ala poprawiła 10% artykułów (1 z 10 edytowanych)
  • S_B(2) = 30\% — Janek osiągnął wskaźnik sukcesu 30%.
Sukces osiągnął Janek.

W obydwu przypadkach edycje Janka osiągnęły większy sukces niż edycje Ali. Jeśli jednak połączymy obydwa zbiory, zobaczymy, że Janek i Ala razem dokonali edycji 110 artykułów:

  • S_A = \begin{matrix}\frac{61}{110}\end{matrix} — Ala poprawiła 61 artykułów.
  • S_B = \begin{matrix}\frac{39}{110}\end{matrix} — Janek poprawił tylko 39.
  • SA > SB — Sukces osiągnęła teraz Ala.

Janek jest lepszy w obydwu przypadkach, ale łącznie osiągnął gorszy rezultat!

Arytmetyczna podstawa wyjaśnienia paradoksu nie jest kontrowersyjna. Jeśli SB(1) > SA(1) i SB(2) > SA(2) intuicja podpowiada, że SB musi być większe niż SA. Jednak jeśli różne wagi są użyte dla określenia wyniku końcowego dla każdej osoby - wówczas intuicyjne odczucie może zawieść. W tym przypadku pierwsza próba jest ważona \begin{matrix}\frac{100}{110}\end{matrix} dla Ali i \begin{matrix}\frac{10}{110}\end{matrix} dla Janka, podczas gdy w drugiej próbie wagi są odwrócone.

  • S_A = \begin{matrix}\frac{100}{110}\end{matrix}S_A(1) + \begin{matrix}\frac{10}{110}\end{matrix}S_A(2)
  • S_B = \begin{matrix}\frac{10}{110}\end{matrix}S_B(1) + \begin{matrix}\frac{100}{110}\end{matrix}S_B(2)

Przy jeszcze większym odwróceniu wag dla obydwu prób, łączny wynik Ali będzie większy niż 60%, a Janka spadnie poniżej 30%.

Ala ma lepszą skuteczność, ale mówiąc o skuteczności w poszczególnych tygodniach można pomyśleć, że Janek ma lepszą.

[edytuj] Zobacz też

osobiste
  • .
nawigacja
zmiany
dla edytorów
narzędzia
W innych językach

unibet Ciśnienie admove serpentyny sklep z herbatą