User Tools

Site Tools


Sidebar


Menu



notatki:ci:statystyka

Statystic (pl)

Books

Elementy Statystyki

Podstawowe elementy statystyki

Kwantyl

Kwanty można zdefiniować jako funkcję k(p)=Px(-inf,x_p)≥p i Px(x_p,inf)≥1-p gdzie p nazywane rzędem Kwantylu jest wartością z przedziału [0,1]. Innymi słowy, jeśliby posortować wszystkie wartości x od najmniejszej do największej → sx=sort(x) mając n wartości x wówczas wartość kwartyla rzędu 0.5 można wyznaczyć jako k(0.5)=sx(n/2) - czyli jest to wartość środkowa w posortowanym zbiorze x. Pewne kwantyle mają swoją specyficzną nazwę i możemy wyróżnuć kwartyl, decyl

Kwartyl

Istnieją trzy Kwartyle:

  • pierwszy: k(0.25)
  • drugi: k(0.5) zwany również medianą
  • trzeci: k(0.75)

Jeśli założymy że mamy posortowane n wartości sx to możemy je wyznaczyć odpowiednio jako sx(n/4), sx(n/2) i sx(n*3/4) Często używanym parametrem jest też rozstęp kwartylny (inter quartyl range)

Decyle

Decyle to kwantyle rzędu wielorotności 1/10 czyli

  • pierwszy: k(0.1)
  • drugi: k(0.2)
  • trzeci: k(0.3)
  • dziewiąty k(0.9)

Moment zwykły

Moment zwykły rzędu k (gdzie k = 1,2, …) zmiennej losowej wyznaczany jest jako wartość oczekiwana k-tej potęgi tej zmiennej. Najczęściej w praktyce (w przypadku empirycznego rozkładu danych) można go wyznaczyć jako

gdzie moment rzędu k=1 to wartość oczekiwana.

Moment centralny

Moment centralny rzędu k (k = 1, 2, …) zmiennej losowej wyznaczany jest jako wartość oczekiwana k-tej potęgi różnicy zmiennej losowej i jej wartości oczekiwanej. Ogólnie można go zapisać dla zmiennej empirycznej jako:

Ponieważ MC jest obciążony jeśli mówimy o próbie z populacji więc określa się również estymator nieobciążony:

Wariancja

Wariancja jest Momentem centralnym rzędu 2.

Trzeci moment centralny

Trzeci moment centralny pozwala wnioskować o skośności rozkładu. Używa się go do miary zwanej współczynnikiem skośności zdefiniowanym jako:

który liczony jest jako iloraz trzeciego momentu centralnego i trzeciej potęgi odchylenia standardowego.

Testy statystyczne

Testy na zgodność z danym rozkładem

  • Chi2 - goodnes of fit - test na zgodność z rozkładem normalnym, średnia i wariancja estymowane z badanej próby
  • Jarque-Bera test - test na normalność rozkładu przy założeniu nieznajomości średniej i wariancji
  • One-sample Kolmogorov-Smirnov test - porównanie próby z rozkładem normalnym lub dowolnym innym, przy założeniu dokładnej znajomości parametrów rozkładu (wykorzystanie dystrybuanty)
  • Lilliefors test - j.w. z tą różnicą że nie sa wymagane dokładne informacje o rozkładzie wzorcowym
  • Wilcoxon signed rank test - dwustronny test (próby x i y), gdzie hipoteza zerowa zakłada że dane x pochodzą z rozkładu ciągłego o zerowej medianie, przeciw hipotezie w której dane nie posiadają mediany = 0
  • One sample T-test - stosuje test t-studenta do weryfikacji hipotezy, że dane są losowymi przypadkami z rozkładu normalnego o średniej = 0 i nieznanej wariancji, alternatywna hipoteza że średnia <> 0

Testy na pochodzenie z tego samego rozkładu

  • Two-sample Kolmogorov-Smirnov test - porównanie dwóch prób (dane ciągłe!!!) i weryfikacja czy pochodzą z tego samego rozkładu (bazuje na dystrybuancie max(|D(x) - D(y)|))
  • Wilcoxon rank sum test - Dwustronny test oparty na rangach, w którym hipoteza zerowa zakłada, że zarówno próba x jak i proba y (obydwie próby) są niezależnymi próbami pochodzącymi z identycznego ciągłego rozkładu o równych medianach, alternatywną hipotezą jest że nie posiadają one jednakowej mediany.
  • Two-sample T-test - zastosowanie testu t-studenta do porównanie rozkładów, przy hipotezie zerowej, że dane x i y są niezależnymi losowymi próbami rozkładu normalnego posiadającymi identyczna średnią i równą lecz nieznaną wariancję, alternatywna hipoteza mówi o różnych średnich.
  • Printable version
  • Tell by mail
  • Export to OpenOffice
  • Export to PDF
  • Export to csv
  • Export to Timeline
  • Add page to book
  • Tools:
notatki/ci/statystyka.txt · Last modified: 2019/03/21 13:06 (external edit)