Regresja liniowa jest podejściem do modelowania liniowego związku między dwiema zmiennymi.
Klasyczna metoda najmniejszych kwadratów (KMNK) jest metodą estymowania nieznanych parametrów w modelu regresji liniowej. Celem tej metody jest określenie modelu liniowego minimalizującego sumę kwadratów błędów pomiędzy obserwacjami w zestawie danych, a tymi przewidywanymi przez model. Poznaj metodę KMNK za pomocą słynnego zbioru danych Kwartet Anscombe’a.
Wybierz jeden z zestawów do zbadania.
Przeciągaj i upuszczaj punkty danych, aby zobaczyć, jaki ma to wpływ na linię KMNK.
Kliknij kolumnę tabeli regresji, aby dowiedzieć się więcej o danym parametrze.
\(\displaystyle{n}\) | \(\displaystyle{\bar{\cssId{xMEAN}{x}}}\) | \(\displaystyle{\bar{\cssId{yMEAN}{y}}}\) | \(\displaystyle{\hat{\cssId{BETA0}{B_{0}}}}\) | \(\displaystyle{\hat{\cssId{BETA1}{B_{1}}}}\) | \(\displaystyle{SSE}\) | |
Model |
Korelacja jest miarą siły liniowej zależności między dwiema zmiennymi. Współczynnik korelacji z próby, zdefiniowany jak poniżej, mieści się w przedziale domkniętym [-1, 1]:
$$r = \dfrac{s_{xy}}{\sqrt{s_{xx}}\sqrt{s_{yy}}}$$Poznaj tę koncepcję poprzez Edgara Andersona słynny Zbiór danych na temat irysów (ang.).
Wybierz gatunek, który chcesz badać.
Kliknij element macierzy korelacji, aby zobrazować związek między wybranymi cechami.
Długość listka kielicha | Szerokość listka kielicha | Długość płatka | Szerokość płatka | |
Długość listka kielicha | ||||
Szerokość listka kielicha | ||||
Długość płatka | ||||
Szerokość płatka |
Analiza wariancji (ANOVA) jest metodą statystyczną do testowania istotności różnic pomiędzy średnimi grup. Stanowi uogólnienie testu t dla dwóch lub więcej grup, przez porównanie wariancji międzygrupowej z wewnątrzgrupową. Zacznij od wybrania zbioru danych lub przesłania własnego pliku .csv .
Wybierz jeden z następujących zbiorów danych do zbadania.
Przeciągaj i upuszczaj punkty danych, aby zobaczyć, jaki ma to wpływ na wynik testu ANOVA.
Kliknij kolumnę tabeli ANOVA, aby dowiedzieć się więcej o danym parametrze.
\(\displaystyle{SSE}\) | \(\displaystyle{df}\) | \(\displaystyle{MS}\) | \(\displaystyle{F}\) | \(\displaystyle{p}\) | |
Czynnik | |||||
Błąd | |||||
Całkowita |