Business

10 Schlüsselkonzepte in der Hypothesentestung

10 Schlüsselkonzepte in Hypothesentests - Dummys

Hypothesentest ist eine statistische Technik, die in einer Vielzahl von Situationen verwendet wird. Obwohl sich die technischen Details von Situation zu Situation unterscheiden, verwenden alle Hypothesentests denselben Kernsatz von Begriffen und Konzepten. Die folgenden Beschreibungen allgemeiner Begriffe und Konzepte beziehen sich auf einen Hypothesentest, bei dem die Mittel zweier Populationen verglichen werden.

Nullhypothese

Die Nullhypothese ist eine klare Aussage über die Beziehung zwischen zwei (oder mehr) statistischen Objekten. Diese Objekte können Maße, Verteilungen oder Kategorien sein. Typischerweise besagt die Nullhypothese, wie der Name andeutet, dass es keine Beziehung gibt.

Im Fall von zwei Populationsmitteln könnte die Nullhypothese angeben, dass die Mittelwerte der beiden Populationen gleich sind.

Alternative Hypothese

Sobald die Nullhypothese angegeben wurde, ist es einfach, die Alternativhypothese zu konstruieren. Es ist im Wesentlichen die Aussage, dass die Nullhypothese falsch ist. In unserem Beispiel wäre die alternative Hypothese, dass die Mittel der beiden Populationen nicht gleich sind.

Signifikanz

Die Signifikanz Signifikanz ist ein Maß für die statistische Aussagekraft des Hypothesentests. Es wird oft als die Wahrscheinlichkeit bezeichnet, falsch zu schließen, dass die Nullhypothese falsch ist.

Das Signifikanzniveau ist etwas, das Sie im Voraus festlegen sollten. In Anwendungen ist das Signifikanzniveau typischerweise einer von drei Werten: 10%, 5% oder 1%. Ein Signifikanzniveau von 1% stellt den stärksten Test der drei dar. Aus diesem Grund ist 1% ein Signifikanzniveau höher als 10%.

Potenz

Bezogen auf die Signifikanz misst die Potenz eines Tests die Wahrscheinlichkeit, dass die Nullhypothese richtig ist. Macht ist nicht etwas, das man wählen kann. Sie wird durch mehrere Faktoren bestimmt, darunter das Signifikanzniveau, das Sie auswählen, und die Größe des Unterschieds zwischen den Dingen, die Sie vergleichen möchten.

Leider sind Bedeutung und Macht umgekehrt verwandt. Zunehmende Signifikanz verringert die Leistung. Dies macht es schwierig, Experimente zu entwerfen, die sowohl eine sehr hohe Bedeutung als auch eine hohe Leistung haben.

Teststatistik

Die Teststatistik ist eine einzelne Messgröße, die die statistische Natur der Beziehung zwischen Beobachtungen erfasst, mit denen Sie zu tun haben. Die Teststatistik hängt grundsätzlich von der Anzahl der Beobachtungen ab, die ausgewertet werden. Es unterscheidet sich von Situation zu Situation.

Verteilung der Teststatistik

Der gesamte Begriff der Hypothese beruht auf der Fähigkeit, (genau oder annähernd) die Verteilung anzugeben, der die Teststatistik folgt. Im Falle dieses Beispiels ist der Unterschied zwischen den Mitteln ungefähr normalverteilt (unter der Annahme, dass es eine relativ große Anzahl von Beobachtungen gibt).

Einseitige oder zweiseitige Tests

Abhängig von der Situation können (oder müssen) Sie einen one- oder two-tailed Test verwenden. Diese Schwänze beziehen sich auf die rechten und linken Schwänze der Verteilung der Teststatistik. Ein zweiseitiger Test ermöglicht die Möglichkeit, dass die Teststatistik entweder sehr groß oder sehr klein (negativ ist klein) ist. Ein einseitiger Test lässt nur eine dieser Möglichkeiten zu.

In einem Beispiel, in dem die Nullhypothese besagt, dass die beiden Populationsmittel gleich sind, müssen Sie die Möglichkeit berücksichtigen, dass eines der beiden größer ist als das andere. Die Teststatistik könnte entweder positiv oder negativ sein. Sie verwenden also einen zweiseitigen Test.

Die Nullhypothese könnte etwas anders lauten, nämlich dass der Mittelwert von Bevölkerung 1 größer ist als der Durchschnitt von Bevölkerung 2. In diesem Fall müssen Sie nicht statistisch für die Situation Rechenschaft ablegen, in der der erste Mittelwert kleiner als der Zweite. Sie würden also einen einseitigen Test verwenden.

Kritischer Wert

Der kritische Wert in einem Hypothesentest basiert auf zwei Dingen: der Verteilung der Teststatistik und dem Signifikanzniveau. Die kritischen Werte beziehen sich auf den Punkt in der Teststatistikverteilung, der den Schwänzen der Verteilung eine Fläche (Wahrscheinlichkeit) gibt, die genau dem gewählten Signifikanzniveau entspricht.

Entscheidung

Ihre Entscheidung , die Nullhypothese abzulehnen oder anzunehmen, basiert auf dem Vergleich der Teststatistik mit dem kritischen Wert. Wenn die Teststatistik den kritischen Wert überschreitet, sollten Sie die Nullhypothese ablehnen. In diesem Fall würden Sie sagen, dass der Unterschied zwischen den beiden Populationsmitteln signifikant ist. Ansonsten akzeptieren Sie die Nullhypothese.

P-Wert

Der -P-Wert eines Hypothesentests bietet eine weitere Möglichkeit, die Nullhypothese zu bewerten. Der p-Wert stellt das höchste Signifikanzniveau dar, bei dem Ihre spezielle Teststatistik die Ablehnung der Nullhypothese rechtfertigen würde. Zum Beispiel, wenn Sie ein Signifikanzniveau von 5% gewählt haben und der p-Wert sich als erfüllt erweist. 03 (oder 3%) wären Sie berechtigt, die Nullhypothese abzulehnen.