Business

Wie man ein Boxplot aus einer Fünf-Zahlen-Zusammenfassung macht

Wie man ein Boxplot aus einer Fünf-Zahlen-Zusammenfassung macht - dummies

Ein Boxplot ist ein eindimensionaler Graph numerischer Daten auf der Basis der fünf Nummer Zusammenfassung. Diese Zusammenfassung enthält die folgenden Statistiken: den Minimalwert, das 25. Perzentil (bekannt als Q 1 ), den Median, das 75. Perzentil ( Q 3 ), und der maximale Wert. Im Wesentlichen teilen diese fünf deskriptiven Statistiken den Datensatz in vier Teile, wobei jeder Teil 25% der Daten enthält.

Gehen Sie folgendermaßen vor, um ein Boxplot zu erstellen:

  1. Suchen Sie die fünfstellige Zusammenfassung Ihres Datensatzes:

    Das Minimum ist der kleinste Wert in den Daten festgelegt, und das Maximum ist der größte Wert im Datensatz. Verwenden Sie die folgenden Schritte, um das 25. Perzentil (bekannt als Q 1 ), das 50. Perzentil (der Median) und das 75. Perzentil ( Q 3 ) zu finden. ..

    1. Ordnen Sie alle Werte im Datensatz vom kleinsten bis zum größten an.

    2. Multiplizieren Sie k Prozent mal die Gesamtzahl der Werte in den Daten, n .

      Das Ergebnis wird als Index bezeichnet.

    3. Wenn der in Schritt 2 erhaltene Index keine ganze Zahl ist, runden Sie ihn auf die nächste ganze Zahl auf und fahren Sie mit Schritt 4a fort.

      Wenn der in Schritt 2 erhaltene Index eine ganze Zahl ist, fahren Sie mit Schritt 4b fort.

    4. Wählen Sie eine der folgenden Optionen aus.

      a. Zählen Sie die Werte in Ihrem Datensatz von links nach rechts (vom kleinsten zum größten Wert), bis Sie die in Schritt 3 angegebene Zahl erreichen. Der entsprechende Wert in Ihrem Datensatz ist das k th -Perzentil.

      b. Zählen Sie die Werte in Ihrem Datensatz von links nach rechts (kleinste bis größte), bis Sie die in Schritt 2 angegebene Zahl erreichen. Das k th -Perzentil ist der Durchschnitt dieses entsprechenden Werts in Ihrem Datensatz und der Wert das folgt direkt darauf.

  2. Erstellen Sie eine vertikale (oder horizontale) Zahlenlinie, deren Skala die Werte in der Zusammenfassung mit fünf Zahlen enthält und die entsprechende Einheiten mit gleichem Abstand voneinander verwendet.

  3. Markieren Sie die Position jedes Werts in der Zusammenfassung mit fünf Zahlen direkt über der Zahlenlinie (für ein horizontales Boxplot) oder nur rechts von der Zahlenlinie (für ein vertikales Boxplot).

  4. Zeichnen Sie eine Box um die Markierungen für das 25. Perzentil und das 75. Perzentil.

  5. Zeichne eine Linie in das Feld, in dem sich der Median befindet.

  6. Bestimmen Sie, ob Ausreißer vorhanden sind oder nicht.

    Um diese Bestimmung durchzuführen, berechne den Interquartilbereich ( IQR ) , der durch Subtraktion von Q 3 - Q 1 gefunden wird ; multiplizieren Sie dann IQR mit 1. 5. Fügen Sie diesen Betrag zum Wert von Q 3 hinzu und subtrahieren Sie diesen Betrag von Q 1 .Dies gibt Ihnen eine breitere Grenze um den Median als die Box. Alle Datenpunkte, die außerhalb dieser Grenze liegen, werden als Ausreißer definiert.

  7. Wenn es keine Ausreißer gibt (gemäß den Ergebnissen von Schritt 6), zeichnen Sie Linien vom oberen und unteren Rand der Box bis zu den minimalen und maximalen Werten im Datensatz.

  8. Wenn es Ausreißer gibt (gemäß den Ergebnissen von Schritt 6), geben Sie ihre Position auf dem Boxplot mit * an.

    Anstatt eine Linie vom Rand der Box bis zum extremsten Ausreißer zu zeichnen, stoppen Sie die Linie beim letzten Datenwert, der kein Ausreißer ist.

Viele, wenn nicht die meisten Softwarepakete zeigen Ausreißer in einem Datensatz an, indem sie ein Sternchen (*) oder ein Sternsymbol verwenden, und verwenden die in Schritt 6 beschriebene Prozedur, um Ausreißer zu identifizieren. Nicht alle Pakete verwenden jedoch diese Symbole und Prozeduren. Schauen Sie nach, was Ihr Paket macht, bevor Sie Ihre Daten mit einem Boxplot analysieren.

n = 83 Schauspielerinnen). ">

Boxplot der besten Schauspielerin altert (1928-2009; n = 83 Schauspielerinnen).

In der obigen Abbildung ist ein horizontaler Boxplot für Alter der Gewinner des Oscars in der Kategorie Best Actress von 1928-2009 zu sehen. Sie können sehen, dass die Zahlen, die die Abschnitte des Boxplots voneinander trennen, mit der fünfstelligen Statistik übereinstimmen, die in der folgenden Abbildung dargestellt ist.

Beschreibende Statistik für die beste Darstellerin (1928-2009).

Boxplots können vertikal (gerade nach oben und unten) sein, wobei die Werte auf der Achse von unten (niedrig) nach oben (am höchsten) gehen. oder sie können horizontal sein, wobei die Werte auf der Achse von links (niedrigste) nach rechts (höchste) gehen.

Die hier gezeigten Schritte zeigen eine Möglichkeit, den Median und die Quartile der Zusammenfassung mit fünf Zahlen zu berechnen und den Boxplot zu konstruieren. Aber es gibt mehrere andere akzeptable Methoden. Seien Sie nicht zu beunruhigt, wenn Ihr Rechner oder ein Freund Ihnen ein Boxplot nahe bringt, das sich aber von dem unterscheidet, was diese Schritte geben würden.