Business

3 Hauptprobleme des linearen Wahrscheinlichkeitsmodells (LPM)

3 Hauptprobleme des linearen Wahrscheinlichkeitsmodells (LPM) - Attrappen

Unter Verwendung der gewöhnlichen Methode der kleinsten Quadrate (OLS) Ein Modell mit einer dummy-abhängigen Variablen zu schätzen ist bekannt als ein lineares Wahrscheinlichkeitsmodell, oder LPM. LPMs sind nicht perfekt. Drei spezifische Probleme können auftreten:

  • Nicht-Normalität des Fehlerterms

  • Heteroskedastische Fehler

  • Potenziell unsinnige Vorhersagen

Nicht-Normalität des Fehlerterms

Die Annahme, dass der Fehler normal verteilt ist, ist für die Durchführung von Hypothesentests nach der Schätzung Ihres ökonometrischen Modells von entscheidender Bedeutung.

Der Fehlerterm eines LPM hat eine Binomialverteilung anstelle einer Normalverteilung. Dies impliziert, dass die traditionellen t -Tests für individuelle Signifikanz und F -Tests für die Gesamtbewertung ungültig sind.

Wie Sie sehen, hat der Fehlerterm in einem LPM einen von zwei möglichen Werten für einen gegebenen X -Wert. Ein möglicher Wert für den Fehler (wenn Y = 1) ist gegeben durch A, und der andere mögliche Wert für den Fehler (wenn Y = 0) ist gegeben durch B. Folglich Es ist unmöglich, dass der Fehlerterm eine Normalverteilung hat.

Heteroskedasticity

Das klassische lineare Regressionsmodell (CLRM) geht davon aus, dass der Fehlerterm homoskedastisch ist. Die Annahme einer Homoskedastizität ist erforderlich, um zu beweisen, dass die OLS-Schätzer effizient (oder am besten) sind. Der Beweis, dass OLS-Schätzer effizient sind, ist eine wichtige Komponente des Gauß-Markov-Theorems. Das Vorhandensein von Heteroskedastizität kann dazu führen, dass das Gauß-Markov-Theorem verletzt wird und zu anderen unerwünschten Eigenschaften für die OLS-Schätzer führt.

Der Fehlerterm in einem LPM ist heteroskedastic, weil die Varianz nicht konstant ist. Stattdessen hängt die Varianz eines LPM-Fehlerterms vom Wert der unabhängigen Variable (n) ab.

Unter Verwendung der Struktur der LPM können Sie die Varianz ihres Fehlerterms wie folgt charakterisieren:

Da die Varianz des Fehlers vom Wert von X, abhängt, weist sie eher Heteroskedastizität als Homoskedastizität auf.

Unberechnete vorhergesagte Wahrscheinlichkeiten

Das grundlegendste Wahrscheinlichkeitsgesetz besagt, dass die Wahrscheinlichkeit des Auftretens eines Ereignisses im Intervall [0, 1] enthalten sein muss. Aber die Natur eines LPM ist so, dass es nicht sicherstellt, dass dieses fundamentale Gesetz der Wahrscheinlichkeit erfüllt ist. Obwohl die meisten der vorhergesagten Wahrscheinlichkeiten von einem LPM sinnvolle Werte haben (zwischen 0 und 1), können einige vorhergesagte Wahrscheinlichkeiten unsinnige Werte haben, die kleiner als 0 oder größer als 1 sind.

Betrachten Sie die folgende Abbildung und konzentrieren Sie sich auf die Segmente der Regressionsgeraden, bei denen die bedingte Wahrscheinlichkeit größer als 1 oder kleiner als 0 ist. Wenn die abhängige Variable stetig ist, müssen Sie sich nicht um unbegrenzte Werte für das bedingte Mittel. Allerdings sind dichotome Variablen problematisch, da die bedingten Mittel bedingte Wahrscheinlichkeiten darstellen. Interpretationswahrscheinlichkeiten, die nicht durch 0 und 1 begrenzt sind, sind schwierig.

Sie können ein Beispiel dieses Problems mit tatsächlichen Daten sehen:

Die meisten der geschätzten Wahrscheinlichkeiten aus der LPM-Schätzung sind im [0, 1] -Intervall enthalten, aber die vorhergesagte Wahrscheinlichkeit für die siebte Beobachtung ist negativ. Unglücklicherweise stellt nichts in der Schätzung eines LPM sicher, dass alle vorhergesagten Wahrscheinlichkeiten in vernünftigen Werten bleiben.