Multikollinearität ist ein schwieriges Problem. Es gibt mehrere Möglichkeiten damit umzugehen: Variablen entfernen. Die wahrscheinlich einfachste Lösung ist, bei zwei oder mehr Prädiktoren mit hohen VIF-Werten, einen der Prädiktoren zu entfernen.Um Multikollinearität zu beheben, kann man eine der stark korrelierten Variablen entfernen, sie zu einer einzigen Variablen kombinieren oder eine Dimensionsreduktionstechnik wie die Hauptkomponentenanalyse verwenden, um die Anzahl der Variablen zu reduzieren und gleichzeitig die meisten Informationen beizubehalten.Warum ist Multikollinearität ein Problem Multikollinearität ist ein Problem, weil sie die statistische Signifikanz der unabhängigen Variablen verzerrt. Ein Hauptziel der Regression ist es, die Beziehung von jeder unabhängigen Variable und der abhängigen Variable zu bestimmen.
Was bedeutet perfekte Multikollinearität : Multikollinearität liegt vor, wenn zwei oder mehr erklärende Variablen eine sehr starke Korrelation miteinander haben. Mit zunehmender Multikollinearität wird in der Regressionsanalyse die Schätzung der Regressionskoeffizienten instabil.
Wann liegt Multikollinearität vor
Multikollinearität (engl. Multicollinearity) liegt vor, wenn mehrere Prädiktoren in einer Regressionsanalyse stark miteinander korrelieren. Man betrachtet bei der Multikollinearität also nicht die Korrelation der Prädiktoren mit dem Kriterium , sondern die Korrelationen der verschiedenen Prädiktoren untereinander.
Was ist eine gute Lösung angesichts der Multikollinearität : Um Multikollinearität zu bekämpfen, können Forscher die Korrelationsmatrix untersuchen, um Variablen mit hohen Korrelationskoeffizienten zu identifizieren . Der Variance Inflation Factor (VIF) misst die Inflation von Regressionskoeffizienten aufgrund von Multikollinearität.
Um Multikollinearität in Ihren Daten zu vermeiden oder zu reduzieren, können Sie mehrere Schritte unternehmen. Eine Möglichkeit besteht darin , einige der unabhängigen Variablen, die stark korrelieren oder redundant sind, wegzulassen oder zu kombinieren , da dadurch die Anzahl der Variablen und die Komplexität des Modells verringert werden.
Erhalten Sie mehr Daten, um die Standardfehler zu reduzieren . Verwenden Sie Techniken, die besser mit hohen VIFs funktionieren, wie z. B. die Shapley-Regression (beachten Sie, dass solche Techniken das VIF-Problem nicht wirklich lösen, sondern stattdessen sicherstellen, dass die Schätzungen zuverlässiger, also konsistenter sind).
Was gilt als hohe Multikollinearität
Eine Faustregel zur Erkennung von Multikollinearität lautet: Wenn der VIF größer als 10 ist, liegt ein Problem der Multikollinearität vor.For some people anything below 60% is acceptable and for certain others, even a correlation of 30% to 40% is considered too high because it one variable may just end up exaggerating the performance of the model or completely messing up parameter estimates.Nature of Multicollinearity: The term multicollinearity is introduced in Economic. analysis by Economist “Ranger Frisch”. Multicollinearity refers to the existence of a. perfect or exact linear relationship among some or all explanatory variables of a. regression model.
Faustregel: Wenn die Korrelation > 0,8 ist , liegt möglicherweise eine schwere Multikollinearität vor. Es ist möglich, dass einzelne Regressionskoeffizienten unbedeutend sind, die Gesamtanpassung der Gleichung jedoch hoch ist.
Wie erkennt man, ob Multikollinearität vorliegt : if you see correlations figures baove 0.7 or below -0.7 then you have problem , thus multicollinearity. in general the correlation is form -1 to +1 . the limit of 0.7 is typical in timseries analysis. if multicolinearity exists then you omit one of the variables with high correlation.
Kann man Multikollinearität ignorieren : Die Notwendigkeit, die Multikollinearität zu reduzieren, hängt von ihrem Schweregrad und Ihrem primären Ziel für Ihr Regressionsmodell ab. Beachten Sie die folgenden drei Punkte: Die Schwere der Probleme steigt mit dem Grad der Multikollinearität. Wenn Sie also nur eine mäßige Multikollinearität haben, müssen Sie diese möglicherweise nicht beheben .
Wie hoch ist zu hoch für Multikollinearität
In diesem Szenario gibt es keinen universellen Grenzwert, aber eine gute Heuristik besagt, dass bei Korrelationen über 0,5 Multikollinearität vorliegt. In realen Situationen ist jedoch sogar 0,5 zu hoch und der Schwellenwert muss möglicherweise gesenkt werden.
Für einige Leute ist alles unter 60 % akzeptabel und für andere wird sogar eine Korrelation von 30 % bis 40 % als zu hoch angesehen, da es sich dabei um eine Variable handeln könnte, die die Leistung des Modells übertreibt oder die Parameterschätzungen völlig durcheinander bringt.Methoden zur Behebung der Multikollinearität: Dieses Multikollinearitätsproblem kann durch folgende Methoden behoben werden: • Neuspezifikation des betrachteten Modells . Nutzung zusätzlicher Daten/Erhebung weiterer Daten. Unabhängige Schätzung von Parametern.
Wie viel ist zu viel Multikollinearität : Faustregel: Wenn die Korrelation > 0,8 ist, liegt möglicherweise eine schwere Multikollinearität vor. Es ist möglich, dass einzelne Regressionskoeffizienten unbedeutend sind, die Gesamtanpassung der Gleichung jedoch hoch ist. Ein VIF misst das Ausmaß, in dem Multikollinearität die Varianz eines geschätzten Koeffizienten erhöht hat.