{"id":2374,"date":"2017-08-10T17:28:14","date_gmt":"2017-08-10T17:28:14","guid":{"rendered":"https:\/\/www.kolabtree.com\/blog\/?p=2374"},"modified":"2017-08-14T10:11:42","modified_gmt":"2017-08-14T10:11:42","slug":"correct-outliers-regression-trumps-vote","status":"publish","type":"post","link":"https:\/\/www.kolabtree.com\/blog\/de\/correct-outliers-regression-trumps-vote\/","title":{"rendered":"Wie man Ausrei\u00dfer in Regressionsmodellen korrigiert: Ein Beispiel mit Rasse, Bildung und Unversicherten auf Trumps Wahl"},"content":{"rendered":"<p><em>Dieser Beitrag erschien urspr\u00fcnglich in meiner Kolumne auf der Website <a href=\"http:\/\/datadrivenjournalism.net\/news_and_analysis\/correcting_outliers_the_effect_of_race_education_and_the_uninsured_on_trump\">datengesteuerter Journalismus<\/a>.<\/em><\/p>\n<p>In meinem <a href=\"http:\/\/datadrivenjournalism.net\/news_and_analysis\/regression_for_journalists\">Im letzten Beitrag habe ich dar\u00fcber gesprochen, wie Regression<\/a> kann ein n\u00fctzliches Instrument sein, um die verschiedenen Beziehungen zwischen Korrelationsvariablen herauszuarbeiten. Ich habe auch dar\u00fcber gesprochen, dass Ausrei\u00dfer problematisch sein k\u00f6nnen. Eine M\u00f6glichkeit, mit einem Ausrei\u00dfer umzugehen, besteht darin, ihn einfach aus der Analyse zu streichen. Dadurch verringert sich die statistische Aussagekraft (die Wahrscheinlichkeit, einen signifikanten Pr\u00e4diktor zu finden, wenn es ihn gibt) und es werden potenziell wertvolle Informationen aus dem Modell entfernt. Es k\u00f6nnte ein fruchtbareres Unterfangen sein, da wertvolle Informationen gewonnen werden k\u00f6nnen. Ich habe dies in meinem Beitrag dar\u00fcber getan, wie sich Washington, DC von den anderen Staaten unterscheidet, und es hat mich auf eine Idee f\u00fcr eine weitere Kovariate gebracht, die zus\u00e4tzlich zu den bereits ber\u00fccksichtigten ber\u00fccksichtigt werden sollte: Konzentration von Hassgruppen, % unversichert, % mit einem Bachelor-Abschluss oder h\u00f6her und % in Armut.<\/p>\n<p>In meinem <a href=\"http:\/\/datadrivenjournalism.net\/news_and_analysis\/how_is_washington_dc_an_outlier_lets_count_the_ways\">Beitrag \u00fcber die Merkmale von Washington, DC als Ausrei\u00dfer<\/a> Ich habe festgestellt, dass dieser Bezirk im Vergleich zu allen anderen Staaten am wenigsten wei\u00df ist. Nur 40,2% der Distriktbev\u00f6lkerung bezeichnen sich dort als wei\u00df oder kaukasisch. Nur Hawaii hatte mit 25,4% einen geringeren Anteil an Wei\u00dfen. Bei der Exit Poll f\u00fcr die Wahl im letzten Jahr stimmten 60% der wei\u00dfen Frauen ohne Hochschulbildung f\u00fcr Trump, w\u00e4hrend es 71% der wei\u00dfen M\u00e4nner ohne Hochschulbildung taten. 74% der Nicht-Wei\u00dfen stimmten f\u00fcr Clinton.<\/p>\n<p>Durch die Aufnahme dieser Variablen in das Modell wurde die Genauigkeit des Modells mit DC deutlich verbessert, da 78,5% der Schwankungen bei Trumps Wahlbeteiligung ber\u00fccksichtigt wurden. Die Variablen f\u00fcr Hassgruppen und % Armut waren nicht signifikant und wurden ausgeschlossen, da ihre Aufnahme in das Modell die statistische Aussagekraft verringert. Die Variablen % Bachelor, % Wei\u00df und % Unversichert waren signifikant (d. h. der p-Wert ist kleiner als 0,05, was ich in einem sp\u00e4teren Beitrag erl\u00e4utern werde), die anderen waren es nicht. Die Ausgabe der meisten Statistikpakete:<\/p>\n<table class=\"m_-6998272163864735663ydp443f502dMsoTableGrid m_-6998272163864735663ydpfe588df9yahoo-compose-table-card\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>78,5% der Variabilit\u00e4t <\/i><\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>ausgemacht<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Koeffizienten<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Standardfehler<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>t Status<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>P-Wert<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Unter <\/i><\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>95%<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Obere <\/i><\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>95%<\/i><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">Abfangen<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">51.55<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">8.92<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">5.78<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">5.75E-07<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">33.61<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">69.48<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">%-Bachelor-Abschluss<\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">oder h\u00f6her<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-1.11<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.15<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-7.55<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">1.2E-09<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-1.41<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-0.82<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">% Wei\u00df<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.31<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.06<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">4.95<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">1.01E-05<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.18<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.43<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">% unversichert<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.74<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.26<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">2.86<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.006319<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.22<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">1.26<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Die Spalte \"Koeffizienten\" enth\u00e4lt die gesch\u00e4tzten Werte f\u00fcr die Regressionsgleichung, die ich in fr\u00fcheren Beitr\u00e4gen dargelegt habe. Die aktuelle Gleichung lautet:<\/p>\n<p>Trump % der Stimmen = 51,55 - 1,11*(% Bachelor) + 0,31*(% Wei\u00df) + 0,74*(% Unversichert)<\/p>\n<p>Das hei\u00dft, wenn alle Kovariaten gleich Null sind, wird f\u00fcr Trump ein Stimmenanteil von 51,55% vorhergesagt. F\u00fcr jede Zunahme von 1% der % Junggesellen gibt es einen gesch\u00e4tzten R\u00fcckgang von Trumps Stimmen um 1,11%. F\u00fcr jede 1% Zunahme der % wei\u00dfen Bev\u00f6lkerung im Staat gibt es eine gesch\u00e4tzte Zunahme von 0,31% und f\u00fcr jede 1% Zunahme der % Unversicherten im Staat.<\/p>\n<p>Die Spalte mit der Bezeichnung \"Standardfehler\" ist eine Sch\u00e4tzung der Unsicherheit der Koeffizienten. Die Spalte \"t stat\" ist die Teststatistik zur Bestimmung, ob die Koeffizienten signifikant von Null verschieden sind. Der \"p-Wert\" ist die gesch\u00e4tzte Wahrscheinlichkeit, diesen gesch\u00e4tzten Koeffizienten zu beobachten, wenn der wahre Koeffizient Null ist. Wenn der p-Wert kleiner als 0,05 ist, wird davon ausgegangen, dass der wahre Koeffizient von Null verschieden ist. Die letzten beiden Spalten zeigen die oberen und unteren Grenzen f\u00fcr ein 95%-Konfidenzintervall f\u00fcr einen Koeffizienten. Das Konfidenzintervall besagt, dass der wahre Koeffizient in 95% der F\u00e4lle, in denen die Sch\u00e4tzungen vorgenommen werden, zwischen dem oberen und dem unteren Grenzwert liegt. Wenn in diesem Fall die obere und die untere Grenze die Zahl Null nicht \u00fcberschreiten, bedeutet dies, dass der Koeffizient signifikant von Null verschieden ist.<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-2384 size-large\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-1024x744.png\" alt=\"\" width=\"702\" height=\"510\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-1024x744.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-300x218.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-768x558.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-1080x785.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race.png 1423w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-300x218@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p>Das obige Streudiagramm zeigt die tats\u00e4chlichen (in der blauen Raute) und die vorhergesagten Werte (in den roten Quadraten) f\u00fcr % Wei\u00df und % Trump f\u00fcr das Modell, das um % Junggesellen und % Unversicherte bereinigt ist. Die tats\u00e4chlichen und die vorhergesagten Werte f\u00fcr den District of Columbia (DC) und Hawaii liegen sehr nahe beieinander, was auf eine gute Anpassung schlie\u00dfen l\u00e4sst. Ein Staat, der schlecht passt, ist Vermont, wo die tats\u00e4chliche Stimme f\u00fcr Trump 10% niedriger ist als die vorhergesagte Stimme, was direkt \u00fcber der blauen Raute f\u00fcr Vermont zu sehen ist.<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-2385 size-large\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-1024x744.png\" alt=\"\" width=\"702\" height=\"510\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-1024x744.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-300x218.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-768x558.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-1080x785.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins.png 1423w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-300x218@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p>Das Streudiagramm f\u00fcr % bachelor's degree or higher deutet darauf hin, dass die Anpassung nicht so gut ist wie f\u00fcr % white als Pr\u00e4diktor. Dies spiegelt sich in dem gr\u00f6\u00dferen Standardfehler f\u00fcr diesen Pr\u00e4diktor (0,15) als f\u00fcr % wei\u00df (0,06) wider. Die Vorhersage f\u00fcr DC ist f\u00fcr diesen Pr\u00e4diktor nicht so gut, da er den h\u00f6chsten Wert aufweist. Der Trend ist immer noch signifikant in die negative Richtung.<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone size-large wp-image-2386\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-1024x744.png\" alt=\"\" width=\"702\" height=\"510\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-1024x744.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-300x218.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-768x558.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-1080x785.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race.png 1423w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-300x218@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p>Das Streudiagramm f\u00fcr % Unversicherte als Pr\u00e4diktor zeigt eine noch geringere \u00dcbereinstimmung mit Trumps % der W\u00e4hlerstimmen. DC und Alaska sind unter vielen anderen Staaten schlecht geeignete Punkte f\u00fcr diesen Pr\u00e4diktor. Der Standardfehler f\u00fcr diesen Pr\u00e4diktor zeigt eine noch geringere Anpassung (0,26) f\u00fcr die anderen Pr\u00e4diktoren, obwohl er immer noch statistisch signifikant ist.<\/p>\n<p>Die multiple Regression ist ein potenziell leistungsf\u00e4higes Instrument, um die Beziehungen zwischen Vorhersagevariablen f\u00fcr ein bestimmtes Ergebnis herauszuarbeiten, wenn sie richtig durchgef\u00fchrt wird. Die Hinzuf\u00fcgung der richtigen Kovariaten, wie z. B. der Rasse, kann dazu beitragen, die Auswirkungen eines Ausrei\u00dfers wie Washington, DC, abzuschw\u00e4chen. Es ist immer besser, alle Daten einzubeziehen, um ein m\u00f6glichst vollst\u00e4ndiges Bild der Situation zu erhalten.<\/p>\n<p>Wir sehen nun, dass mit dem Anstieg des % der Bev\u00f6lkerung eines Staates mit einem Bachelor-Abschluss oder h\u00f6her das % der Stimmen f\u00fcr Trump sinkt. Gleichzeitig steigt das % der Stimmen f\u00fcr Trump, wenn der Anteil der Wei\u00dfen und der Nichtversicherten in einem Staat steigt. Bei Vorhandensein dieser Variablen sind die Konzentration von Hassgruppen und der % des Staates in Armut keine signifikanten Pr\u00e4diktoren mehr f\u00fcr die Wahl Trumps.<\/p>\n<p>W\u00e4hrend Trump und der von den Republikanern kontrollierte Kongress sich darauf vorbereiten, das Affordable Care Act (ACA oder wie die GOP sagt Obamacare) aufzuheben, sch\u00e4tzt das Congressional Budget Office, dass 23 Millionen Amerikaner in der Version des Repr\u00e4sentantenhauses ihre Krankenversicherung verlieren werden und sch\u00e4tzungsweise 22 Millionen in der Version des Senats. In diesem Modell ist die Zahl der Nichtversicherten in jedem Bundesstaat positiv mit Trumps Stimmabgabe korreliert. Glaubt Trump, dass eine Erh\u00f6hung der Quote der Nichtversicherten seinen Stimmenanteil im Jahr 2020 erh\u00f6hen wird?<\/p>\n<p>Armut wurde nicht mit der Wahl Trumps im Jahr 2016 in Verbindung gebracht. Der R\u00fcckgang der nicht versicherten Personen seit dem Inkrafttreten des ACA im Jahr 2014 ist haupts\u00e4chlich auf die Ausweitung von Medicaid f\u00fcr die \u00e4rmsten Personen und auf Subventionen zur\u00fcckzuf\u00fchren, die es Personen mit geringem Einkommen erm\u00f6glichen, eine Krankenversicherung abzuschlie\u00dfen. Eine Erh\u00f6hung der Zahl der Nichtversicherten k\u00f6nnte Trumps W\u00e4hlerstimmen nicht verringern, aber es ist unwahrscheinlich, dass sie zunehmen.<\/p>","protected":false},"excerpt":{"rendered":"<p>This post originally appeared in my column on the site data driven journalism. In my last post I talked about how regression can be a useful tool to tease apart the different relationships between correlational variables. I also talked about how outliers can be problematic. One way of dealing with an outlier is simply to<\/p>\n<div class=\"read-more\"><a href=\"https:\/\/www.kolabtree.com\/blog\/de\/correct-outliers-regression-trumps-vote\/\" title=\"Mehr lesen\">Mehr lesen<\/a><\/div>","protected":false},"author":31,"featured_media":2400,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[247],"tags":[360,175,361,246,362],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v20.1 (Yoast SEO v20.1) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>How to Correct Outliers in Regression Models: An analysis of Trump&#039;s vote<\/title>\n<meta name=\"description\" content=\"Using Trump&#039;s vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.kolabtree.com\/blog\/de\/correct-outliers-regression-trumps-vote\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote\" \/>\n<meta property=\"og:description\" content=\"Using Trump&#039;s vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.kolabtree.com\/blog\/de\/correct-outliers-regression-trumps-vote\/\" \/>\n<meta property=\"og:site_name\" content=\"The Kolabtree Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/kolabtree\" \/>\n<meta property=\"article:published_time\" content=\"2017-08-10T17:28:14+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2017-08-14T10:11:42+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/donald-2147250_1280-1.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1280\" \/>\n\t<meta property=\"og:image:height\" content=\"853\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Paul Ricci\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@CSIwoDB\" \/>\n<meta name=\"twitter:site\" content=\"@kolabtree\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Paul Ricci\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"5\u00a0Minuten\" \/>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"How to Correct Outliers in Regression Models: An analysis of Trump's vote","description":"Using Trump's vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.kolabtree.com\/blog\/de\/correct-outliers-regression-trumps-vote\/","og_locale":"de_DE","og_type":"article","og_title":"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote","og_description":"Using Trump's vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models","og_url":"https:\/\/www.kolabtree.com\/blog\/de\/correct-outliers-regression-trumps-vote\/","og_site_name":"The Kolabtree Blog","article_publisher":"https:\/\/www.facebook.com\/kolabtree","article_published_time":"2017-08-10T17:28:14+00:00","article_modified_time":"2017-08-14T10:11:42+00:00","og_image":[{"width":1280,"height":853,"url":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/donald-2147250_1280-1.jpg","type":"image\/jpeg"}],"author":"Paul Ricci","twitter_card":"summary_large_image","twitter_creator":"@CSIwoDB","twitter_site":"@kolabtree","twitter_misc":{"Verfasst von":"Paul Ricci","Gesch\u00e4tzte Lesezeit":"5\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#article","isPartOf":{"@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/"},"author":{"name":"Paul Ricci","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/d3ae828656a4c84a3a1b7cdba371820f"},"headline":"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote","datePublished":"2017-08-10T17:28:14+00:00","dateModified":"2017-08-14T10:11:42+00:00","mainEntityOfPage":{"@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/"},"wordCount":1063,"commentCount":0,"publisher":{"@id":"https:\/\/www.kolabtree.com\/blog\/#organization"},"keywords":["analytics","Data Science","statistics","trump","US elections"],"articleSection":["Guest posts"],"inLanguage":"de","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/","url":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/","name":"How to Correct Outliers in Regression Models: An analysis of Trump's vote","isPartOf":{"@id":"https:\/\/www.kolabtree.com\/blog\/#website"},"datePublished":"2017-08-10T17:28:14+00:00","dateModified":"2017-08-14T10:11:42+00:00","description":"Using Trump's vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models","breadcrumb":{"@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.kolabtree.com\/blog\/"},{"@type":"ListItem","position":2,"name":"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote"}]},{"@type":"WebSite","@id":"https:\/\/www.kolabtree.com\/blog\/#website","url":"https:\/\/www.kolabtree.com\/blog\/","name":"The Kolabtree Blog","description":"Expert Views on Science, Innovation and Product Development","publisher":{"@id":"https:\/\/www.kolabtree.com\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.kolabtree.com\/blog\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/www.kolabtree.com\/blog\/#organization","name":"Kolabtree","url":"https:\/\/www.kolabtree.com\/blog\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/logo\/image\/","url":"","contentUrl":"","caption":"Kolabtree"},"image":{"@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/kolabtree","https:\/\/twitter.com\/kolabtree","https:\/\/instagram.com\/kolabtree","https:\/\/www.linkedin.com\/company\/kolabtree","https:\/\/en.m.wikipedia.org\/wiki\/Kolabtree"]},{"@type":"Person","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/d3ae828656a4c84a3a1b7cdba371820f","name":"Paul Ricci","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/image\/","url":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Race-4-the-Cure-006-96x96.jpg","contentUrl":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Race-4-the-Cure-006-96x96.jpg","caption":"Paul Ricci"},"description":"Paul Ricci is a statistician, neuropsychologist and data analyst based in the USA. He writes a regular column for the website Data Driven Journalism and has an MA in Research Methodology and Neuroscience, and an MS in Biostatistics.","sameAs":["https:\/\/csiwodeadbodies.blogspot.com\/","https:\/\/twitter.com\/@CSIwoDB"],"url":"https:\/\/www.kolabtree.com\/blog\/de\/author\/paul-ricci\/"}]}},"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/posts\/2374"}],"collection":[{"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/users\/31"}],"replies":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/comments?post=2374"}],"version-history":[{"count":7,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/posts\/2374\/revisions"}],"predecessor-version":[{"id":2401,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/posts\/2374\/revisions\/2401"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/media\/2400"}],"wp:attachment":[{"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/media?parent=2374"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/categories?post=2374"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/de\/wp-json\/wp\/v2\/tags?post=2374"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}