{"id":2374,"date":"2017-08-10T17:28:14","date_gmt":"2017-08-10T17:28:14","guid":{"rendered":"https:\/\/www.kolabtree.com\/blog\/?p=2374"},"modified":"2017-08-14T10:11:42","modified_gmt":"2017-08-14T10:11:42","slug":"correct-outliers-regression-trumps-vote","status":"publish","type":"post","link":"https:\/\/www.kolabtree.com\/blog\/fr\/correct-outliers-regression-trumps-vote\/","title":{"rendered":"Comment corriger les valeurs aberrantes dans les mod\u00e8les de r\u00e9gression : Un exemple avec la race, l'\u00e9ducation et les non-assur\u00e9s sur le vote de Trump"},"content":{"rendered":"<p><em>Ce billet a \u00e9t\u00e9 initialement publi\u00e9 dans ma chronique sur le site <a href=\"http:\/\/datadrivenjournalism.net\/news_and_analysis\/correcting_outliers_the_effect_of_race_education_and_the_uninsured_on_trump\">le journalisme bas\u00e9 sur les donn\u00e9es<\/a>.<\/em><\/p>\n<p>Dans mon <a href=\"http:\/\/datadrivenjournalism.net\/news_and_analysis\/regression_for_journalists\">Dans mon dernier billet, j'ai parl\u00e9 de la fa\u00e7on dont la r\u00e9gression<\/a> peut \u00eatre un outil utile pour d\u00e9m\u00ealer les diff\u00e9rentes relations entre les variables corr\u00e9lationnelles. J'ai \u00e9galement parl\u00e9 de la fa\u00e7on dont les valeurs aberrantes peuvent \u00eatre probl\u00e9matiques. Une fa\u00e7on de traiter une valeur aberrante est de la supprimer purement et simplement de l'analyse. Ce faisant, on diminue la puissance statistique (la probabilit\u00e9 de trouver un pr\u00e9dicteur significatif lorsqu'il existe) et on supprime du mod\u00e8le des informations potentiellement pr\u00e9cieuses. Cette d\u00e9marche peut s'av\u00e9rer plus fructueuse, car elle permet d'obtenir des informations pr\u00e9cieuses. J'ai fait cela dans mon post sur la fa\u00e7on dont Washington, DC diff\u00e8re des autres \u00c9tats et cela m'a donn\u00e9 une id\u00e9e pour une autre covariable qui devrait \u00eatre prise en compte en plus de celles d\u00e9j\u00e0 prises en compte : concentration de groupes haineux, % non assur\u00e9, % avec un dipl\u00f4me de licence ou plus, et % dans la pauvret\u00e9.<\/p>\n<p>Dans mon <a href=\"http:\/\/datadrivenjournalism.net\/news_and_analysis\/how_is_washington_dc_an_outlier_lets_count_the_ways\">post sur les caract\u00e9ristiques de Washington, DC en tant qu'aberration<\/a> J'ai constat\u00e9 qu'il est le moins blanc de tous les \u00c9tats consid\u00e9r\u00e9s. Seulement 40,2% de la population du district s'identifie comme blanche ou caucasienne. Seul Hawaii avait un plus petit % blanc avec 25,4%. Dans le sondage de sortie des urnes pour l'\u00e9lection de l'ann\u00e9e derni\u00e8re, 60% des femmes blanches sans dipl\u00f4me universitaire ont vot\u00e9 pour Trump, contre 71% des hommes blancs sans dipl\u00f4me universitaire. 74% des non-Blancs ont vot\u00e9 pour Clinton.<\/p>\n<p>L'ajout de cette variable au mod\u00e8le a am\u00e9lior\u00e9 de mani\u00e8re significative la pr\u00e9cision du mod\u00e8le avec DC inclus, 78,5% de la variabilit\u00e9 du vote de Trump \u00e9tant pris en compte. Les variables relatives aux groupes haineux et \u00e0 la pauvret\u00e9 % n'\u00e9taient pas significatives et ont \u00e9t\u00e9 exclues car leur pr\u00e9sence dans le mod\u00e8le diminue la puissance statistique. Les variables % baccalaur\u00e9at, % Blanc et % non assur\u00e9 \u00e9taient significatives (ce qui signifie que la valeur p est inf\u00e9rieure \u00e0 0,05 - je l'expliquerai dans un prochain article), les autres ne l'\u00e9taient pas. La sortie de la plupart des progiciels statistiques :<\/p>\n<table class=\"m_-6998272163864735663ydp443f502dMsoTableGrid m_-6998272163864735663ydpfe588df9yahoo-compose-table-card\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>78.5% de la variabilit\u00e9 <\/i><\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>comptabilis\u00e9<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Coefficients<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Erreur standard<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>t Stat<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Valeur P<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Plus bas <\/i><\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>95%<\/i><\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>Upper <\/i><\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"center\"><i>95%<\/i><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">Intercepter<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">51.55<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">8.92<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">5.78<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">5.75E-07<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">33.61<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">69.48<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">% bachelor's degree<\/p>\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">ou plus<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-1.11<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.15<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-7.55<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">1.2E-09<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-1.41<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">-0.82<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">% Blanc<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.31<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.06<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">4.95<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">1.01E-05<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.18<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.43<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\">% non assur\u00e9<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.74<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.26<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">2.86<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.006319<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">0.22<\/p>\n<\/td>\n<td valign=\"top\" nowrap=\"nowrap\">\n<p class=\"m_-6998272163864735663ydp443f502dMsoNormal\" align=\"right\">1.26<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>La colonne intitul\u00e9e \"coefficients\" donne les valeurs estim\u00e9es de l'\u00e9quation de r\u00e9gression que j'ai expliqu\u00e9e dans les messages pr\u00e9c\u00e9dents. L'\u00e9quation actuelle est la suivante :<\/p>\n<p>Trump % des voix = 51,55 - 1,11*(% bachelor) + 0,31*(% Blanc) + 0,74*(% Non assur\u00e9)<\/p>\n<p>Cela signifie que lorsque toutes les covariables sont \u00e9gales \u00e0 z\u00e9ro, on pr\u00e9dit que Trump aura 51,55% des voix. Pour chaque augmentation de 1% du nombre de bacheliers (%), on estime \u00e0 1,11% la diminution du nombre de votes pour Trump. Pour chaque augmentation de 1% de la % de la population blanche dans l'\u00c9tat, il y a une augmentation estim\u00e9e de 0,31% et pour chaque augmentation de 1% de la % des personnes non assur\u00e9es dans l'\u00c9tat.<\/p>\n<p>La colonne intitul\u00e9e \"erreur standard\" est une estimation de l'incertitude des coefficients. La colonne intitul\u00e9e \"t stat\" est la statistique de test permettant de d\u00e9terminer si les coefficients sont significativement diff\u00e9rents de z\u00e9ro. La \"valeur p\" est la probabilit\u00e9 estim\u00e9e d'observer ce coefficient estim\u00e9 lorsque le vrai coefficient est \u00e9gal \u00e0 z\u00e9ro. Par convention, lorsque la valeur p est inf\u00e9rieure \u00e0 0,05, nous concluons que le vrai coefficient est diff\u00e9rent de z\u00e9ro. Les deux derni\u00e8res colonnes indiquent les limites sup\u00e9rieure et inf\u00e9rieure d'un intervalle de confiance de 95% pour un coefficient. L'intervalle de confiance indique que, 95% du temps o\u00f9 les estimations sont faites, le vrai coefficient se situera entre les limites sup\u00e9rieure et inf\u00e9rieure. Dans ce cas, si les limites sup\u00e9rieures et inf\u00e9rieures ne sont pas \u00e0 cheval sur le chiffre z\u00e9ro, cela \u00e9quivaut \u00e0 dire que le coefficient est significativement diff\u00e9rent de z\u00e9ro.<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-2384 size-large\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-1024x744.png\" alt=\"\" width=\"702\" height=\"510\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-1024x744.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-300x218.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-768x558.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-1080x785.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race.png 1423w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-State-Race-300x218@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p>Le nuage de points ci-dessus montre les valeurs r\u00e9elles (dans le losange bleu) et pr\u00e9dites (dans les carr\u00e9s rouges) pour % blanc et % Trump pour le mod\u00e8le ajustant pour % bacheliers et % non assur\u00e9s. Les valeurs r\u00e9elles et pr\u00e9dites pour le District de Columbia (DC) et Hawaii sont tr\u00e8s proches les unes des autres, ce qui sugg\u00e8re une bonne ad\u00e9quation. L'\u00c9tat du Vermont est mal ajust\u00e9 : le vote r\u00e9el pour Trump est inf\u00e9rieur de 10% au vote pr\u00e9dit, comme on peut le voir directement au-dessus du diamant bleu pour le Vermont.<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-2385 size-large\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-1024x744.png\" alt=\"\" width=\"702\" height=\"510\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-1024x744.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-300x218.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-768x558.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-1080x785.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins.png 1423w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-educ-race-unins-300x218@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p>Le diagramme de dispersion pour % baccalaur\u00e9at ou plus sugg\u00e8re que l'ajustement n'est pas aussi bon que pour celui pour % blanc comme pr\u00e9dicteur. Cela se refl\u00e8te dans l'erreur standard plus grande pour ce pr\u00e9dicteur (0,15) que pour % blanche (0,06). La pr\u00e9diction pour DC n'est pas aussi bonne pour ce pr\u00e9dicteur, car elle est la plus \u00e9lev\u00e9e. La tendance est toujours significative dans la direction n\u00e9gative.<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"alignnone size-large wp-image-2386\" src=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-1024x744.png\" alt=\"\" width=\"702\" height=\"510\" srcset=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-1024x744.png 1024w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-300x218.png 300w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-768x558.png 768w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-1080x785.png 1080w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race.png 1423w, https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Trump-unins-educ-race-300x218@2x.png 600w\" sizes=\"(max-width: 702px) 100vw, 702px\" \/><\/p>\n<p>Le nuage de points pour % non assur\u00e9 comme pr\u00e9dicteur montre encore moins d'ad\u00e9quation pour % des votes de Trump. Le DC et l'Alaska sont des points mal ajust\u00e9s pour ce pr\u00e9dicteur parmi de nombreux autres \u00c9tats. L'erreur standard pour ce pr\u00e9dicteur montre un ajustement encore plus faible (0,26) pour les autres pr\u00e9dicteurs, bien qu'il soit encore statistiquement significatif.<\/p>\n<p>La r\u00e9gression multiple est un outil potentiellement puissant pour d\u00e9m\u00ealer les relations entre les variables pr\u00e9dictives d'un r\u00e9sultat sp\u00e9cifique lorsqu'elle est men\u00e9e correctement. L'ajout de covariables appropri\u00e9es, telles que la race, peut contribuer \u00e0 att\u00e9nuer les effets d'une valeur aberrante telle que Washington, DC. Il est toujours pr\u00e9f\u00e9rable d'inclure toutes les donn\u00e9es afin d'en donner une image aussi compl\u00e8te que possible.<\/p>\n<p>Nous voyons maintenant que plus le % de la population d'un \u00e9tat ayant un dipl\u00f4me de baccalaur\u00e9at ou plus augmente, plus le % du vote pour Trump diminue. Dans le m\u00eame temps, lorsque les pourcentages de blancs et de personnes non assur\u00e9es dans un \u00c9tat, augmentent, le % du vote pour Trump augmente. En pr\u00e9sence de ces variables, la concentration de groupes haineux et le % de l'\u00c9tat en mati\u00e8re de pauvret\u00e9 ne sont plus des pr\u00e9dicteurs significatifs du vote pour Trump.<\/p>\n<p>Alors que Trump et le congr\u00e8s contr\u00f4l\u00e9 par les r\u00e9publicains se pr\u00e9parent \u00e0 abroger la loi sur les soins abordables (ACA ou comme le dit le GOP Obamacare), le Congressional Budget Office estime que 23 millions d'Am\u00e9ricains perdront leur assurance maladie dans la version de la Chambre des repr\u00e9sentants et une estimation de 22 millions dans la version du S\u00e9nat. Dans ce mod\u00e8le, le taux de non-assur\u00e9s dans chaque \u00c9tat est positivement corr\u00e9l\u00e9 avec le vote de Trump. Trump croit-il que l'augmentation du taux de non-assur\u00e9s augmentera sa part du vote en 2020 ?<\/p>\n<p>La pauvret\u00e9 n'a pas \u00e9t\u00e9 associ\u00e9e au vote de Trump en 2016. La diminution des estimations du nombre de non-assur\u00e9s depuis l'entr\u00e9e en vigueur de l'ACA en 2014 est principalement due \u00e0 l'expansion de Medicaid pour les personnes les plus pauvres et aux subventions qui permettent aux personnes \u00e0 faible revenu d'acheter une assurance maladie. L'augmentation du nombre de non-assur\u00e9s pourrait ne pas diminuer le vote de Trump, mais il est peu probable qu'elle l'augmente.<\/p>","protected":false},"excerpt":{"rendered":"<p>Ce billet a \u00e9t\u00e9 publi\u00e9 \u00e0 l'origine dans ma rubrique sur le site data driven journalism. Dans mon dernier article, j'ai expliqu\u00e9 comment la r\u00e9gression peut \u00eatre un outil utile pour d\u00e9m\u00ealer les diff\u00e9rentes relations entre les variables corr\u00e9lationnelles. J'ai \u00e9galement expliqu\u00e9 comment les valeurs aberrantes peuvent \u00eatre probl\u00e9matiques. Une fa\u00e7on de traiter une valeur aberrante consiste simplement \u00e0<\/p>\n<div class=\"read-more\"><a href=\"https:\/\/www.kolabtree.com\/blog\/fr\/correct-outliers-regression-trumps-vote\/\" title=\"Lire la suite\">Lire la suite<\/a><\/div>","protected":false},"author":31,"featured_media":2400,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[247],"tags":[360,175,361,246,362],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v20.1 (Yoast SEO v20.1) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>How to Correct Outliers in Regression Models: An analysis of Trump&#039;s vote<\/title>\n<meta name=\"description\" content=\"Using Trump&#039;s vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.kolabtree.com\/blog\/fr\/correct-outliers-regression-trumps-vote\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote\" \/>\n<meta property=\"og:description\" content=\"Using Trump&#039;s vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.kolabtree.com\/blog\/fr\/correct-outliers-regression-trumps-vote\/\" \/>\n<meta property=\"og:site_name\" content=\"The Kolabtree Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/kolabtree\" \/>\n<meta property=\"article:published_time\" content=\"2017-08-10T17:28:14+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2017-08-14T10:11:42+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/donald-2147250_1280-1.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1280\" \/>\n\t<meta property=\"og:image:height\" content=\"853\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Paul Ricci\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@CSIwoDB\" \/>\n<meta name=\"twitter:site\" content=\"@kolabtree\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"Paul Ricci\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutes\" \/>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"How to Correct Outliers in Regression Models: An analysis of Trump's vote","description":"Using Trump's vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.kolabtree.com\/blog\/fr\/correct-outliers-regression-trumps-vote\/","og_locale":"fr_FR","og_type":"article","og_title":"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote","og_description":"Using Trump's vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models","og_url":"https:\/\/www.kolabtree.com\/blog\/fr\/correct-outliers-regression-trumps-vote\/","og_site_name":"The Kolabtree Blog","article_publisher":"https:\/\/www.facebook.com\/kolabtree","article_published_time":"2017-08-10T17:28:14+00:00","article_modified_time":"2017-08-14T10:11:42+00:00","og_image":[{"width":1280,"height":853,"url":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/donald-2147250_1280-1.jpg","type":"image\/jpeg"}],"author":"Paul Ricci","twitter_card":"summary_large_image","twitter_creator":"@CSIwoDB","twitter_site":"@kolabtree","twitter_misc":{"\u00c9crit par":"Paul Ricci","Dur\u00e9e de lecture estim\u00e9e":"5 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#article","isPartOf":{"@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/"},"author":{"name":"Paul Ricci","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/d3ae828656a4c84a3a1b7cdba371820f"},"headline":"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote","datePublished":"2017-08-10T17:28:14+00:00","dateModified":"2017-08-14T10:11:42+00:00","mainEntityOfPage":{"@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/"},"wordCount":1063,"commentCount":0,"publisher":{"@id":"https:\/\/www.kolabtree.com\/blog\/#organization"},"keywords":["analytics","Data Science","statistics","trump","US elections"],"articleSection":["Guest posts"],"inLanguage":"fr-FR","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/","url":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/","name":"How to Correct Outliers in Regression Models: An analysis of Trump's vote","isPartOf":{"@id":"https:\/\/www.kolabtree.com\/blog\/#website"},"datePublished":"2017-08-10T17:28:14+00:00","dateModified":"2017-08-14T10:11:42+00:00","description":"Using Trump's vote as an example, Paul Ricci writes about how introducing the right covariate can correct for outliers in regression models","breadcrumb":{"@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.kolabtree.com\/blog\/pt\/correct-outliers-regression-trumps-vote\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.kolabtree.com\/blog\/"},{"@type":"ListItem","position":2,"name":"How to Correct Outliers in Regression Models: An example with race, education, and the uninsured on Trump\u2019s vote"}]},{"@type":"WebSite","@id":"https:\/\/www.kolabtree.com\/blog\/#website","url":"https:\/\/www.kolabtree.com\/blog\/","name":"The Kolabtree Blog","description":"Expert Views on Science, Innovation and Product Development","publisher":{"@id":"https:\/\/www.kolabtree.com\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.kolabtree.com\/blog\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/www.kolabtree.com\/blog\/#organization","name":"Kolabtree","url":"https:\/\/www.kolabtree.com\/blog\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/logo\/image\/","url":"","contentUrl":"","caption":"Kolabtree"},"image":{"@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/kolabtree","https:\/\/twitter.com\/kolabtree","https:\/\/instagram.com\/kolabtree","https:\/\/www.linkedin.com\/company\/kolabtree","https:\/\/en.m.wikipedia.org\/wiki\/Kolabtree"]},{"@type":"Person","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/d3ae828656a4c84a3a1b7cdba371820f","name":"Paul Ricci","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.kolabtree.com\/blog\/#\/schema\/person\/image\/","url":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Race-4-the-Cure-006-96x96.jpg","contentUrl":"https:\/\/www.kolabtree.com\/blog\/wp-content\/uploads\/2017\/08\/Race-4-the-Cure-006-96x96.jpg","caption":"Paul Ricci"},"description":"Paul Ricci is a statistician, neuropsychologist and data analyst based in the USA. He writes a regular column for the website Data Driven Journalism and has an MA in Research Methodology and Neuroscience, and an MS in Biostatistics.","sameAs":["https:\/\/csiwodeadbodies.blogspot.com\/","https:\/\/twitter.com\/@CSIwoDB"],"url":"https:\/\/www.kolabtree.com\/blog\/fr\/author\/paul-ricci\/"}]}},"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/2374"}],"collection":[{"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/users\/31"}],"replies":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/comments?post=2374"}],"version-history":[{"count":7,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/2374\/revisions"}],"predecessor-version":[{"id":2401,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/posts\/2374\/revisions\/2401"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/media\/2400"}],"wp:attachment":[{"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/media?parent=2374"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/categories?post=2374"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.kolabtree.com\/blog\/fr\/wp-json\/wp\/v2\/tags?post=2374"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}