Одна из наиболее ярких иллюстраций парадокса Симпсона касается закона США о гражданских правах 1964 года – исторического документа, направленного на решение проблемы дискриминации. В частности, этот парадокс возникает в ходе тщательного анализа данных о результатах голосования республиканцев и демократов по поводу принятия закона в палате представителей США.
Демократы северных штатов США отдали за закон 94 процента голосов, тогда как республиканцы – всего 85 процентов. Следовательно, в северных штатах США за принятие закона проголосовало больше демократов, чем республиканцев.
В южных штатах за данный закон демократы отдали 7 процентов голосов, тогда как республиканцы – 0 процентов. То есть на юге США также проголосовало больше демократов, чем республиканцев.
Таким образом, напрашивается очевидный вывод: демократы продемонстрировали более активную поддержку Закона о гражданских правах, чем республиканцы. Однако если объединить данные по южным и северным штатам, получится, что за принятие закона проголосовали 80 процентов республиканцев и 61 процент демократов.
Другими словами, я утверждаю, что на севере и юге в отдельности демократы отдали больше голосов в поддержку закона, чем республиканцы, но в совокупности республиканцы опережают демократов! Как бы абсурдно это ни звучало, это бесспорный факт. В этом и состоит парадокс Симпсона.
Для того чтобы понять смысл данного парадокса, целесообразно проанализировать не проценты, а фактическое количество голосов. Демократы северных штатов отдали в поддержку закона 145 из 154 голосов (94 процента), тогда как республиканцы – 138 из 162 голосов (85 процентов). В южных штатов картина такая: демократы – 7 из 94 голосов (7 процентов), республиканцы – ноль из 10 голосов (0 процентов). Как уже было сказано, поддержка закона демократами на первый взгляд кажется более сильной, чем республиканцами, причем как на севере, так и на юге. Тем не менее в масштабах всей страны тенденция меняется на противоположную, поскольку за принятие закона проголосовали 152 из 248 демократов (61 процент) и 138 из 172 республиканцев (80 процентов).
Так как же нам объяснить этот пример парадокса Симпсона? Здесь есть четыре момента, которые проливают свет на загадку парадокса. Во-первых, сравнивая результаты голосования республиканцев и демократов, мы должны анализировать всю совокупность данных (в целом по стране). Это позволит прийти к заключению, что республиканцы поддержали Закон о гражданских правах более активно, чем демократы. Таким и должен быть окончательный вывод.
Во-вторых, хотя наша задача – проанализировать разницу между результатами голосования республиканцев и демократов, реально поражают различия между представителями северных и южных штатов независимо от того, к какой политической партии они принадлежат. В северных штатах США закон получил примерно 90-процентную поддержку, тогда как в южных она составила всего 7 процентов. Когда мы фокусируемся на одной переменной (например, демократы в сравнении с республиканцами), уделяя меньше внимания более важной переменной (например, север в сравнении с югом), то ее часто называют скрытой переменной.
В-третьих, во многих ситуациях проценты действительно имеет смысл использовать для сравнения, но в данном случае, начав с анализа одних только процентов, мы не приняли во внимание фактическое количество голосов, из-за чего не смогли оценить значимость определенных результатов. |