Недавно увидел расходящуюся кругами запись про пользу вооружения населения. Автор пытался показать, что в странах с большим количеством оружия у гражданских лиц меньшее количество убийств. Сделано это было так: автор посчитал корреляцию Пирсона между логарифмами числа единиц огнестрельного оружия на 100 человек (ЛО) и количества убийств на 1000 человек (ЛУ). Корреляция оказалось равной -0.26, ЧТД. То есть понятно, что сама по себе корреляция ничего не значит, без об"ясняющего механизма связи. Но мне стало интересно, что же там происходит на самом деле.
Возвращаясь к расчетам , сразу настораживают две вещи: (1) отсутствующий уровень значимости найденной корреляции и (2) лихая фраза о том, что автор предполагает, что данные нормально распределены. Данные, на которые ссылается автор, опубликованы в пдф-формате, поэтому, чтобы себя не затруднять конвертацией, я взял аналогичные данные по вооружению населения и убийствам, а также по Human development index (HDI) на nationMaster и в Википедии:
HDI index
Number of guns per 100 residents by country
Intentional murders per 100,000 population
UK на Nation Master разделена на три части; данные по всей стране я взял из Википедии. В результате получились данные по 139 странам. Цвет точек показывает уровень развития страны по HDI. Красный цвет (3) соответствует наиболее развитым странам.

Тут уже присутствует очень маленькая, но статистически значимая корреляция (-0.173) между количеством оружия в стране и числом убийств, однако распределение далеко от нормального. Всю корреляцию держат выбросы (аутлаеры), несколько стран с номинально низким уровнем владения оружия и высоким числом убийств. Следуя методике автора, я применил к переменным логарифмическое преобразование. Получилось вот такое облако: 
"А не покушаетесь ли вы на свободу самовыражения?" спросит иной наивный читатель. "Что делать тем, кто сказать не умеет, но хочет?" Я думаю, что сказать надо все равно. Как умеешь. Несмотря на. Потому, что развитой плюрализм-постмодернизм. И еще потому, что, как указал великий борец с левым интеллектуализмом Томас Соувелл, знания интеллектуалов только кажущиеся. Помогут ли познания в социологии помочь открыть бар на углу Бродвея и 115-й? Настоящие, фактические познания могут быть только унеучей практика - то есть у тебя, дорогой читатель. Так смелее, друг, донеси плоды своих размышлений до благодарной публики. Только, пожалуйста, не надо подкреплять их статистикой. У статистики репутация и так неважная - малая ложь, большая, итд. Пожалей ее, бедную.
HDI index
Number of guns per 100 residents by country
Intentional murders per 100,000 population
UK на Nation Master разделена на три части; данные по всей стране я взял из Википедии. В результате получились данные по 139 странам. Цвет точек показывает уровень развития страны по HDI. Красный цвет (3) соответствует наиболее развитым странам.

Тут уже присутствует очень маленькая, но статистически значимая корреляция (-0.173) между количеством оружия в стране и числом убийств, однако распределение далеко от нормального. Всю корреляцию держат выбросы (аутлаеры), несколько стран с номинально низким уровнем владения оружия и высоким числом убийств. Следуя методике автора, я применил к переменным логарифмическое преобразование. Получилось вот такое облако:

Корреляция между переменными -.17 статистически значима, но гипотеза о нормальности распределения logGuns и logMurderRate отвергается; "предположение" авторов неверно. Данные явно надо разбивать на несколько кластеров и исследовать их по отдельности: высокоразвитые страны сильно отличаются от низкоразвитых. Рискну предположить, что в то время, как цивилизованный мир убивает огнестрельным оружием, варвары для тех же целей пользуются мачете. Попробуем такий подход: выделим группу наиболее развитых стран по HDI. Получился результат прямо противоположный заявленному в исходной публикации: чем в стране больше оружия, тем больше убийств.

Возможно, наша ошибка в том, что при выборе группы стран, к которым принадлежит США, мы использовали hdi? Попробуем отобрать высокоразвитые страны, основываясь на классификации IMF. Положительная кореляция здесь еще сильнее!

Конечно, все эти корреляции не являются статистически значимыми. Мусор это. Что и неудивительно, сводить такое комплексное явление, как уровень насилия в обществе, к единственному показателю может человек либо нечестный, либо наивный. Как иллюстрация последнего, ЖЖ-юзер, у которой я и подцепил ссылку на "исследование", недавно, рассказывая, как Обама обманывает американский народ, в подтверждение ссылалась на пародию веб-сайта Белого Дома.
Необходимое послесловие

Возможно, наша ошибка в том, что при выборе группы стран, к которым принадлежит США, мы использовали hdi? Попробуем отобрать высокоразвитые страны, основываясь на классификации IMF. Положительная кореляция здесь еще сильнее!

Конечно, все эти корреляции не являются статистически значимыми. Мусор это. Что и неудивительно, сводить такое комплексное явление, как уровень насилия в обществе, к единственному показателю может человек либо нечестный, либо наивный. Как иллюстрация последнего, ЖЖ-юзер, у которой я и подцепил ссылку на "исследование", недавно, рассказывая, как Обама обманывает американский народ, в подтверждение ссылалась на пародию веб-сайта Белого Дома.
Необходимое послесловие
В конфликте морали и веры последняя легко побеждает
Неизвестно откуда подобранная цитата
А может, здесь и нет никакой морали, - заметила Алиса. - Как это нет! - возразила Герцогиня. - Во всем есть своя мораль, нужно только уметь ее найти!
Неизвестно откуда подобранная цитата
А может, здесь и нет никакой морали, - заметила Алиса. - Как это нет! - возразила Герцогиня. - Во всем есть своя мораль, нужно только уметь ее найти!
"А не покушаетесь ли вы на свободу самовыражения?" спросит иной наивный читатель. "Что делать тем, кто сказать не умеет, но хочет?" Я думаю, что сказать надо все равно. Как умеешь. Несмотря на. Потому, что развитой плюрализм-постмодернизм. И еще потому, что, как указал великий борец с левым интеллектуализмом Томас Соувелл, знания интеллектуалов только кажущиеся. Помогут ли познания в социологии помочь открыть бар на углу Бродвея и 115-й? Настоящие, фактические познания могут быть только у
no subject
Date: 2013-02-27 04:13 pm (UTC)no subject
Date: 2013-02-27 04:25 pm (UTC)no subject
Date: 2013-02-27 04:30 pm (UTC)no subject
Date: 2013-02-28 01:57 am (UTC)