Статистика – точна дисципліна? Математика не може брехати? Як би не так! Точніше, до самої статистики претензій немає, вона досить точна. Однак коли вона потрапляє в руки людей, починають відбуватися дивовижні речі.
Мабуть, немає на світі точної дисципліни, яка витримала б випробування людською психологією. Статистика – не виняток. На етапі підрахунків і цифр все зазвичай йде непогано, але на етапі втілення цифр у слова починається справжня міфотворчість. Зрозуміло, зазвичай всілякі помилки і маніпуляції в статистиці засновані на нерозумінні правил статистичних підрахунків. Однак статистику вивчають небагато, а новини читають всі, тому маніпулятивна статистика регулярно знаходить вдячну публіку.
Отже, що ж можна зробити зі статистикою, щоб вона говорила не те, що є, а те, що вам потрібно?
1. Маніпуляції з викидами. Викиди в статистиці – це значення, які сильно відрізняються від іншого набору даних, або просто крайні значення чогось. Наприклад, при підрахунку середнього віку населення в країні вік новонароджених і столітніх довгожителів якраз будуть такими викидами. Це дуже зручна річ для того, щоб зробити статистику більш «спокійною» – наприклад, при підрахунку середньої зарплати можна продемонструвати дуже приємну суму, при цьому успішно ігноруючи як надбагатих, так і людей за межею бідності.
А можна навпаки надати шокуючі і неймовірні дані. Найвідоміший приклад – середня тривалість життя в Середні віки. Різні вчені часто наводять цифри від 30 до 35 років – у всіх по-різному, головне, що цифри виходять дуже маленькими і створюють враження, ніби в Середні віки до старості взагалі ніхто не доживав. Детальна статистика дуже здивувала б, наприклад, сімдесятирічного Еразма Роттердамського, або знаменитого вченого Роджера Бекона, який в XIII столітті примудрився прожити 80 років. Вони, зрозуміло, входять до числа тих самих статистичних викидів, однак правда в тому, що до їхнього віку доживало чимало людей. А шокуюче середнє значення виходить через високу дитячу смертність. Логічно, що між новонародженим і Роджером Беконом приблизно 35-40 років і вийде.
Мармуровий Роджер Бекон з Оксфорда не одобрює маніпулятивну статистику
2. Непідтверджені факти. Щоб схилити статистику на свою користь, вам потрібно більше думок, припущень, чуток – чого завгодно, крім фактів. «80% користувачів кажуть, що останнє оновлення зробило їх роботу з гаджетом кращою та ефективнішою!». Зрозуміло, хтось сказав це з ввічливості, хтось просто відповів перше, що спало на думку, а для когось «краще» означає «нічого не зламалося – вже добре». Але кінцевим споживачам статистики навряд чи спаде на думку звертати увагу на слово «кажуть» і думати про те, що «кажуть» – не означає «так воно і є» або «так вони і думають насправді». Відкриємо невеликий секрет: на людей магічний ефект справляють цифри. Вкажіть цифри переконливіше, і люди перестануть звертати увагу на слова.
3. Нерепрезентативна вибірка. Іншими словами – статистика збирається в невідповідному середовищі. У Станіслава Єжи Леца є дуже промовистий афоризм: «Карась любить сметану – думка кухаря». Статистика показує, що 100% карасів вважають сметану відповідним середовищем існування; про те, що статистика збиралася серед кухарів, можна і не згадувати.
Одного разу поважний журнал Forbes опублікував ось таку діаграму, яка мала ілюструвати процентне співвідношення по регіонах людей, які не можуть жити без інтернету. З самою діаграмою все гаразд (про погані графіки буде далі), і навіть з цифрами все добре. Що ж не так? Як ви думаєте?
Друга версія тієї ж діаграми з підказками.
...так, все вірно. Статистика щодо людей, які не можуть жити без інтернету, збиралася онлайн! Не дивно, що результат вийшов... трохи упередженим.
Також вибірка може бути дуже маленькою. Якщо статистичні дані вас чомусь не радують, просто зменшіть вибірку – тоді зменшаться і ризики отримати невідповідні дані. Наприклад, вибірку думок про вашу особу можна обмежити мамою або собакою, або взагалі самим собою – і тоді за статистикою 100% опитаних вважатимуть вас найрозумнішим, найкрасивішим і найчудовішим.
4. Графіки. А навіщо взагалі заглиблюватися в математику? Маніпулювати статистикою можна набагато простіше – намалювавши правильний графік! Люди схильні вірити своїм очам, тому намалюйте велику яскраву діаграму – і вся увага буде на ній, а на нудні букви і цифри ніхто навіть не погляне.
І знову дякуємо порталу Quora і окремо – користувачеві Rakesh Jilla, який надіслав ось таку картинку як приклад дуже поганого (причому навмисно поганого) використання графіків. Цей графік 2012 року показує, наскільки збільшиться податкова ставка в 2013 році, якщо новий президент США скасує податкові пільги. Виглядає моторошно, правда?
А тепер подивіться на цифри над обома стовпцями. Вам не здається, що щось пішло не так?..
Rakesh Jilla проілюстрував, як би виглядав цей графік, якби його малювали люди, що знайомі з координатною площиною (і не займаються політичними маніпуляціями):
Як бачите, тут ситуація виглядає набагато менш драматично.
Це були корисні поради щодо маніпулювання статистикою, якими, ми сподіваємося, ви ніколи не скористаєтеся. А якщо ними скористається хтось інший – ви будете знати, як саме вас намагаються обдурити. Не втрачайте голову від яскравих картинок і красивих цифр, завжди пам'ятайте, що сови і статистика – не те, чим здаються, і у любителів математичних маніпуляцій буде над вами набагато менше влади.
Женя Орінго
tatyanamx
Вс, 16/11/2025 - 06:25