آمار و دروغ؛ چگونه اعداد می‌توانند واقعیت را به نفع سیاست و قدرت وارونه کنند؟ | بازیگرها

آمار و دروغ؛ چگونه اعداد می‌توانند واقعیت را به نفع سیاست و قدرت وارونه کنند؟ | بازیگرها

مارک تواین، نویسنده مشهور، زمانی به نقل از بنیامین دیزرائیلی گفت: «دروغ سه نوع است: دروغ، دروغِ شاخدار و آمار!» این جمله شاید در نگاه اول بی‌انصافی به علم ریاضیات به نظر برسد، اما در دنیای امروز که هر روز با بمباران اعداد و ارقام مواجه هستیم، واقعی‌تر از همیشه جلوه می‌کند. آمار در ذات خود زبانی برای درکِ الگوهای بزرگ و پیچیده است، اما همین زبان وقتی در دستانِ بازاریابانِ زیرک یا سیاستمدارانِ قدرت‌طلب قرار می‌گیرد، به ابزاری برای «مهندسیِ رضایت» تبدیل می‌شود. ما عادت کرده‌ایم که به اعداد اعتماد کنیم، چون تصور می‌کنیم اعداد بی‌طرف هستند؛ اما واقعیت این است که اعداد هرگز سخن نمی‌گویند، بلکه این «آدم‌ها» هستند که به جای آن‌ها حرف می‌زنند.

در این مقاله، ما به پشت صحنه گزارش‌های آماری می‌رویم تا ببینیم چگونه می‌توان با استفاده از مفاهیمِ صحیحِ ریاضی، نتایجِ کاملاً غلط و گمراه‌کننده گرفت. از تله‌های «میانگین» که ثروت ایلان ماسک را با فقرِ یک بی‌خانمان ترکیب می‌کند، تا نمودارهایی که با بریدنِ محورها، یک رشدِ ناچیز را شبیه به یک جهشِ عظیم نشان می‌دهند. ما با مثال‌های واقعی و مستند بررسی خواهیم کرد که چگونه سوگیری‌های انتخاب و دستکاری در داده‌ها، واقعیت را در برابر چشمان ما وارونه می‌کنند. هدف ما در اینجا آموزشِ آمار نیست، بلکه تجهیزِ شما به یک «رادارِ دروغ‌سنجِ ذهنی» است تا دیگر اجازه ندهید اعداد، چشم‌بندِ قضاوت‌های شما شوند.

۱- تله میانگین؛ وقتی بیل گیتس وارد یک کافه ارزان‌قیمت می‌شود

یکی از رایج‌ترین روش‌ها برای دروغ گفتن با آمار، استفاده نادرست از مفهوم «میانگین» (Average) است. در ریاضیات، ما سه نوع میانگین داریم (میانگین حسابی، میانه و مد)، اما گزارش‌های عمومی معمولاً فقط از «میانگین حسابی» استفاده می‌کنند تا واقعیت‌های تلخ را پنهان کنند. تصور کنید در یک کافه ۱۰ نفر نشسته‌اند که هر کدام سالانه ۵۰ میلیون تومان درآمد دارند. میانگین درآمد در این کافه ۵۰ میلیون است. ناگهان بیل گیتس با درآمد سالانه چند میلیارد دلاری وارد کافه می‌شود. حالا اگر میانگین بگیرید، درآمد متوسط افراد در آن کافه به چند صد میلیارد تومان می‌رسد! آیا وضعیت مالی آن ۱۰ نفر تغییری کرده است؟ خیر، اما آمار به شما می‌گوید که آن‌ها به طور متوسط «میلیاردر» هستند.


یک نکته کنجکاوی‌برانگیز:
در بسیاری از گزارش‌های دولتی، برای نشان دادن بهبود وضعیت رفاه، از «میانگین درآمد» استفاده می‌شود تا شکاف طبقاتی عظیم پشت اعداد بزرگ پنهان بماند. در حالی که «میانه درآمد» (Median) تصویر بسیار صادقانه‌تری از وضعیت اکثریت جامعه ارائه می‌دهد.

این دقیقاً همان اتفاقی است که در گزارش‌های اقتصادی رخ می‌دهد. وقتی گفته می‌شود «میانگین حقوق کارمندان افزایش یافته است»، ممکن است حقوق مدیران ارشد ۱۰۰ درصد رشد کرده باشد و حقوق کارگران ثابت مانده باشد. طبق پژوهش‌های نوین در حوزه اقتصاد رفتاری، استفاده از میانگین حسابی در جوامعی که توزیع ثروت ناپایدار دارند، بزرگترین دروغ ریاضی است که می‌توان به خوردِ مخاطب داد. برای درک واقعیت، همیشه باید بپرسید: «میانه» کجاست؟ یعنی دقیقاً چه عددی است که نیمی از مردم زیر آن و نیمی بالای آن هستند؟

۲- سوگیری انتخاب؛ نظرسنجی‌هایی که فقط از دوستان می‌پرسند

یک ضرب‌المثل آماری می‌گوید: «ورودیِ زباله، خروجیِ زباله تولید می‌کند.» اگر روش نمونه‌گیری (Sampling) شما غلط باشد، دقیق‌ترین محاسبات ریاضی هم دردی را دوا نمی‌کند. یکی از مشهورترین مثال‌های تاریخی، نظرسنجی مجله «لیترری دایجست» (Literary Digest) در سال ۱۹۳۶ است. آن‌ها با ارسال ۱۰ میلیون پرسشنامه، پیش‌بینی کردند که «آلف لندون» با اختلافی فاحش در انتخابات ریاست‌جمهوری آمریکا پیروز می‌شود. اما در واقعیت، «فرانکلین روزولت» پیروز شد. مشکل کجا بود؟ آن‌ها لیست اسامی را از روی دفترچه تلفن و لیست مالکان خودرو برداشته بودند.

در آن سال‌ها (دوران رکود بزرگ)، فقط افراد ثروتمند تلفن و خودرو داشتند. بنابراین مجله ناخواسته فقط از ثروتمندان نظرخواهی کرده بود و صدای طبقه متوسط و ضعیف را نشنیده بود. این پدیده «سوگیری انتخاب» (Selection Bias) نام دارد. امروزه هم در فضای مجازی زیاد می‌بینیم که مثلاً یک کانال تلگرامی نظرسنجی می‌گذارد: «آیا از وضعیت اینترنت راضی هستید؟» و نتیجه می‌گیرد ۸۰ درصد مردم راضی‌اند. غافل از اینکه کسانی که در آن کانال هستند یا اصلاً به اینترنت دسترسی دارند، نمونه‌ای واقعی از کل جامعه (شامل روستاییان و سالمندان) نیستند.

۳- خطای علیت؛ وقتی لک‌لک‌ها نوزاد می‌آورند!

یکی از فریبنده‌ترین دروغ‌های آماری، خلطِ مبحثِ «همبستگی» (Correlation) با «علیت» (Causation) است. ریاضیات می‌تواند ثابت کند که با افزایش فروش بستنی در تابستان، نرخ غرق‌شدگی در دریا هم بالا می‌رود. آیا این یعنی خوردن بستنی باعث غرق شدن می‌شود؟ قطعاً خیر. متغیر سومی به نام «گرما» وجود دارد که هم باعث افزایش خرید بستنی شده و هم باعث شده مردم بیشتری به دریا بروند. در آمار، این را همبستگیِ کاذب می‌نامیم.

مثال واقعی و خطرناک‌تر: زمانی تحقیقی نشان داد زنانی که از قرص‌های جایگزین هورمون استفاده می‌کنند، کمتر دچار بیماری‌های قلبی می‌شوند. پزشکان شروع به تجویز انبوه این قرص‌ها کردند. اما بعدها مشخص شد که این قرص‌ها علیتِ ماجرا نبودند؛ بلکه زنانی که از این قرص‌ها استفاده می‌کردند، عموماً از طبقه مرفه بودند که رژیم غذایی بهتر و ورزش منظم‌تری داشتند. آمار به اشتباه «سبک زندگی خوب» را به حساب «قرص هورمونی» نوشته بود. همیشه به یاد داشته باشید: صرف اینکه دو اتفاق با هم رخ می‌دهند، به این معنا نیست که یکی باعث دیگری شده است.

۴- فریبِ مقیاس؛ هنرِ کج و راست کردنِ نمودارها

اگر نمی‌توانید اعداد را تغییر دهید، نمودار را تغییر دهید! این قانون نانوشته بسیاری از گزارش‌های شرکتی است. ساده‌ترین راه، «بریدن محور عمودی» (Truncating the Y-Axis) است. تصور کنید نرخ بیکاری از ۵ درصد به ۵.۵ درصد رسیده است. در یک نمودار استاندارد که از عدد صفر شروع می‌شود، این تغییر مثل یک خط تقریباً صاف دیده می‌شود. اما اگر محور عمودی را به جای صفر، از عدد ۴.۹ شروع کنید، این نیم درصدِ ناچیز، شبیه به یک صعودِ عمودی و فاجعه‌بار به نظر می‌رسد که گویی بیکاری چندین برابر شده است!

تکنیک دیگر، استفاده از نمودارهای سه‌بعدی و پرزرق‌وبرق است. در یک نمودار دایره‌ای سه‌بعدی، بخشی که در قسمت جلو (نزدیک به بیننده) قرار دارد، حتی اگر درصد کمتری داشته باشد، از نظر بصری بزرگتر از بخش‌های عقبی به نظر می‌رسد. این‌ها خطاهای چشمی نیستند، بلکه مهندسیِ بصری برای دستکاری درکِ مخاطب هستند. طبق پژوهش‌های نوین در گرافیکِ اطلاعاتی، مغز ما ابتدا «شکل» را می‌بیند و سپس «عدد» را می‌خواند؛ طراحانِ فریبکار از همین شکافِ زمانی برای کاشتنِ بذرِ یک باورِ غلط در ذهن شما استفاده می‌کنند.

۵- پدیده چیدن گیلاس؛ وقتی فقط گل‌ها را نشان می‌دهند

اصطلاح «چیدن گیلاس» (Cherry Picking) به مهارتی اشاره دارد که در آن فرد از میان انبوهی از داده‌ها، تنها آن‌هایی را انتخاب می‌کند که ادعایش را ثابت می‌کنند و باقی را نادیده می‌گیرد. تصور کنید یک شرکت تولیدکننده کرم ضدچروک، ۱۰ تحقیق مختلف انجام می‌دهد. در ۸ تحقیق هیچ اثری مشاهده نمی‌شود، در یکی اثر منفی و در یکی (به صورت کاملاً تصادفی) اثر مثبت دیده می‌شود. شرکت فقط نتایج آن یک تحقیق مثبت را در بروشور تبلیغاتی خود چاپ می‌کند و با افتخار می‌گوید: «طبق مطالعات علمی، این کرم باعث جوانی می‌شود!»


خوب است بدانید:
در دنیای آکادمیک به این کار «کشو‌گذاری پرونده‌ها» (File Drawer Problem) می‌گویند؛ یعنی پژوهش‌هایی که نتایج دلخواه را نداشته‌اند در کشوی میز پنهان می‌شوند و هرگز رنگ انتشار را نمی‌بینند. این کار باعث می‌شود علم به سمتی که بودجه‌دهندگان می‌خواهند سنگینی کند.

این تکنیک در سیاست هم غوغا می‌کند. یک سیاستمدار ممکن است بگوید: «در زمان مدیریت من، صادرات کشور ۲۰ درصد رشد داشته است.» او راست می‌گوید، اما نمی‌گوید که این رشد فقط مربوط به یک ماه خاص بوده و در کل سال، روند صادرات نزولی بوده است. او با انتخاب یک «بازه زمانی خاص» (Time-frame Manipulation)، واقعیتِ بزرگ‌تر را ذبح کرده است. طبق پژوهش‌های نوین در تحلیل رسانه، این نوع دروغگویی بسیار هوشمندانه است چون شما عملاً «دروغ» نمی‌گویید، بلکه فقط «بخشی از راست» را می‌گویید که کارکرد دروغ را دارد.

۶- خطای دسترسی؛ وقتی ترس جای اعداد را می‌گیرد

مغز انسان برای درک آمار ساخته نشده است؛ مغز ما برای درک «داستان‌ها» تکامل یافته است. به همین دلیل است که ما از سقوط هواپیما به شدت می‌ترسیم اما هنگام رانندگی با سرعت غیرمجاز در اتوبان احساس امنیت می‌کنیم. آمارها می‌گویند احتمال مرگ در تصادف رانندگی هزاران برابر بیشتر از سقوط هواپیماست، اما چون سقوط هواپیما با تصاویر هولناک در اخبار تکرار می‌شود، در ذهن ما «در دسترس‌تر» (Availability Heuristic) است. آمارگران فریبکار با استفاده از این خطای شناختی، موضوعات کم‌اهمیت را بزرگ و مسائل بحرانی را کوچک جلوه می‌دهند.

مثلاً وقتی یک رسانه می‌خواهد بودجه پلیس را افزایش دهد، روی سه مورد قتل فجیع در یک هفته تمرکز می‌کند. اعداد ممکن است نشان دهند که نرخ جرم و جنایت نسبت به سال قبل ۱۰ درصد «کاهش» یافته است، اما تأثیر روانی آن سه داستان مصور، بسیار قوی‌تر از ستون‌های خشکِ نمودار است. در اینجا، آمارِ واقعی توسط «روایت‌های منتخب» سرکوب می‌شود. ما به جای اینکه بپرسیم «تکرار این اتفاق در هر ۱۰۰ هزار نفر چقدر است؟»، می‌پرسیم «چقدر این اتفاق وحشتناک بود؟» و این دقیقاً همان نقطه‌ای است که گمراه می‌شویم.

۷- بازی با اعداد بزرگ؛ جادوی میلیاردها در ذهن‌های خسته

اعداد بزرگ (مانند میلیارد و تریلیون) برای ذهن انسان غیرقابل تصور هستند. سیاستمداران از این ناتوانیِ ادراکی برای توجیه هزینه‌ها یا دستاوردها استفاده می‌کنند. مثلاً گفته می‌شود: «دولت یک میلیارد تومان برای نوسازی مدارس هزینه کرده است.» این عدد بزرگ به نظر می‌رسد و همه تشویق می‌کنند. اما اگر این عدد را بر تعداد مدارس کشور تقسیم کنیم، سهم هر مدرسه ممکن است فقط به اندازه خرید یک سطل زباله باشد! بدون «زمینه» (Context)، اعداد بزرگ فقط ابزاری برای مرعوب کردن مخاطب هستند.

برای اینکه بفهمید یک عدد واقعاً چقدر بزرگ است، همیشه آن را «سرانه» (Per Capita) کنید یا با یک بودجه مشابه مقایسه نمایید. در بازاریابی نیز از این روش استفاده می‌شود؛ مثلاً یک شرکت بیمه می‌گوید: «ما سالانه ۵۰۰ میلیارد تومان خسارت پرداخت می‌کنیم.» این عدد خیره‌کننده است، اما اگر متوجه شوید که آن‌ها ۱۰ هزار میلیارد تومان حق بیمه دریافت کرده‌اند، متوجه می‌شوید که در واقع نسبت پرداختی آن‌ها بسیار ناچیز است. اعداد بدون مقایسه، مانند کلماتی در یک زبان بیگانه هستند که فقط آهنگِ زیبایی دارند اما معنایی ندارند.

۸- فریبِ p-hacking؛ وقتی دانشمندان هم به سیم آخر می‌زنند

در دنیای علم، عددی به نام p-value وجود دارد که نشان می‌دهد آیا نتیجه یک تحقیق تصادفی بوده یا واقعی. اگر این عدد کمتر از ۰.۰۵ باشد، تحقیق «معتبر» شناخته می‌شود. حالا تصور کنید دانشمندی ماه‌ها وقت صرف کرده و نتیجه‌اش ۰.۰۶ شده است؛ یعنی تحقیقش بی‌ارزش است. در اینجا وسوسه‌ای به نام p-hacking به میان می‌آید. دانشمند شروع می‌کند به دستکاری‌های کوچک در داده‌ها: حذف چند نفر از نمونه، تغییر جزئی در متغیرها یا استفاده از روش‌های آماری متفاوت، تا بالاخره عدد را به زیر ۰.۰۵ بکشاند.

این کار مانند این است که آن‌قدر متهم را شکنجه کنید تا به جرمی که انجام نداده اعتراف کند! بسیاری از تحقیقاتی که در مجلات زرد درباره «خواص جادویی شکلات» یا «تاثیر ضریب هوشی بر رنگ چشم» می‌خوانید، حاصل همین شکنجه کردنِ داده‌ها هستند. طبق تحقیقات در حوزه متا-علم (Meta-science)، بخش بزرگی از مقالات علمی که در دهه‌های گذشته منتشر شده‌اند، به دلیل همین دستکاری‌های آماری، در آزمایش‌های مجدد شکست می‌خورند. این بحرانی است که به آن «بحران تکرارپذیری» (Replication Crisis) می‌گویند و نشان می‌دهد که حتی ریاضیات هم می‌تواند به خدمتِ شهرت‌طلبی درآید.

۹- پارادوکس سیمپسون؛ وقتی کل، واقعیتِ اجزا را نقض می‌کند

یکی از عجیب‌ترین و در عین حال ملموس‌ترین فریب‌های آماری، «پارادوکس سیمپسون» (Simpson’s Paradox) است. این پدیده زمانی رخ می‌دهد که یک روند در گروه‌های مختلف داده مشاهده می‌شود، اما وقتی این گروه‌ها با هم ترکیب می‌شوند، آن روند کاملاً ناپدید یا حتی معکوس می‌شود! مشهورترین مورد واقعی این پارادوکس در سال ۱۹۷۳ در دانشگاه برکلی رخ داد. آمارها نشان می‌داد که نرخ پذیرش مردان بسیار بیشتر از زنان است و دانشگاه به تبعیض جنسیتی متهم شد.


دانستنی نایاب:
پس از بررسی دقیق‌ترِ پرونده برکلی مشخص شد که زنان بیشتر برای رشته‌هایی اپلای کرده بودند که ظرفیت بسیار کمی داشتند (مثل ادبیات)، در حالی که مردان برای رشته‌هایی با ظرفیت بالا (مثل مهندسی) تقاضا داده بودند. در تک‌تکِ رشته‌ها، شانس زنان بیشتر بود، اما آمارِ کلی، دروغی بزرگ را روایت می‌کرد!

این پارادوکس به ما می‌آموزد که تجمیعِ داده‌ها (Aggregation) می‌تواند کشنده باشد. در دنیای سیاست، ممکن است نرخ بیکاری در کل کشور کاهش یابد، اما وقتی داده‌ها را به تفکیک استان‌ها یا گروه‌های سنی بررسی می‌کنید، متوجه شوید که بیکاری در میان جوانان تحصیل‌کرده به شدت رشد کرده است. آمارگران با پنهان کردنِ جزئیات در دلِ یک عددِ کلی، از پارادوکس سیمپسون برای آرام کردنِ فضای جامعه استفاده می‌کنند. همیشه یادتان باشد: حقیقت در جزئیات دفن شده است، نه در میانگین‌های کلی.

۱۰- کادربندی آماری؛ نیمه پر یا نیمه خالیِ حقیقت؟

نحوه بیان یک عدد (Framing)، قضاوت شما را کاملاً تغییر می‌دهد، بدون اینکه خودِ عدد عوض شود. تصور کنید بازیگرها به شما می‌گوید: «شانس زنده ماندن در این عمل جراحی ۹۰ درصد است.» در مقابل، پزشک دیگری می‌گوید: «از هر ۱۰۰ نفر که این عمل را انجام می‌دهند، ۱۰ نفر زیر عمل می‌میرند.» طبق پژوهش‌های نوین در روان‌شناسیِ تصمیم‌گیری، اکثر مردم پیشنهاد اول را می‌پذیرند، در حالی که هر دو دقیقاً یک چیز را می‌گویند. ذهن ما نسبت به کلماتِ منفی (مرگ) حساس‌تر از کلماتِ مثبت (بقا) است.

فروشندگان و بازاریابان از این تکنیک مدام استفاده می‌کنند. روی بسته گوشت می‌نویسند: «۷۵ درصد بدون چربی» چون بسیار جذاب‌تر از «۲۵ درصد چربی» به نظر می‌رسد. یا در آمارِ اشتغال، دولت‌ها ترجیح می‌دهند بگویند «نرخ اشتغال به ۹۲ درصد رسید» تا اینکه بگویند «۸ درصد مردم هنوز بیکارند». عدد همان است، اما کادربندیِ آن، احساسات شما را مدیریت می‌کند تا واکنشی را نشان دهید که آن‌ها می‌خواهند. برای فرار از این تله، همیشه سعی کنید عدد را به صورت معکوس در ذهن خود بازنویسی کنید.

۱۱- همبستگی‌های ساختگی؛ وقتی آمار به هذیان می‌افتد

آیا می‌دانستید که نرخ مصرف پنیر در آمریکا با تعداد افرادی که بر اثر پیچیدنِ ملافه دورِ سرشان در خواب مرده‌اند، همبستگی ۹۴ درصدی دارد؟ یا میزان هزینه‌کردِ آمریکا برای علم و تکنولوژی با نرخ خودکشی از طریق حلق‌آویز کردن به شدت هماهنگ است؟ این‌ها «همبستگی‌های ساختگی» (Spurious Correlations) هستند. از نظر ریاضی، اگر دو مجموعه داده را به اندازه کافی با هم مقایسه کنید، حتماً الگوهای مشابهی بین آن‌ها پیدا می‌کنید، حتی اگر هیچ ربط منطقی به هم نداشته باشند.

مشکل اینجاست که رسانه‌ها عاشقِ این همبستگی‌ها هستند. تیتر می‌زنند: «ارتباط عجیب بین خوردن کلم بروکلی و افزایش هوش!» در حالی که شاید هر دو عامل تحت تأثیر یک متغیر پنهان (مثل سطح تحصیلات والدین) باشند. این نوع آمارها به ویژه در مطالعات تغذیه و سبک زندگی بسیار زیاد دیده می‌شوند. هرگاه شنیدید که «الف» با «ب» در ارتباط است، بلافاصله نپرسید «چرا؟»، بلکه بپرسید «آیا این فقط یک تصادف ریاضی نیست؟»

۱۲- خطای دادستان؛ وقتی ریاضیات بی‌گناهان را مجرم می‌کند

در دنیای قضاوت و جرم‌شناسی، خطاهای آماری می‌توانند زندگی انسان‌ها را نابود کنند. مشهورترین نمونه، «خطای دادستان» (Prosecutor’s Fallacy) نام دارد. تصور کنید در صحنه جرمی، یک نمونه DNA پیدا شده که فقط در یک نفر از هر یک میلیون نفر وجود دارد. دادستان می‌گوید: «احتمال اینکه متهم بی‌گناه باشد، یک در میلیون است.» این جمله از نظر ریاضی کاملاً غلط است! او احتمالِ «یافتنِ این DNA در یک فردِ تصادفی» را با احتمالِ «بی‌گناهیِ متهم» اشتباه گرفته است.

در کشوری با ۸۰ میلیون نفر جمعیت، ۸۰ نفر وجود دارند که این DNA را دارند. بنابراین احتمالِ بی‌گناهی متهم در واقع بسیار بالاتر از آن چیزی است که دادستان ادعا می‌کند. این خطای فاحش باعث شد در سال‌های گذشته افرادی به ناحق سال‌ها در زندان بمانند، صرفاً چون هیئت منصفه تحت تأثیرِ ابهتِ اعدادِ بزرگ قرار گرفته بود. آمار در دادگاه باید با احتیاطِ وسواس‌گونه‌ای استفاده شود، چرا که یک اشتباهِ کوچک در درکِ «احتمالِ شرطی»، مرز بین آزادی و اعدام را جابجا می‌کند.

سوالات متداول (Smart FAQ)

۱. چگونه می‌توان در یک نگاه متوجه شد که یک نمودار در حال دروغ گفتن است؟

اولین و مهم‌ترین قدم، چک کردن محور عمودی (Y) است؛ اگر این محور از عدد صفر شروع نشده باشد، طراح به احتمال زیاد قصد دارد یک تغییر کوچک را بسیار بزرگ جلوه دهد. همچنین به فاصله بین اعداد روی محورها دقت کنید؛ فواصل نامنظم نشان‌دهنده تلاش برای دستکاری در شیبِ تغییرات و فریب دادن چشم بیننده است.

۲. اگر آمار اینقدر فریبنده است، آیا باید به کل آن را کنار گذاشت؟

خیر، آمار تنها ابزار ما برای درک واقعیت‌های کلان در جهان پیچیده امروز است و بدون آن علم مدرن وجود نداشت. راه حل، کنار گذاشتن آمار نیست، بلکه یادگیری «سواد آماری» برای تشخیص تفاوت میان داده‌های خام و تفسیرهای مغرضانه است. آمار مانند یک چاقوی جراحی است که هم می‌تواند جان انسان را نجات دهد و هم در دست یک فرد نابلد یا تبهکار، آسیب‌های جدی وارد کند.

۳. چرا نتایج نظرسنجی‌های انتخاباتی گاهی با واقعیت تفاوت فاحشی دارند؟

این تفاوت معمولاً ناشی از پدیده «پاسخگویان پنهان» یا سوگیری عدم پاسخگویی است که در آن گروهی از مردم واقعیت را به پرسشگر نمی‌گویند یا اصلاً در نظرسنجی شرکت نمی‌کنند. همچنین، اگر نمونه‌گیری فقط از طریق تلفن ثابت یا شبکه‌های اجتماعی انجام شود، بخش بزرگی از جامعه که الگوهای متفاوتی دارند نادیده گرفته می‌شوند. آمارِ دقیق نیازمند نمونه‌ای است که دقیقاً مانند یک «مشت نمونه خروار»، تمام تنوعِ جامعه را بازتاب دهد.

۴. اصطلاح «حاشیه خطا» در گزارش‌های آماری دقیقاً به چه معناست؟

حاشیه خطا (Margin of Error) بیانگر این است که به دلیل اینکه ما تمامِ جامعه را بررسی نکرده‌ایم و فقط از یک نمونه استفاده کرده‌ایم، چقدر احتمال نوسان در نتیجه وجود دارد. برای مثال اگر محبوبیت کاندیدایی ۴۵٪ با حاشیه خطای ۳٪ اعلام شود، یعنی رقم واقعی چیزی بین ۴۲ تا ۴۸ درصد است. نادیده گرفتن این عدد کوچک، باعث می‌شود تحلیلگران پیروزی‌های خیالی را پیش‌بینی کنند که در واقعیت وجود ندارند.

۵. آیا هوش مصنوعی می‌تواند به ما در تشخیص دروغ‌های آماری کمک کند؟

بله، ابزارهای جدید تحلیل داده می‌توانند الگوهای مشکوک مانند p-hacking یا ناهماهنگی‌های نموداری را با سرعت بسیار بالا شناسایی کنند. با این حال، هوش مصنوعی خود نیز بر پایه آمار استوار است و اگر داده‌های اولیه‌اش مسموم باشند، می‌تواند دروغ‌های آماریِ بسیار پیچیده‌تر و قانع‌کننده‌تری تولید کند. در نهایت، تفکر انتقادیِ انسان همچنان آخرین سنگر در برابر فریب‌های عددی باقی خواهد ماند.

۶. تفاوت «معناداری آماری» با «اهمیت واقعی» در چیست؟

یک نتیجه می‌تواند از نظر ریاضی معنادار باشد (یعنی تصادفی نباشد) اما در دنیای واقعی هیچ ارزشی نداشته باشد. مثلاً تحقیقی ممکن است ثابت کند دارویی جدید باعث کاهش ۱ میلی‌متری فشار خون می‌شود؛ این نتیجه از نظر آماری درست است اما برای پزشک و بیمار عملاً هیچ سودی ندارد. شرکت‌های دارویی اغلب با بزرگ‌نمایی همین تفاوت‌های ناچیزِ ریاضی، داروهای گران‌قیمت خود را به بازار تحمیل می‌کنند.

۷. چرا آمارِ مربوط به «تولید ناخالص داخلی» (GDP) برای مردم ملموس نیست؟

چون GDP یک میانگینِ کل است که توزیع ثروت را نشان نمی‌دهد و هزینه‌های مضر (مانند هزینه‌های جنگ یا پاکسازی آلودگی) را هم به عنوان «رشد» ثبت می‌کند. ممکن است اقتصاد یک کشور در حال رشد باشد، اما به دلیل تورم یا نابرابری شدید، سفره مردم کوچک‌تر شود. آمارِ اقتصادیِ تک‌بعدی، مانند نگاه کردن به داشبورد ماشینی است که فقط سرعت را نشان می‌دهد و از وضعیت بنزین و موتور خبری نمی‌دهد.

۸. چگونه «قانون اعداد کوچک» باعث ایجاد باورهای خرافی می‌شود؟

انسان‌ها تمایل دارند از چند اتفاق تصادفی و محدود، نتایج کلی و قطعی بگیرند که در آمار به آن «سوگیری تعمیم افراطی» می‌گویند. مثلاً اگر دو نفر از آشنایان شما با خوردن یک دمنوش خاص درمان شوند، شما نتیجه می‌گیرید آن دمنوش معجزه می‌کند، در حالی که آمارِ بزرگ‌مقیاس ممکن است اثربخشی آن را کاملاً رد کند. ذهن ما داستانِ آن دو نفر را بسیار معتبرتر از آمارِ ۱۰۰ هزار نفر می‌داند که این ریشه بسیاری از خطاهای پزشکی و مالی است.

۹. آیا اعداد می‌توانند در مورد «علت مرگ و میر» هم دروغ بگویند؟

بله، این موضوع به نحوه ثبت داده‌ها برمی‌گردد؛ مثلاً در دوران پاندمی، تفاوت بین مرگ «با» یک بیماری و مرگ «به دلیل» آن بیماری، آمارها را در کشورهای مختلف متفاوت کرد. همچنین در بسیاری از آمارها، بیماری‌های زمینه‌ای نادیده گرفته می‌شوند تا یک عامل خاص (مانند یک آلاینده یا یک ویروس) خطرناک‌تر یا بی‌خطرتر از آنچه هست جلوه داده شود. دقت آمار به همان اندازه که به ریاضیات وابسته است، به تعاریفِ دقیقِ حقوقی و پزشکی نیز نیاز دارد.

۱۰. نقش «تست‌های غربالگری» در دروغ‌های آماری چیست؟

یک تست با دقت ۹۹٪ ممکن است عالی به نظر برسد، اما اگر بیماری بسیار نادر باشد، اکثر نتایج مثبتِ آن در واقع «مثبت کاذب» خواهند بود. این تله ریاضی باعث می‌شود هزاران نفر به اشتباه تصور کنند بیمار هستند و تحت درمان‌های سنگین قرار بگیرند. برای درک درستِ نتیجه هر آزمایش، نباید فقط به «دقت تست» نگاه کرد، بلکه باید «شیوع بیماری» در جامعه را هم در محاسبات وارد کرد.

۱۱. چرا شرکت‌های بیمه از آمار برای تعیین حق بیمه استفاده می‌کنند؟

بیمه‌ها از «قانون اعداد بزرگ» استفاده می‌کنند تا احتمال وقوع حوادث را برای گروه‌های بزرگ پیش‌بینی کنند، اما این کار گاهی به «تبعیض آماری» منجر می‌شود. مثلاً اگر آمار نشان دهد جوانانِ یک منطقه خاص بیشتر تصادف می‌کنند، حق بیمه همه جوانان آن منطقه افزایش می‌یابد، حتی اگر فردی بسیار محتاط رانندگی کند. در اینجا آمارِ گروهی، عدالتِ فردی را فدای سودآوری و مدیریت ریسکِ شرکت می‌کند.

۱۲. «فریبِ بقا» در آمار مالی به چه معناست؟

این فریب زمانی رخ می‌دهد که ما فقط روی «برندگان» تمرکز می‌کنیم و شکست‌خورده‌ها را که از صحنه حذف شده‌اند نمی‌بینیم. برای مثال، میانگین سودِ صندوق‌های سرمایه‌گذاری همیشه بالا به نظر می‌رسد، چون صندوق‌هایی که ورشکست شده‌اند دیگر در آمار حضور ندارند. این باعث می‌شود سرمایه‌گذاران جدید فریب خورده و تصور کنند شانس موفقیت آن‌ها بسیار بیشتر از واقعیت است.

۱۳. چگونه آمار می‌تواند «نژادپرستی» یا «جنسیت‌زدگی» را بازتولید کند؟

اگر داده‌های ورودیِ یک الگوریتم بر اساس تبعیض‌های گذشته باشد، آمارِ خروجی نیز همان تبعیض‌ها را تایید می‌کند؛ مثلاً اگر در گذشته به گروهی خاص کمتر وام داده شده، آمار نشان می‌دهد آن‌ها «کم‌اعتبار» هستند. این یک چرخه معیوب ایجاد می‌کند که در آن آمار به جای اصلاحِ نابرابری، به بهانه‌ای ریاضی برای ادامه دادن آن تبدیل می‌شود. برای جلوگیری از این خطا، باید همیشه «زمینه تاریخیِ» تولیدِ داده‌ها را بررسی کرد.

۱۴. ساده‌ترین راه برای مهار کردن یک آمارِ مشکوک در رسانه چیست؟

فقط سه سوال بپرسید: «چه کسی این تحقیق را تأمین مالی کرده؟»، «حجم نمونه چقدر بوده؟» و «آیا این عدد نسبت به کل جامعه سنجیده شده یا به صورت مطلق بیان شده؟». پرسیدنِ منبعِ مالی معمولاً نیتِ پشت پرده را فاش می‌کند و بررسی حجم نمونه، اعتبارِ علمی را. به یاد داشته باشید که هیچ عددِ آماری در خلاء معنا ندارد و همیشه باید با یک «مرجعِ استاندارد» مقایسه شود.

نتیجه‌گیری؛ اعداد در خدمتِ حقیقت یا فریب؟

سفر ما در دنیای آمار نشان داد که اعداد، برخلاف تصور عمومی، هرگز بی‌طرف نیستند. آن‌ها مانند آینه‌ای هستند که بازتاب‌دهنده همان زاویه‌ای هستند که ما برای نگریستن انتخاب می‌کنیم. آمار می‌تواند قدرتمندترین ابزار برای افشای بی‌عدالتی‌ها و پیشرفت علمی باشد، اما به همان اندازه پتانسیل تبدیل شدن به بزرگترین دروغِ عصرِ ما را دارد. برای اینکه در دامِ «مهندسیِ اعداد» نیفتیم، باید یاد بگیریم که فراتر از تیترهای درشت نگاه کنیم و همیشه به دنبال متغیرهای پنهان، سوگیری‌های انتخاب و کادربندی‌های مغرضانه باشیم. سواد آماری، نه یک مهارتِ لوکس ریاضی، بلکه یک ضرورتِ حیاتی برای بقای تفکر آزاد در دنیایِ اشباع‌شده از داده‌هاست.

آیا شما هم فریب اعداد را خورده‌اید؟

تا به حال شده با دیدن یک نمودار در اخبار یا تبلیغات، تصمیمی بگیرید و بعداً متوجه شوید واقعیت چیز دیگری بوده است؟ یا شاید مثالی از دروغ‌های آماری در حوزه کاری خود سراغ دارید؟ تجربیات و دیدگاه‌های خود را در بخش نظرات با ما در میان بگذارید؛ بیایید با هم یاد بگیریم که چگونه مچِ اعدادِ دروغگو را بگیریم!

آمار و دروغ؛ چگونه اعداد می‌توانند واقعیت را به نفع سیاست و قدرت وارونه کنند؟ | بازیگرها

دکتر علیرضا مجیدی

پزشک، نویسنده و بنیان‌گذار وبلاگ «بازیگرها»

دکتر علیرضا مجیدی، نویسنده و بنیان‌گذار وبلاگ «بازیگرها».
با بیش از ۲۰ سال نویسندگی «ترکیبی» مستمر در زمینهٔ پزشکی، فناوری، سینما، کتاب و فرهنگ.
باشد که با هم متفاوت بیاندیشیم!