محاسبات اشتباه استاد سلطنت‌طلب؛ چرا برآورد «۴ میلیونی» از پویش جان‌فدا قابل اتکا نیست؟

شریفی زارچی، استاد سابق و متواری دانشگاه شریف مجدداً با ادعایی در خصوص پویش جان‌فدا خبرساز شده است. درحالی که شمارشگر این پویش بیش از 30 میلیون ثبت‌نام منحصربه‌فرد را نشان می‌دهد، وی مدعی شده تنها 4 میلیون در این پویش ثبت‌نام کرده‌اند.

به گزارش گروه دانشگاه ایسکانیوز، ماجرا از پستی آغاز شد که شریفی زارچی، استاد سابق دانشگاه شریف، در شبکه ایکس منتشر کرد. او با استناد به داده‌های در دسترس از سایت این پویش نوشت آخرین شناسه قابل مشاهده کمتر از ۴ میلیون است و نتیجه گرفت تعداد ثبت‌نام‌کنندگان نیز باید در همین حدود باشد. این استدلال بر این پیش‌فرض استوار است که شناسه‌های نمایش‌داده‌شده، به کاربران تعلق دارد.

اما بررسی دقیق‌تر نشان می‌دهد چنین برداشتی با محدودیت‌های ذاتی داده‌های قابل مشاهده در یک وب‌سایت عمومی همخوانی ندارد. در این‌گونه سایت‌ها، تنها بخشی از اطلاعات در دسترس عموم قرار می‌گیرد؛ از جمله محتوای صفحات، داده‌های خام کامنت‌های منتشرشده و برخی اطلاعات فنی مانند زمان ثبت یا شناسه‌های مرتبط با همان داده‌ها. در مقابل، اطلاعات اصلی کاربران و دیتابیس داخلی سایت، به‌طور کامل از دسترس خارج است و از طریق این داده‌ها قابل استخراج نیست.

بررسی کد و API مورد استناد نیز این موضوع را تأیید می‌کند. این API صرفاً برای نمایش داده‌های کامنت‌ها طراحی شده و خروجی آن شامل متن کامنت‌ها و مشخصات فنی مرتبط با آن‌هاست. در این میان، هیچ فیلدی با عنوان «شناسه کاربر» (User ID) در داده‌ها دیده نمی‌شود. به بیان دیگر، شناسه‌هایی که در این بخش مشاهده می‌شود، به رکوردهای کامنت مربوط است، نه به کاربران.

محاسبات اشتباه استاد سلطنت‌طلب؛ چرا برآورد «۴ میلیونی» از پویش جان‌فدا قابل اتکا نیست؟

تصویری از داده‌های قابل دسترس در سایت جان‌فدا

اختلاف برداشت دقیقاً از همین نقطه شکل گرفته است. در لیست داده‌ها، شناسه‌ها به‌صورت افزایشی ثبت شده‌اند، اما در میان آن‌ها فاصله‌هایی وجود دارد. این فاصله‌ها لزوماً به معنای وجود کاربرانی بدون کامنت نیست. در مقابل، ساختار داده‌ها نشان می‌دهد همه رکوردها در خروجی نمایش داده نمی‌شوند و تنها بخشی از آن‌ها در دسترس است.

از منظر فنی نیز این الگو قابل توضیح است. چنین وب‌سایت‌هایی معمولاً از چند لایه پایگاه داده استفاده می‌کنند؛ از جمله دیتابیس داغ، دیتابیس گرم و دیتابیس آرشیوی یا آفلاین. بخش کامنت‌ها به دیتابیس داغ متصل است و شناسه‌هایی که در این بخش دیده می‌شود، صرفاً به همین لایه محدود است و ارتباط مستقیمی با شناسه کاربران ندارد. علاوه بر این، معمولاً فقط کامنت‌های موفق و تأییدشده منتشر می‌شوند. همین فرآیند باعث می‌شود در توالی شناسه‌ها فاصله ایجاد شود.

با این‌ وجود بیشتر از اینکه فاحش بودن این اشتباه تعجب‌برانگیز باشد، این موضوع عجیب است که شریفی زارچی با تخصص هوش مصنوعی چنین ادعایی را مطرح کرده است.

در ادعایی دیگر، این ادعا مطرح شده که افراد می‌توانند با یک شماره تلفن چندین بار در این پویش ثبت‌نام کنند. این درحالی است که در خود وبسایت واضحاً نوشته است که ثبت‌نام با هر گوشی و هر سیم‌کارت فقط یک‌بار محاسبه می‌شود و تکرار ثبت‌نام در سایت، هرچند امکان‌پذیر است، اما به‌عنوان یک نفر محاسبه خواهد شد.

در مجموع، استناد به شناسه‌های کامنت برای برآورد تعداد ثبت‌نام‌کنندگان، از نظر فنی قابل اتکا نیست. این داده‌ها تنها بخشی محدود از ساختار سایت را نشان می‌دهد و نمی‌تواند مبنای دقیقی برای نتیجه‌گیری درباره تعداد کاربران باشد.

انتهای پیام/

کد مطلب: 1304187

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
  • نظرات حاوی توهین و هرگونه نسبت ناروا به اشخاص حقیقی و حقوقی منتشر نمی‌شود.
  • نظراتی که غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نمی‌شود.
  • captcha