به گزارش گروه دانشگاه ایسکانیوز، ماجرا از پستی آغاز شد که شریفی زارچی، استاد سابق دانشگاه شریف، در شبکه ایکس منتشر کرد. او با استناد به دادههای در دسترس از سایت این پویش نوشت آخرین شناسه قابل مشاهده کمتر از ۴ میلیون است و نتیجه گرفت تعداد ثبتنامکنندگان نیز باید در همین حدود باشد. این استدلال بر این پیشفرض استوار است که شناسههای نمایشدادهشده، به کاربران تعلق دارد.
اما بررسی دقیقتر نشان میدهد چنین برداشتی با محدودیتهای ذاتی دادههای قابل مشاهده در یک وبسایت عمومی همخوانی ندارد. در اینگونه سایتها، تنها بخشی از اطلاعات در دسترس عموم قرار میگیرد؛ از جمله محتوای صفحات، دادههای خام کامنتهای منتشرشده و برخی اطلاعات فنی مانند زمان ثبت یا شناسههای مرتبط با همان دادهها. در مقابل، اطلاعات اصلی کاربران و دیتابیس داخلی سایت، بهطور کامل از دسترس خارج است و از طریق این دادهها قابل استخراج نیست.
بررسی کد و API مورد استناد نیز این موضوع را تأیید میکند. این API صرفاً برای نمایش دادههای کامنتها طراحی شده و خروجی آن شامل متن کامنتها و مشخصات فنی مرتبط با آنهاست. در این میان، هیچ فیلدی با عنوان «شناسه کاربر» (User ID) در دادهها دیده نمیشود. به بیان دیگر، شناسههایی که در این بخش مشاهده میشود، به رکوردهای کامنت مربوط است، نه به کاربران.

تصویری از دادههای قابل دسترس در سایت جانفدا
اختلاف برداشت دقیقاً از همین نقطه شکل گرفته است. در لیست دادهها، شناسهها بهصورت افزایشی ثبت شدهاند، اما در میان آنها فاصلههایی وجود دارد. این فاصلهها لزوماً به معنای وجود کاربرانی بدون کامنت نیست. در مقابل، ساختار دادهها نشان میدهد همه رکوردها در خروجی نمایش داده نمیشوند و تنها بخشی از آنها در دسترس است.
از منظر فنی نیز این الگو قابل توضیح است. چنین وبسایتهایی معمولاً از چند لایه پایگاه داده استفاده میکنند؛ از جمله دیتابیس داغ، دیتابیس گرم و دیتابیس آرشیوی یا آفلاین. بخش کامنتها به دیتابیس داغ متصل است و شناسههایی که در این بخش دیده میشود، صرفاً به همین لایه محدود است و ارتباط مستقیمی با شناسه کاربران ندارد. علاوه بر این، معمولاً فقط کامنتهای موفق و تأییدشده منتشر میشوند. همین فرآیند باعث میشود در توالی شناسهها فاصله ایجاد شود.
با این وجود بیشتر از اینکه فاحش بودن این اشتباه تعجببرانگیز باشد، این موضوع عجیب است که شریفی زارچی با تخصص هوش مصنوعی چنین ادعایی را مطرح کرده است.
در ادعایی دیگر، این ادعا مطرح شده که افراد میتوانند با یک شماره تلفن چندین بار در این پویش ثبتنام کنند. این درحالی است که در خود وبسایت واضحاً نوشته است که ثبتنام با هر گوشی و هر سیمکارت فقط یکبار محاسبه میشود و تکرار ثبتنام در سایت، هرچند امکانپذیر است، اما بهعنوان یک نفر محاسبه خواهد شد.
در مجموع، استناد به شناسههای کامنت برای برآورد تعداد ثبتنامکنندگان، از نظر فنی قابل اتکا نیست. این دادهها تنها بخشی محدود از ساختار سایت را نشان میدهد و نمیتواند مبنای دقیقی برای نتیجهگیری درباره تعداد کاربران باشد.
انتهای پیام/
نظر شما