امکان جست‌وجوی مقالات فارسی با جویشگر بومی محققان کشور

محققان یک شرکت دانش‌بنیان با رویکردی شبیه «گوگل اسکالر» جویشگر بومی را برای محتوای علمی فارسی عرضه کردند که در آن اطلاعات 7 سامانه و 3 هزار سایت نشریه علمی- پژوهشی بارگذاری شده است.

مهدی نیکنام، مدیر پروژه جویشگر بومی با اشاره به چالش‌های موجود در نمایه‌سازی اسناد علمی فارسی، گفت: وضعیت فعلی نمایه‌سازی اسناد علمی در کشور به گونه‌ای است که علی‌رغم نمایه‌سازی یک سند توسط پایگاه‌های مختلف، وجود اختلاف‌های محتوایی و فنی بین این پایگاه‌ها، فرآیند دسترسی به مستندات علمی فارسی برای پژوهشگران به امری چالش‌زا تبدیل شده است.

وی اضافه کرد: از سوی دیگر با توجه به هم‌پوشانی‌های محتوایی بین پایگاه‌ها و همچنین نقض محتوایی هر کدام از آنها، هیچ یک از سایت‌ها به صورت کامل نیاز پژوهشگر را برطرف نمی‌کند و ضمن آنکه از جست‌وجو در هیچ یک از این سایت‌ها نمی‌توان صرفه نظر کرد.

نیکنام ادامه داد: در سامانه‌های خارجی مانند گوگل اسکالر محصولات مشابه جویشگر بومی موجود هست، ولی از زبان فارسی به خوبی پشتیبانی نمی‌کند؛ از این رو خلایی را در این زمینه در مقالات فارسی داشتیم.

به گفته این محقق، سامانه‌های بسیار زیادی راه‌اندازی شده است که مقالات فارسی را منتشر می‌کنند، ولی هیچ کدام جامع نیستند تا کاربران با یک بار جست‌وجو کردن به اسناد مورد نظر دست یابند.

وی اضافه کرد: ما با درک این چالش سامانه‌ای را طراحی کردیم که در آن اطلاعات 7 سامانه و 3 هزار سایت نشریه علمی- پژوهشی با مکانیزم‌های موتور جست‌وجو جمع آوری و در این سامانه متمرکز شدند.

نیکنام یکی از چالش‌های این سامانه شناسایی را هم‌پوشانی‌ها در مورد مقالات و نشریات دانست و ادامه داد: به این معنی که مقاله‌ای واحد در منابع متعدد بازنشر داده شده باشد و این قابلیت به این سامانه اضافه و از این طریق کاربر متوجه خواهد شد که یک مقاله واحد چند بار بازنشر داده شده است.

به گفته وی، این سامانه تاکنون حاوی 4 میلیون رکورد اطلاعاتی است که شامل مواردی چون کتاب، پایان‌نامه، مقالات کنفرانس‌ها و مقالات نشریه‌ها است.

وی این دسترسی حداکثری رایگان به کاربران را از دیگر مزایای این جویشگر بومی نام برد و اظهار کرد: به این معنا که برخی از پایگاه‌ها و سایت‌ها مقالات را با دریافت هزینه‌ای در اختیار کاربران قرار می‌دهند، در حالی که همین مقاله در سایت اصلی نشریه مربوط به صورت رایگان ارائه می‌شود؛ از این رو ما در سامانه جویشگر علاوه بر شناسایی هم‌پوشانی‌ها در صورتی که بتوانیم لینک رایگان آن را شناسایی کنیم، لینک رایگان آن را در اختیار کاربران ارائه خواهیم داد.

نیکنام، پیشنهاد کلیدواژه‌ها به کاربر را از دیگر مزایای این موتور جست‌وجو عنوان و دراین باره توضیح داد: وقتی کاربر در خصوص موضوعی کلیدواژه‌های خود را در سامانه وارد می‌کند، این سامانه کلیدواژه‌های مرتبط با حوزه‌ مورد نظر را به کاربر پیشنهاد می‌دهد تا کاربران به مقالات مرتبط دست یابند.

این محقق در گفت‌وگو با ایسنا اضافه کرد: در حال حاضر این سامانه بیش از 300 هزار مقاله را به صورت رایگان در اختیار کاربران ارائه می‌دهد.

وی هدف این موتور را اطلاع‌رسانی در خصوص اطلاعات انجام‌شده ذکر کرد و افزود: این سامانه یک سامانه نمایه‌سازی نیست؛ از این رو زمانی که ما لینک دانلود رایگان را در اختیار کاربران قرار می‌دهیم، به آنها اطلاع می‌دهیم که از کدام سایت دانلود می‌کنند و این سامانه دارنده محتوای ارائه‌شده نیست.

به گفته این محقق، این تیم تحقیقاتی درصدد است تا 50 هزار رکورد پایان‌نامه‌های حوزه علوم پزشکی به این سامانه اضافه شود.

وی در مورد اطلاعات پایان‌نامه‌ها در "علم نت" گفت: اطلاعات ایرانداک را که شامل پایان‌نامه‌ها هست، داریم؛ ولی دسترسی کامل به آنها وجود ندارد، یعنی اطلاعات کتاب شناختی را ارائه می‌دهیم. همچنین در حال رایزنی برای به دست آوردن حدود 250 هزار رکورد پایان‌نامه‌های علوم پزشکی هستیم.

نیکنام در مورد چالش موتورهای جست‌وجوی غیرفارسی، گفت: موتورهای جست‌وجو به راحتی اطلاعات مجموعه‌های دولتی را بازنشر می‌کنند و اعتراضی هم از سوی نهادهای دولتی صورت نمی‌گیرد، اما این نهادها راغب نیستند اطلاعات خود را در اختیار موتورهای جست‌وجوی داخلی قرار دهند.

کد خبر: 878333

وب گردی

وب گردی