لهجه های متعدد زبان عربی مانعی بزرگ در برابر هوش مصنوعی

مرکز پژوهش های رایانه ای قطر،فعالیت های خود را بر تحولات ایجاد شده در خصوص تعامل هوش مصنوعی با زبان عربی در زمینه صوتی تمرکز نموده تا افق ها و چالش های آموزش یک سیستم بر اساس ماشین های مبتنی بر زبان عربی را بررسی کند.

به گزارش گروه علم و فناوری ایسکانیوز، از چندی پیش مرکز پژوهش های رایانه ای قطر وابسته به دانشگاه «حمد بن خلیفه» بر تحولات ایجاد شده در خصوص تعامل هوش مصنوعی با زبان عربی در زمینه صوتی تمرکز نموده تا افق ها و چالش های آموزش یک سیستم بر اساس ماشین های مبتنی بر زبان عربی را بررسی نمایند.

در همین راستا چندی پیش این مرکز، کنفرانسی را برگزار کرد که شرکت ها و هیات هایی از دانشگاه های سراسر جهان در آن حضور داشتند یک گروه پژوهشی شرکت کننده بر سه محور تمرکز نمود که اولین آن آشنایی به صوت و تبدیل متن گفتاری به نوشتاری بود، دومین محور تبدیل متن نوشتاری به گفتاری و محور سوم نیز به آشنایی با لهجه های مختلف زبان عربی اختصاص داشت.

همه مشارکت کنندگان در این کنفرانس بر این مساله تاکید داشتند که تعامل هوش مصنوعی با زبان عربی با چالش های بزرگی در مقایسه با زبان انگلیسی مواجه می شود، چرا که زبان عربی به دلیل عدم وجود اطلاعات کافی در مورد آن زبانی سخت محسوب می شود علاوه بر آنکه این زبان دارای لهجه های متفاوت در کشورهای مختلف و حتی شهرهای یک کشور است.

احمد علی متخصص بخش فناوری های زبان عربی در مرکز پژوهش های رایانه ای قطر تاکید کرد هوش مصنوعی موجود در بخش عربی همچنان به آموزش ها پیشین تکیه دارد و برای استفاده از آن نیاز به تحول و آموزش های گسترده داشته و باید تخصص آن در این زمینه افزایش یابد.

این سامانه با 1000 ساعت صوت و 1000 ساعت نوشتار به زبان عربی آموزش داده شده ولی با این حال نسبت دقت آن تنها 10 درصد است و این فناوری طی 5 سال گذشته در پایگاه خبری شبکه الجزیره مورد استفاده قرار گرفته که می تواند متن مکتوب اخبار و گزارشات را قرائت نماید.

این مرکز هم اکنون بر روی سازگاری بیشتر هوش مصنوعی با لهجه های مختلف زبان عربی مانند مصری، مغربی، خلیجی و شامی کار می کند و باید گفت که عربی زبانی سخت است. در انگلیسی عدم آشنایی سیستم با 5 درصد از لغات به معنای 30 تا 60 هزار کلمه است اما این 5 درصد در زبان عربی حدود یک میلیون کلمه را شامل می شود.

وی ادامه داد چالش بزرگتر در مواجهه با لهجه های مختلف زبان عربی است چرا که علاوه بر نبود فرهنگ لغت برای این لهجه ها اطلاعات مورد توافقی در این زمینه و همچنین روش خاصی برای کتابت آنها وجود ندارد، همچنان که باید توجه داشت بیشتر لهجه های زبان عربی فقط گفتاری است و نوشته نمی شود بنابراین کتابت خاصی از لهجه مصری یا خلیجی موجود نیست.

مباحث متعدد دیگری در خصوص دیگر فناوری های هوش مصنوعی مانند تشخیص عاطفه و تحلیل احساسات بر اساس گفتار مطرح شد که شرکت های خدماتی برای آگاهی از رضایت مشتری های خود به آن توجه ویژه دارند، همچنین نرم افزارهای ویژه تشخیص مشکلات جسمی که از طریق دریافت صوت افراد مشکلات روانی، جنسیت، سن و میزان احساس خوشبختی و اندوه را تشخیص می دهد، در دستور کار این مرکز قرار دارد.

« رامی اسکندر »، پژوهشگر دانشگاه آمریکایی کلمبیا معتقد است سازگاری فناوری های هوش مصنوعی با زبان عربی بسیار مشکل است، در حالی که از حدود 15 سال پیش کار در این زمینه آغاز شده است اما اطلاعات کافی در مورد آن وجود ندارد، البته شاهد آن هستیم که اطلاعات لازم در زبان انگلیسی یا فرانسه منتشر شده و از 60 سال پیش در دسترس همگان قرار دارد.

چالش بسیار بزرگ در زبان عربی عامیانه نهفته است؛ زیرا روش واحدی در کتابت ندارند و یک کلمه به چند طریق نوشته می شود. این مساله باعث به وجود آمدن تداخلات و مشکلاتی در زمینه کتابت می شود که این سیستم نمی تواند همه آنها را شامل شود.

وی ادامه داد: وجود لهجه های زیاد در زبان عربی و تفاوت آن در کشورها و شهرهای مختلف این چالش را افزایش می دهد. مساله ای که برای رفع آن به یک سیستم بسیار کارآمد برای تعامل با لهجه های بسیار در این زبان نیاز است، ولی ما در لهجه انگلیسی، آمریکایی، استرالیایی و هندی شاهد چنین مساله ای نیستیم چرا که کتابت انگلیسی تقریبا به صورت یکسان انجام می شود.

از دیگر سخنرانی هایی که در این کنفرانس مورد توجه قرار گرفت مطالب ارائه شده توسط عبدالرحمن محمد از شرکت فیس بوک بود که در آن به تشریح فناوری طراحی شده در کارگاه پژوهشی این شرکت در زمینه تشخیص صدا پرداخت.

محمد در این رابطه گفت که این فناوری توانسته در آزمایشات مختلف در زمینه ترجمه فوری زبان انگلیسی موفقیت های لازم را به دست آورد و می توان از آن با همین میزان کارآمدی در زبان های دیگر استفاده کرد.

وی از ایده اساسی به کار رفته در این فناوری پرده برداشت، این تکنولوژی می تواند روابط میان کلمات و صداهای جدا از هم را کشف کند، علاوه بر آن که قادر به تشخیص صوت نیز هست. این فناوری مبتنی بر شبکه های عصبی مصنوعی است، این شبکه به منظور شبیه سازی عملکرد مغز انسان طراحی شده و بخشی از یادگیری عمیق محسوب می شود.

این فناوری روش جدیدی داشته که از جهت سرعت و کارآمدی برتر است. علاوه بر آن که صرف نظر از زبان مورد استفاده توان تشخیص صوت را نیز در آن داشت و خطاهای تشخیصی در زبان انگلیسی را از 15 درصد به 12 درصد کاهش داد.

انتهای پیام/

کد خبر: 1003915

وب گردی

وب گردی