‫ مطالعه استنفورد نشان می‌دهد چت ربات‌های هوش مصنوعی بیش از حد انگلیسی زبانند

چت ربات

ترجیحات و تجربیات انسانی جهانی نیستند و چت ربات‌های هوش مصنوعی باید آن را منعکس کنند.

 

راه‌حل‌های هوش مصنوعی و چت ربات‌های مرتبط ممکن است فاقد تنوع جهانی مورد نیاز برای ارائه خدمات به پایگاه‌های کاربران بین‌المللی باشند. مطالعه اخیر محققان دانشگاه استنفورد نشان می‌دهد که بسیاری از مدل‌های زبان بزرگ امروزی تمایل به "سلیقه‌ها و ارزش‌های غرب محور" دارند. آنها ادعا کردند که تلاش‌ها برای دستیابی به آنچه "همسویی" با کاربران مورد نظر سیستم‌ها یا چت بات‌ها نامیده می‌شود، اغلب کوتاهی ‌می‌کنند.

 

همانطور که محققان به رهبری Diyi Yang، استادیار دانشگاه استنفورد و بخشی از هوش مصنوعی انسان محور استنفورد (HAI) در این مطالعه بازگو می‌کنند، این به دلیل عدم تلاش نیست. قبل از اینکه سازندگان یک چت ربات جدید مبتنی بر هوش مصنوعی بتوانند آخرین برنامه‌های خود را برای عموم منتشر کنند، اغلب مدل‌های خود را با اهداف مختلف و ارزش‌های شخصی کاربران مورد نظر هماهنگ می‌کنند. با این حال، تلاش‌ها برای دستیابی به این هم‌ترازی «می‌تواند سوگیری‌های خود را معرفی کند که کیفیت پاسخ‌های ربات‌های گفتگو را به خطر می‌اندازد».

 

از نظر تئوری، "ترازبندی باید جهانی باشد و مدل‌های زبانی بزرگ را برای کاربران مختلف در سراسر جهان و در حالت ایده‌آل، برای بیشترین تعداد کاربران ممکن سازگارتر و مفیدتر کند." با این حال، حاشیه نویسانی که به دنبال تطبیق مجموعه داده‌ها و LLM ها در مناطق مختلف هستند، ممکن است آن ابزارها را اشتباه تفسیر کنند.

 

چت ربات‌های هوش مصنوعی برای اهداف مختلف، از تعامل با مشتری گرفته تا دستیاران هوشمند، با سرعت قابل توجهی در حال گسترش هستند، بنابراین چیزهای زیادی در خطر است. بر اساس برآوردهای MarketsUS، انتظار می‌رود اندازه بازار جهانی چت بات هوش مصنوعی تا سال 2033 نزدیک به 67 میلیارد دلار ارزش داشته باشد که با نرخ 26 درصدی سالانه از اندازه فعلی آن که بیش از 6 میلیارد دلار است، رشد می‌کند.

 

 نویسندگان این گزارش به جزئیات می‌پردازند: «بازار چت بات هوش مصنوعی به دلیل افزایش تقاضا برای خدمات پشتیبانی خودکار مشتری و پیشرفت در فناوری هوش مصنوعی، رشد سریعی را تجربه می‌کند. جالب اینجاست که انتظار می‌رود بیش از 50 درصد از شرکت‌ها سالانه بیشتر در توسعه ربات‌ها و چت‌بات‌ها سرمایه‌گذاری کنند تا در توسعه سنتی اپلیکیشن‌های موبایل.

 

نکته پایانی این است که در حال حاضر انواع زیادی از زبان‌ها و جوامع در سراسر جهان توسط هوش مصنوعی و چت ربات‌ها مورد استفاده قرار نمی‌گیرند. دستورالعمل‌ها یا تعهدات به زبان انگلیسی ممکن است شامل عبارات یا اصطلاحاتی باشد که قابل تفسیر نادرست است.

 

مطالعه استنفورد ادعا می‌کند که LLM احتمالاً بر اساس ترجیحات خالقانشان است، که در این مرحله، احتمالاً در کشورهای انگلیسی زبان مستقر هستند. ترجیحات انسانی جهانی نیستند، و LLM باید منعکس کننده "زمینه اجتماعی افرادی باشد که آنها را نمایندگی می‌کند - که منجر به تغییرات در دستور زبان، موضوعات و حتی سیستم‌های ارزشی اخلاقی و اخلاقی می‌شود."

 

محققان استنفورد توصیه‌های زیر را برای افزایش آگاهی از تنوع جهانی ارائه می‌دهند:

 

توجه داشته باشید که همسویی مدل‌های زبان یک راه‌حل یکسان نیست. گروه‌های مختلف به‌طور متفاوتی تحت تأثیر رویه‌های همسویی قرار می‌گیرند».

 

برای شفافیت تلاش کنید. این "در افشای تصمیمات طراحی که در تراز کردن یک LLM انجام می شود بسیار مهم است. هر مرحله از همسویی پیچیدگی‌ها و تأثیرات بیشتری را بر کاربران نهایی اضافه می‌کند." بیشتر مجموعه داده‌های ترجیحی نوشته شده توسط انسان، جمعیت‌شناسی حاشیه‌نویس‌های اولویت منطقه‌ای خود را شامل نمی‌شود. "گزارش چنین اطلاعاتی، همراه با تصمیم‌گیری در مورد اینکه چه درخواست‌ها یا وظایفی در حوزه هستند، برای انتشار مسئولانه LLM‌های همسو به مخاطبان متنوعی از کاربران ضروری است."

 

به دنبال مجموعه داده‌های چند زبانه باشید. محققان مجموعه داده Tülu مورد استفاده در مدل‌های زبان را بررسی کردند که 13درصد آن غیرانگلیسی است. "با این حال این داده‌های چند زبانه منجر به بهبود عملکرد در شش زبان از نه زبان آزمایش شده برای QA استخراجی و همه نه زبان برای درک خواندن می‌شود. بسیاری از زبان‌ها می‌توانند از داده‌های چند زبانه بهره‌مند شوند."

 

همکاری نزدیک با کاربران محلی نیز برای غلبه بر کاستی‌های فرهنگی یا زبانی یا گام‌های اشتباه با چت ربات‌های هوش مصنوعی ضروری است. ووک دوکیک، مهندس نرم افزار و بنیانگذار آنابلاک در مقاله اخیر لینکدین نوشت: «همکاری با کارشناسان محلی و سخنرانان بومی برای اطمینان از سازگاری معتبر و مناسب بسیار مهم است. تحقیقات فرهنگی کامل برای درک تفاوت‌های ظریف هر بازار هدف ضروری است. پیاده‌سازی الگوریتم‌های یادگیری مستمر به چت‌بات‌ها اجازه می‌دهد تا با تعاملات و بازخورد کاربر در طول زمان سازگار شوند.

 

دوکیچ همچنین از "آزمایش گسترده با کاربران محلی قبل از استقرار کامل برای کمک به شناسایی و رفع اشتباهات فرهنگی" خواست. علاوه بر این، "ارائه انتخاب زبان به کاربران امکان می‌دهد زبان و زمینه فرهنگی مورد نظر خود را انتخاب کنند."

منبع

زدنت