چت ربات
ترجیحات و تجربیات انسانی جهانی نیستند و چت رباتهای هوش مصنوعی باید آن را منعکس کنند.
راهحلهای هوش مصنوعی و چت رباتهای مرتبط ممکن است فاقد تنوع جهانی مورد نیاز برای ارائه خدمات به پایگاههای کاربران بینالمللی باشند. مطالعه اخیر محققان دانشگاه استنفورد نشان میدهد که بسیاری از مدلهای زبان بزرگ امروزی تمایل به "سلیقهها و ارزشهای غرب محور" دارند. آنها ادعا کردند که تلاشها برای دستیابی به آنچه "همسویی" با کاربران مورد نظر سیستمها یا چت باتها نامیده میشود، اغلب کوتاهی میکنند.
همانطور که محققان به رهبری Diyi Yang، استادیار دانشگاه استنفورد و بخشی از هوش مصنوعی انسان محور استنفورد (HAI) در این مطالعه بازگو میکنند، این به دلیل عدم تلاش نیست. قبل از اینکه سازندگان یک چت ربات جدید مبتنی بر هوش مصنوعی بتوانند آخرین برنامههای خود را برای عموم منتشر کنند، اغلب مدلهای خود را با اهداف مختلف و ارزشهای شخصی کاربران مورد نظر هماهنگ میکنند. با این حال، تلاشها برای دستیابی به این همترازی «میتواند سوگیریهای خود را معرفی کند که کیفیت پاسخهای رباتهای گفتگو را به خطر میاندازد».
از نظر تئوری، "ترازبندی باید جهانی باشد و مدلهای زبانی بزرگ را برای کاربران مختلف در سراسر جهان و در حالت ایدهآل، برای بیشترین تعداد کاربران ممکن سازگارتر و مفیدتر کند." با این حال، حاشیه نویسانی که به دنبال تطبیق مجموعه دادهها و LLM ها در مناطق مختلف هستند، ممکن است آن ابزارها را اشتباه تفسیر کنند.
چت رباتهای هوش مصنوعی برای اهداف مختلف، از تعامل با مشتری گرفته تا دستیاران هوشمند، با سرعت قابل توجهی در حال گسترش هستند، بنابراین چیزهای زیادی در خطر است. بر اساس برآوردهای MarketsUS، انتظار میرود اندازه بازار جهانی چت بات هوش مصنوعی تا سال 2033 نزدیک به 67 میلیارد دلار ارزش داشته باشد که با نرخ 26 درصدی سالانه از اندازه فعلی آن که بیش از 6 میلیارد دلار است، رشد میکند.
نویسندگان این گزارش به جزئیات میپردازند: «بازار چت بات هوش مصنوعی به دلیل افزایش تقاضا برای خدمات پشتیبانی خودکار مشتری و پیشرفت در فناوری هوش مصنوعی، رشد سریعی را تجربه میکند. جالب اینجاست که انتظار میرود بیش از 50 درصد از شرکتها سالانه بیشتر در توسعه رباتها و چتباتها سرمایهگذاری کنند تا در توسعه سنتی اپلیکیشنهای موبایل.
نکته پایانی این است که در حال حاضر انواع زیادی از زبانها و جوامع در سراسر جهان توسط هوش مصنوعی و چت رباتها مورد استفاده قرار نمیگیرند. دستورالعملها یا تعهدات به زبان انگلیسی ممکن است شامل عبارات یا اصطلاحاتی باشد که قابل تفسیر نادرست است.
مطالعه استنفورد ادعا میکند که LLM احتمالاً بر اساس ترجیحات خالقانشان است، که در این مرحله، احتمالاً در کشورهای انگلیسی زبان مستقر هستند. ترجیحات انسانی جهانی نیستند، و LLM باید منعکس کننده "زمینه اجتماعی افرادی باشد که آنها را نمایندگی میکند - که منجر به تغییرات در دستور زبان، موضوعات و حتی سیستمهای ارزشی اخلاقی و اخلاقی میشود."
محققان استنفورد توصیههای زیر را برای افزایش آگاهی از تنوع جهانی ارائه میدهند:
توجه داشته باشید که همسویی مدلهای زبان یک راهحل یکسان نیست. گروههای مختلف بهطور متفاوتی تحت تأثیر رویههای همسویی قرار میگیرند».
برای شفافیت تلاش کنید. این "در افشای تصمیمات طراحی که در تراز کردن یک LLM انجام می شود بسیار مهم است. هر مرحله از همسویی پیچیدگیها و تأثیرات بیشتری را بر کاربران نهایی اضافه میکند." بیشتر مجموعه دادههای ترجیحی نوشته شده توسط انسان، جمعیتشناسی حاشیهنویسهای اولویت منطقهای خود را شامل نمیشود. "گزارش چنین اطلاعاتی، همراه با تصمیمگیری در مورد اینکه چه درخواستها یا وظایفی در حوزه هستند، برای انتشار مسئولانه LLMهای همسو به مخاطبان متنوعی از کاربران ضروری است."
به دنبال مجموعه دادههای چند زبانه باشید. محققان مجموعه داده Tülu مورد استفاده در مدلهای زبان را بررسی کردند که 13درصد آن غیرانگلیسی است. "با این حال این دادههای چند زبانه منجر به بهبود عملکرد در شش زبان از نه زبان آزمایش شده برای QA استخراجی و همه نه زبان برای درک خواندن میشود. بسیاری از زبانها میتوانند از دادههای چند زبانه بهرهمند شوند."
همکاری نزدیک با کاربران محلی نیز برای غلبه بر کاستیهای فرهنگی یا زبانی یا گامهای اشتباه با چت رباتهای هوش مصنوعی ضروری است. ووک دوکیک، مهندس نرم افزار و بنیانگذار آنابلاک در مقاله اخیر لینکدین نوشت: «همکاری با کارشناسان محلی و سخنرانان بومی برای اطمینان از سازگاری معتبر و مناسب بسیار مهم است. تحقیقات فرهنگی کامل برای درک تفاوتهای ظریف هر بازار هدف ضروری است. پیادهسازی الگوریتمهای یادگیری مستمر به چتباتها اجازه میدهد تا با تعاملات و بازخورد کاربر در طول زمان سازگار شوند.
دوکیچ همچنین از "آزمایش گسترده با کاربران محلی قبل از استقرار کامل برای کمک به شناسایی و رفع اشتباهات فرهنگی" خواست. علاوه بر این، "ارائه انتخاب زبان به کاربران امکان میدهد زبان و زمینه فرهنگی مورد نظر خود را انتخاب کنند."
منبع
زدنت