‫ مدل‌های هوش مصنوعی را با داده‌های خود آموزش دهید تا خطرات را کاهش دهید

مدل‌های بنیادی بستر خوبی را فراهم می‌کنند که سازمان‌ها می‌توانند از آن برای کنترل داده‌های آموزشی هوش مصنوعی خود استفاده کنند.

 

سازمان‌هایی که می‌خواهند از هوش مصنوعی مولد (AI) به طور مؤثرتری استفاده کنند، باید از داده‌های خود برای آموزش سیستم‌های هوش مصنوعی استفاده کنند و از مدل‌های پایه به عنوان نقطه شروع استفاده کنند.

انجام این کار می‌تواند زمینه مرتبط‌تری را فراهم کند و نگرانی‌ها در مورد خطرات احتمالی، مانند عدم دقت و نقض مالکیت معنوی را برطرف کند.

دقت، به ویژه، اولویت اصلی شرکتی مانند Jivaاست. فروشنده agritechاز هوش مصنوعی برای تقویت برنامه موبایل خود، Crop Doctorاستفاده می‌کند، که بیماری‌های محصول را از طریق پردازش تصویر و بینایی کامپیوتری شناسایی می‌کند و درمان‌هایی را توصیه می‌کند. همچنین برای تعیین شایستگی اعتباری کشاورزانی که پیش از برداشت محصول درخواست پیش پرداخت نقدی می‌کنند، از هوش مصنوعی استفاده می‌کند و پس از پرداخت محصول، وام‌ها را برمی‌گرداند.

این ابزار از هوش مصنوعی و ابزارهای یادگیری ماشینی مختلف، از جمله Pinecorn، OpenAI، و scikit-learn، و همچنین TensorFlowو Vertex AIگوگل استفاده می‌کند. جیوا در سنگاپور، اندونزی و هند فعالیت دارد.

به گفته تجاس دینکار، مدیر ارشد فناوری Jiva، این مدل‌های هوش مصنوعی خود را بر روی هزاران تصویر حاشیه‌نویسی برای هر بیماری آموزش می‌دهد. شرکت agritechصدها هزار تصویر را از طریق تیم‌های میدانی خود و کشاورزانی که بخشی از شبکه Jivaهستند و از برنامه AgriCentralآن که در هند موجود است استفاده می‌کنند، جمع آوری کرده است.

کارشناسان میدانی آن در جمع آوری اولیه و حاشیه نویسی تصاویر شرکت دارند، قبل از اینکه این تصاویر به کارشناسان زراعت منتقل شود تا تصاویر را بیشتر حاشیه نویسی کنند. اینها سپس به مدل آموزشی مورد استفاده برای شناسایی بیماری گیاهی اضافه می شوند.

برای محصولات جدید یا محصولاتی که تیم متخصصانش کمتر با آنها آشنا هستند، Jivaپلتفرم‌های دیگری مانند Plantixرا ارائه می‌کند که دارای مجموعه داده‌های گسترده‌ای برای تشخیص تصویر و اطلاعات تشخیص است.

دینکار گفت که ارائه اطلاعات دقیق حیاتی است زیرا داده‌ها می‌توانند برداشت و معیشت کشاورزان را بهبود بخشند. برای اطمینان بیشتر از صحت داده‌ها، هوش مصنوعی مولد و مدل‌های زبان بزرگ (LLM) تنها از مجموعه داده هایی استفاده می کنند که خود جیوا منبع و بررسی شده است.

او گفت که علاوه بر این از چت بات خواسته شده است که از طریق مهندسی سریع، هر گونه داده از پیش آموزش دیده در مورد کشاورزی را که ممکن است در LLMها وجود داشته باشد، نادیده بگیرد.

اگر داده‌ای برای استخراج وجود نداشته باشد، ربات چت پاسخی را برمی‌گرداند که می‌گوید قادر به شناسایی بیماری محصول نیست. او گفت: "شما می‌خواهید اطمینان حاصل کنید که داده‌های کافی وجود دارد. ما نمی خواهیم پاسخ مبهم ارائه کنیم."

Jivaهمچنین از کتابخانه تصویر خود برای ساخت بر روی پلتفرم‌هایی مانند Plantixاستفاده می‌کند. دینکار گفت که این مدل‌ها خط پایه خوبی را ارائه می‌کنند، اما از آنجایی که توسط شرکت‌های جهانی توسعه داده می‌شوند، ممکن است لزوماً به اندازه کافی بر روی داده‌های خاص یک منطقه یا بازار آموزش داده نشده باشند.

او گفت که این موضوع به این معنی بود که Jivaمجبور بود برای محصولاتی که در اندونزی و هند رایج‌تر بودند، مانند ذرت، مدل‌های آموزشی ایجاد کند. او با اشاره به اهمیت بومی‌سازی در مدل‌های هوش مصنوعی افزود، این محصولات بهتر از Plantixیا سایر محصولات تولید شده عمل می‌کنند.

 

مدل های پایه دقیق برای گرفتن نتایج بهتر

استفاده از مدل‌های داده پایه یک راه برای شروع سریع با هوش مصنوعی مولد است. با این حال، به گفته اولیویه کلاین، کارشناس ارشد خدمات وب آمازون (AWS) آسیا و اقیانوسیه، یک چالش رایج با این رویکرد این است که داده‌ها ممکن است به صنعتی که در آن کسب و کار در آن فعالیت می‌کند، مرتبط نباشد.

کلاین گفت که برای موفقیت در استقرار هوش مصنوعی مولد خود، سازمان‌ها باید مدل هوش مصنوعی را با داده‌های خود به خوبی تنظیم کنند. شرکت‌هایی که تلاش می‌کنند تا این کار را به درستی انجام دهند، با اجرای خود سریعتر پیش خواهند رفت.

او افزود که استفاده از هوش مصنوعی مولد به تنهایی اگر در استراتژی داده و پلتفرم سازمان تعبیه شود، قانع‌کننده‌تر خواهد بود.

او گفت که بسته به مورد استفاده، چالش رایجی که شرکت‌ها با آن روبرو هستند این است که آیا داده‌های کافی برای آموزش مدل هوش مصنوعی دارند یا خیر. با این حال، وی خاطرنشان کرد که کمیت داده ها لزوماً با کیفیت داده برابر نیست.

او گفت که حاشیه نویسی داده ها نیز مهم است، همانطور که زمینه را برای مدل های آموزشی هوش مصنوعی به کار می برد، بنابراین سیستم پاسخ‌هایی را ارائه می‌دهد که بیشتر مختص صنعت کسب و کار است.

با حاشیه‌نویسی داده‌ها، اجزای جداگانه داده‌های آموزشی برچسب‌گذاری می‌شوند تا ماشین‌های هوش مصنوعی بتوانند بفهمند داده‌ها شامل چه چیزهایی هستند و چه اجزایی مهم هستند.

کلاین به یک تصور غلط رایج اشاره کرد که همه سیستم های هوش مصنوعی یکسان هستند، که اینطور نیست. او مجدداً بر لزوم سازمان‌ها برای اطمینان از تغییر مدل‌های هوش مصنوعی بر اساس موارد استفاده و همچنین عمودی آنها تأکید کرد.

او گفت که LLMها گفتگوهای زیادی را در میان مشتریان سازمانی در مورد استفاده از هوش مصنوعی مولد در مراکز تماس، به ویژه، به راه انداخته‌اند. علاقه‌ای به این موضوع وجود دارد که چگونه این فناوری می‌تواند تجربه را برای نمایندگان تماس افزایش دهد، کسانی که می‌توانند به پاسخ‌های بهتر در حین پرواز دسترسی داشته باشند و آنها را برای بهبود خدمات مشتری ترکیب کنند.

او خاطرنشان کرد که اپراتورهای مرکز تماس می توانند مدل هوش مصنوعی را با استفاده از پایگاه دانش خود، که می تواند شامل چت بات و تعامل با مشتری باشد، آموزش دهند.

طبق گزارش Business Harvard Review، افزودن محتوای خاص دامنه به یک LLMموجود که قبلاً بر روی دانش عمومی و تعامل مبتنی بر زبان آموزش دیده است، معمولاً به داده‌های بسیار کمتری نیاز دارد. این رویکرد تنظیم دقیق شامل تنظیم برخی پارامترهای یک مدل پایه است و فقط از صدها یا هزاران سند استفاده می کند، نه میلیون‌ها یا میلیاردها. زمان محاسباتی کمتری نیز در مقایسه با ساخت یک مدل پایه جدید از زمین صفر مورد نیاز است.

هرچند محدودیت‌هایی وجود دارد. این گزارش خاطرنشان کرد که این رویکرد هنوز هم می‌تواند گران باشد و به تخصص علم داده نیاز دارد. علاوه بر این، همه ارائه‌دهندگان LLM، مانند ChatGPT-4 OpenAi، به کاربران اجازه نمی‌دهند که در بالای برنامه‌های خود تنظیم دقیق کنند.

کلاین گفت، بهره برداری از داده‌های خود همچنین نگرانی مشترک مشتریان را در میان علاقه شدید به هوش مصنوعی مولد برطرف می کند، جایی که کسب و کارها می خواهند کنترل داده های مورد استفاده برای آموزش مدل های هوش مصنوعی را حفظ کنند و داده ها در محیط آنها باقی بماند.

او خاطرنشان کرد: این رویکرد تضمین می کند که هیچ "جعبه سیاه" وجود ندارد و سازمان دقیقاً می داند که از چه داده هایی برای تغذیه مدل هوش مصنوعی استفاده می شود. همچنین شفافیت را تضمین می کند و به ایجاد مسئولیت پذیری هوش مصنوعی کمک می کند.

او گفت همچنین تلاش‌های مداومی برای شناسایی سیاست‌های مورد نیاز برای جلوگیری از اثر جعبه سیاه وجود دارد و افزود که AWSبا تنظیم‌کننده‌ها و سیاست‌گذاران برای اطمینان از سازگاری محصولات هوش مصنوعی خود کار می‌کند. این شرکت همچنین به مشتریان کمک می کند تا با پیاده سازی های خود نیز همین کار را انجام دهند.

او گفت، برای مثال، آمازون بستر می‌تواند سوگیری را تشخیص دهد و محتوایی را که دستورالعمل‌های اخلاقی هوش مصنوعی را نقض می‌کند، فیلتر کند. Bedrockمجموعه‌ای از مدل‌های پایه است که شامل مدل‌های اختصاصی و همچنین مدل‌های صنعتی مانند Amazon Titan، Jurassic-2آزمایشگاه‌های AI21، Claude Anthropicو Stability AIاست.

کلاین پیش‌بینی می‌کند که مدل‌های داده پایه بیشتری در آینده پدیدار شوند، از جمله مدل‌های پایه عمودی خاص، تا سازمان‌ها را با گزینه‌های بیشتر آموزش دهند.

مشکلات کلیدی برای حل با هوش مصنوعی مولد

در جایی که مدل‌های هوش مصنوعی قوی وجود نداشته باشد، انسان‌ها می‌توانند پا پس بگذارند.

دینکار برای مسائل نادر یا بسیار خاص محصول، خاطرنشان کرد که تیم متخصصان زراعت Jivaمی توانند با محققان محلی و تیم های میدانی برای حل آنها همکاری کنند.

او گفت که تیم ارزیابی اعتبار این شرکت همچنین داده های تولید شده توسط سیستم‌های هوش مصنوعی را با اطلاعات دیگر پوشش می دهد. برای مثال، تیم ممکن است یک بازدید در محل انجام دهد و متوجه شود که یک محصول اخیراً برای برداشت آماده شده است، که سیستم مجهز به هوش مصنوعی ممکن است در هنگام ایجاد ارزیابی اعتبار آن را در نظر نگرفته باشد.

دینکار گفت: "هدف حذف کامل انسان‌ها نیست، بلکه انتقال آنها به مناطقی است که می‌توانند افکار تطبیقی را تقویت کنند و [به کار گیرند]، که ماشین‌ها هنوز به آن عمل نکرده اند."

در پاسخ به سوالی درباره چالش‌هایی که Jivaدر استفاده از هوش مصنوعی مولد خود با آن مواجه شد، به فقدان یک روش استاندارد سریع در بین نسخه‌های مختلف نرم‌افزار و ارائه‌دهندگان اشاره کرد.

او گفت که "همه زبان گرایی واقعی" نیز در LLMوجود ندارد، در حالی که توهم همچنان یک مسئله کلیدی است.

او توضیح داد: «مدل‌های مختلف زبان بزرگ، همگی ویژگی‌های خاص خود را دارند [و] تکنیک‌های سریع یکسان در این موارد کار نمی‌کنند. به عنوان مثال، از طریق مهندسی سریع پیشرفته، Jivaتوانسته است به ربات کشاورزی خود دستور دهد تا روشن کند که آیا قادر به استنباط از زمینه، محصولی است که کشاورز به آن ارجاع می دهد یا خیر.

با این حال، او گفت، در حالی که این دستور خاص در GPT-3.5عملکرد خوبی داشت، اما در GPT-4به خوبی عمل نکرد. همچنین در LLMمتفاوت کار نمی کند.

دینکار گفت: «ناتوانی در استفاده مجدد از درخواست‌ها در سراسر نسخه‌ها و پلتفرم‌ها، ایجاد مجموعه‌های سفارشی از تکنیک‌های سریع برای هر یک را ضروری می‌کند. "با بهبود ابزارها و ظهور بهترین روش ها برای ایجاد مدل های مختلف زبانی بزرگ، امیدواریم درخواست های چند پلتفرمی به واقعیت تبدیل شوند."

او گفت که در پشتیبانی بین زبانی نیز به بهبودهایی نیاز است و به پاسخ های عجیبی که ربات چت آن گاهی اوقات خارج از زمینه ایجاد می کند اشاره کرد.

 منبع:زدنت