مدلهای بنیادی بستر خوبی را فراهم میکنند که سازمانها میتوانند از آن برای کنترل دادههای آموزشی هوش مصنوعی خود استفاده کنند.
سازمانهایی که میخواهند از هوش مصنوعی مولد (AI) به طور مؤثرتری استفاده کنند، باید از دادههای خود برای آموزش سیستمهای هوش مصنوعی استفاده کنند و از مدلهای پایه به عنوان نقطه شروع استفاده کنند.
انجام این کار میتواند زمینه مرتبطتری را فراهم کند و نگرانیها در مورد خطرات احتمالی، مانند عدم دقت و نقض مالکیت معنوی را برطرف کند.
دقت، به ویژه، اولویت اصلی شرکتی مانند Jivaاست. فروشنده agritechاز هوش مصنوعی برای تقویت برنامه موبایل خود، Crop Doctorاستفاده میکند، که بیماریهای محصول را از طریق پردازش تصویر و بینایی کامپیوتری شناسایی میکند و درمانهایی را توصیه میکند. همچنین برای تعیین شایستگی اعتباری کشاورزانی که پیش از برداشت محصول درخواست پیش پرداخت نقدی میکنند، از هوش مصنوعی استفاده میکند و پس از پرداخت محصول، وامها را برمیگرداند.
این ابزار از هوش مصنوعی و ابزارهای یادگیری ماشینی مختلف، از جمله Pinecorn، OpenAI، و scikit-learn، و همچنین TensorFlowو Vertex AIگوگل استفاده میکند. جیوا در سنگاپور، اندونزی و هند فعالیت دارد.
به گفته تجاس دینکار، مدیر ارشد فناوری Jiva، این مدلهای هوش مصنوعی خود را بر روی هزاران تصویر حاشیهنویسی برای هر بیماری آموزش میدهد. شرکت agritechصدها هزار تصویر را از طریق تیمهای میدانی خود و کشاورزانی که بخشی از شبکه Jivaهستند و از برنامه AgriCentralآن که در هند موجود است استفاده میکنند، جمع آوری کرده است.
کارشناسان میدانی آن در جمع آوری اولیه و حاشیه نویسی تصاویر شرکت دارند، قبل از اینکه این تصاویر به کارشناسان زراعت منتقل شود تا تصاویر را بیشتر حاشیه نویسی کنند. اینها سپس به مدل آموزشی مورد استفاده برای شناسایی بیماری گیاهی اضافه می شوند.
برای محصولات جدید یا محصولاتی که تیم متخصصانش کمتر با آنها آشنا هستند، Jivaپلتفرمهای دیگری مانند Plantixرا ارائه میکند که دارای مجموعه دادههای گستردهای برای تشخیص تصویر و اطلاعات تشخیص است.
دینکار گفت که ارائه اطلاعات دقیق حیاتی است زیرا دادهها میتوانند برداشت و معیشت کشاورزان را بهبود بخشند. برای اطمینان بیشتر از صحت دادهها، هوش مصنوعی مولد و مدلهای زبان بزرگ (LLM) تنها از مجموعه داده هایی استفاده می کنند که خود جیوا منبع و بررسی شده است.
او گفت که علاوه بر این از چت بات خواسته شده است که از طریق مهندسی سریع، هر گونه داده از پیش آموزش دیده در مورد کشاورزی را که ممکن است در LLMها وجود داشته باشد، نادیده بگیرد.
اگر دادهای برای استخراج وجود نداشته باشد، ربات چت پاسخی را برمیگرداند که میگوید قادر به شناسایی بیماری محصول نیست. او گفت: "شما میخواهید اطمینان حاصل کنید که دادههای کافی وجود دارد. ما نمی خواهیم پاسخ مبهم ارائه کنیم."
Jivaهمچنین از کتابخانه تصویر خود برای ساخت بر روی پلتفرمهایی مانند Plantixاستفاده میکند. دینکار گفت که این مدلها خط پایه خوبی را ارائه میکنند، اما از آنجایی که توسط شرکتهای جهانی توسعه داده میشوند، ممکن است لزوماً به اندازه کافی بر روی دادههای خاص یک منطقه یا بازار آموزش داده نشده باشند.
او گفت که این موضوع به این معنی بود که Jivaمجبور بود برای محصولاتی که در اندونزی و هند رایجتر بودند، مانند ذرت، مدلهای آموزشی ایجاد کند. او با اشاره به اهمیت بومیسازی در مدلهای هوش مصنوعی افزود، این محصولات بهتر از Plantixیا سایر محصولات تولید شده عمل میکنند.
مدل های پایه دقیق برای گرفتن نتایج بهتر
استفاده از مدلهای داده پایه یک راه برای شروع سریع با هوش مصنوعی مولد است. با این حال، به گفته اولیویه کلاین، کارشناس ارشد خدمات وب آمازون (AWS) آسیا و اقیانوسیه، یک چالش رایج با این رویکرد این است که دادهها ممکن است به صنعتی که در آن کسب و کار در آن فعالیت میکند، مرتبط نباشد.
کلاین گفت که برای موفقیت در استقرار هوش مصنوعی مولد خود، سازمانها باید مدل هوش مصنوعی را با دادههای خود به خوبی تنظیم کنند. شرکتهایی که تلاش میکنند تا این کار را به درستی انجام دهند، با اجرای خود سریعتر پیش خواهند رفت.
او افزود که استفاده از هوش مصنوعی مولد به تنهایی اگر در استراتژی داده و پلتفرم سازمان تعبیه شود، قانعکنندهتر خواهد بود.
او گفت که بسته به مورد استفاده، چالش رایجی که شرکتها با آن روبرو هستند این است که آیا دادههای کافی برای آموزش مدل هوش مصنوعی دارند یا خیر. با این حال، وی خاطرنشان کرد که کمیت داده ها لزوماً با کیفیت داده برابر نیست.
او گفت که حاشیه نویسی داده ها نیز مهم است، همانطور که زمینه را برای مدل های آموزشی هوش مصنوعی به کار می برد، بنابراین سیستم پاسخهایی را ارائه میدهد که بیشتر مختص صنعت کسب و کار است.
با حاشیهنویسی دادهها، اجزای جداگانه دادههای آموزشی برچسبگذاری میشوند تا ماشینهای هوش مصنوعی بتوانند بفهمند دادهها شامل چه چیزهایی هستند و چه اجزایی مهم هستند.
کلاین به یک تصور غلط رایج اشاره کرد که همه سیستم های هوش مصنوعی یکسان هستند، که اینطور نیست. او مجدداً بر لزوم سازمانها برای اطمینان از تغییر مدلهای هوش مصنوعی بر اساس موارد استفاده و همچنین عمودی آنها تأکید کرد.
او گفت که LLMها گفتگوهای زیادی را در میان مشتریان سازمانی در مورد استفاده از هوش مصنوعی مولد در مراکز تماس، به ویژه، به راه انداختهاند. علاقهای به این موضوع وجود دارد که چگونه این فناوری میتواند تجربه را برای نمایندگان تماس افزایش دهد، کسانی که میتوانند به پاسخهای بهتر در حین پرواز دسترسی داشته باشند و آنها را برای بهبود خدمات مشتری ترکیب کنند.
او خاطرنشان کرد که اپراتورهای مرکز تماس می توانند مدل هوش مصنوعی را با استفاده از پایگاه دانش خود، که می تواند شامل چت بات و تعامل با مشتری باشد، آموزش دهند.
طبق گزارش Business Harvard Review، افزودن محتوای خاص دامنه به یک LLMموجود که قبلاً بر روی دانش عمومی و تعامل مبتنی بر زبان آموزش دیده است، معمولاً به دادههای بسیار کمتری نیاز دارد. این رویکرد تنظیم دقیق شامل تنظیم برخی پارامترهای یک مدل پایه است و فقط از صدها یا هزاران سند استفاده می کند، نه میلیونها یا میلیاردها. زمان محاسباتی کمتری نیز در مقایسه با ساخت یک مدل پایه جدید از زمین صفر مورد نیاز است.
هرچند محدودیتهایی وجود دارد. این گزارش خاطرنشان کرد که این رویکرد هنوز هم میتواند گران باشد و به تخصص علم داده نیاز دارد. علاوه بر این، همه ارائهدهندگان LLM، مانند ChatGPT-4 OpenAi، به کاربران اجازه نمیدهند که در بالای برنامههای خود تنظیم دقیق کنند.
کلاین گفت، بهره برداری از دادههای خود همچنین نگرانی مشترک مشتریان را در میان علاقه شدید به هوش مصنوعی مولد برطرف می کند، جایی که کسب و کارها می خواهند کنترل داده های مورد استفاده برای آموزش مدل های هوش مصنوعی را حفظ کنند و داده ها در محیط آنها باقی بماند.
او خاطرنشان کرد: این رویکرد تضمین می کند که هیچ "جعبه سیاه" وجود ندارد و سازمان دقیقاً می داند که از چه داده هایی برای تغذیه مدل هوش مصنوعی استفاده می شود. همچنین شفافیت را تضمین می کند و به ایجاد مسئولیت پذیری هوش مصنوعی کمک می کند.
او گفت همچنین تلاشهای مداومی برای شناسایی سیاستهای مورد نیاز برای جلوگیری از اثر جعبه سیاه وجود دارد و افزود که AWSبا تنظیمکنندهها و سیاستگذاران برای اطمینان از سازگاری محصولات هوش مصنوعی خود کار میکند. این شرکت همچنین به مشتریان کمک می کند تا با پیاده سازی های خود نیز همین کار را انجام دهند.
او گفت، برای مثال، آمازون بستر میتواند سوگیری را تشخیص دهد و محتوایی را که دستورالعملهای اخلاقی هوش مصنوعی را نقض میکند، فیلتر کند. Bedrockمجموعهای از مدلهای پایه است که شامل مدلهای اختصاصی و همچنین مدلهای صنعتی مانند Amazon Titan، Jurassic-2آزمایشگاههای AI21، Claude Anthropicو Stability AIاست.
کلاین پیشبینی میکند که مدلهای داده پایه بیشتری در آینده پدیدار شوند، از جمله مدلهای پایه عمودی خاص، تا سازمانها را با گزینههای بیشتر آموزش دهند.
مشکلات کلیدی برای حل با هوش مصنوعی مولد
در جایی که مدلهای هوش مصنوعی قوی وجود نداشته باشد، انسانها میتوانند پا پس بگذارند.
دینکار برای مسائل نادر یا بسیار خاص محصول، خاطرنشان کرد که تیم متخصصان زراعت Jivaمی توانند با محققان محلی و تیم های میدانی برای حل آنها همکاری کنند.
او گفت که تیم ارزیابی اعتبار این شرکت همچنین داده های تولید شده توسط سیستمهای هوش مصنوعی را با اطلاعات دیگر پوشش می دهد. برای مثال، تیم ممکن است یک بازدید در محل انجام دهد و متوجه شود که یک محصول اخیراً برای برداشت آماده شده است، که سیستم مجهز به هوش مصنوعی ممکن است در هنگام ایجاد ارزیابی اعتبار آن را در نظر نگرفته باشد.
دینکار گفت: "هدف حذف کامل انسانها نیست، بلکه انتقال آنها به مناطقی است که میتوانند افکار تطبیقی را تقویت کنند و [به کار گیرند]، که ماشینها هنوز به آن عمل نکرده اند."
در پاسخ به سوالی درباره چالشهایی که Jivaدر استفاده از هوش مصنوعی مولد خود با آن مواجه شد، به فقدان یک روش استاندارد سریع در بین نسخههای مختلف نرمافزار و ارائهدهندگان اشاره کرد.
او گفت که "همه زبان گرایی واقعی" نیز در LLMوجود ندارد، در حالی که توهم همچنان یک مسئله کلیدی است.
او توضیح داد: «مدلهای مختلف زبان بزرگ، همگی ویژگیهای خاص خود را دارند [و] تکنیکهای سریع یکسان در این موارد کار نمیکنند. به عنوان مثال، از طریق مهندسی سریع پیشرفته، Jivaتوانسته است به ربات کشاورزی خود دستور دهد تا روشن کند که آیا قادر به استنباط از زمینه، محصولی است که کشاورز به آن ارجاع می دهد یا خیر.
با این حال، او گفت، در حالی که این دستور خاص در GPT-3.5عملکرد خوبی داشت، اما در GPT-4به خوبی عمل نکرد. همچنین در LLMمتفاوت کار نمی کند.
دینکار گفت: «ناتوانی در استفاده مجدد از درخواستها در سراسر نسخهها و پلتفرمها، ایجاد مجموعههای سفارشی از تکنیکهای سریع برای هر یک را ضروری میکند. "با بهبود ابزارها و ظهور بهترین روش ها برای ایجاد مدل های مختلف زبانی بزرگ، امیدواریم درخواست های چند پلتفرمی به واقعیت تبدیل شوند."
او گفت که در پشتیبانی بین زبانی نیز به بهبودهایی نیاز است و به پاسخ های عجیبی که ربات چت آن گاهی اوقات خارج از زمینه ایجاد می کند اشاره کرد.
منبع:زدنت