IBM این کار را با استفاده از دادههای پیشآموزشی از مجموعه دادههای در دسترس عموم، مانندGitHub Code Clean، دادههایStarcoder، مخازن کد عمومی و مشکلاتGitHub انجام داده است. IBM تمام تلاش خود را کرده تا از مشکلات احتمالی کپی رایت یا حقوقی جلوگیری کند.
منبع باز و هوش مصنوعی رابطه ناآرامی دارند. هوش مصنوعی بدون منبع باز نمیتواند وجود داشته باشد، اما تعداد کمی از شرکتها میخواهند برنامههای هوش مصنوعی خود یا مدلهای زبان بزرگ(LLM) را منبع باز کنند. به استثنایIBM که قبلاً مدلهای گرانیتی خود را منبع باز میکرد. اکنون، Big Blue با انتشار آخرین مدلهایGranite AI 3.0 تحت مجوزApache 2.0، هوش مصنوعی منبع باز خود را دو برابر میکند.
چرا سایر شرکتهای بزرگ هوش مصنوعی این کار را انجام ندادهاند؟ یک دلیل بزرگ این است که مجموعه دادههای آنها مملو از دادههای دارای حق چاپ یا سایر دادههای حفاظت شده از مالکیت معنوی است. اگر آنها دادههای خود را باز کنند، خود را نیز به شکایت باز میکنند. به عنوان مثال، نشریاتNews Corp مانند وال استریت ژورنال و نیویورک پست ازPerplexity به دلیل سرقت محتوای آنها شکایت میکنند.
در مقابل، مدلهای گرانیت، LLMهایی هستند که بهطور خاص برای موارد استفاده تجاری طراحی شدهاند و تأکید زیادی بر برنامهنویسی و توسعه نرمافزار دارند. آیبیام ادعا میکند که این مدلهای جدید با سه برابر دادههایی که در اوایل سال جاری عرضه شدند، آموزش داده شدهاند. آنها همچنین دارای انعطافپذیری بیشتر در مدلسازی و پشتیبانی از متغیرهای خارجی و پیشبینیهای متحرک هستند.
به طور خاص، مدلهای زبان جدیدGranite 3.0 8B و 2B بهعنوان مدلهای «اسب کار» برای هوش مصنوعی سازمانی طراحی شدهاند که عملکرد قوی را برای کارهایی مانندRetrieval Augmented Generation (RAG)، طبقهبندی، خلاصهسازی، استخراج موجودیت و استفاده از ابزار ارائه میکنند.
این مدلها در انواعInstruct وGuardian نیز عرضه میشوند. همانطور که از نام آن قول میدهد، به افراد کمک میکند تا یک زبان خاص را یاد بگیرند. Guardian برای شناسایی خطرات در درخواستهای کاربر و پاسخهای هوش مصنوعی طراحی شده است. این امر حیاتی است، زیرا همانطور که بروس شیندلر، کارشناس امنیتی در کنفرانسSecure-Source Software (SOSS) Fusion اشاره کرد، "تزریق [حملات] سریع کار میکند زیرا من دادههای هوش مصنوعی را ارسال میکنم که آن را به عنوان دستور تفسیر میکند" که میتواند منجر شود به پاسخهای فاجعه آمیز.
مدلهای کد گرانیتی از 3 تا 34 میلیارد پارامتر متغیر هستند و بر روی 116 زبان برنامهنویسی و 3 تا 4 ترابایت توکن آموزش دیدهاند که دادههای کد گسترده و مجموعه دادههای زبان طبیعی را ترکیب میکنند. این مدلها از طریق چندین پلتفرم از جملهHugging Face، GitHub، Watsonx.ai متعلق بهIBM و هوش مصنوعیRed Hat Enterprise Linux (RHEL) قابل دسترسی هستند. مجموعهای از مدلهایGranite 3.0 نیز درOlama وReplicate موجود است.
علاوه بر این، IBM نسخه جدیدی ازWatsonx Code Assistant خود را برای توسعه اپلیکیشن منتشر کرده است. در آنجا، Granite کمک برنامهنویسی همهمنظوره را در زبانهایی مانندC، C++، Go، Java وPython با قابلیتهای پیشرفته مدرنسازی اپلیکیشن برای برنامههای جاوای سازمانی ارائه میکند. قابلیتهای کد گرانیت اکنون از طریق پسوندVisual Studio Code، IBM Granite.Code قابل دسترسی است.
مجوز آپاچی 2.0 امکان استفاده تحقیقاتی و تجاری را نیز فراهم میکند، که در مقایسه با سایرLLMهای اصلی، که ممکن است ادعا کنند منبع باز هستند اماLLM های خود را با محدودیتهای تجاری مرتبط می کنند، مزیت قابل توجهی است. بارزترین مثال از آن لاما متا است.
با در دسترس قرار دادن این مدلها، IBM موانع ورود برای توسعه و استفاده از هوش مصنوعی را کاهش میدهد. IBM همچنین با دلیل بر این باور است که از آنجایی که آنها واقعاً منبع باز هستند، توسعه دهندگان و محققان میتوانند به سرعت مدلها را ساخته و بهبود بخشند.
IBM همچنین ادعا میکند که این مدلها میتوانند عملکردی قابل مقایسه با مدلهای بسیار بزرگتر و بسیار گرانتر ارائه دهند.
منبع
هفته گذشته، AP گزارش داد که یک محقق در دانشگاه میشیگان "در هشت رونوشت صوتی از هر 10 رونویسی صوتی که بررسی کرده بود" که توسطWhisper در طول مطالعه جلسات عمومی تهیه شده بود، توهم پیدا کرد.
به طور جداگانه، یک مهندس که 100 ساعت رونویسیWhisper را بررسی نموده بهAP گفت که تقریباً در 50٪ آنها توهم پیدا کرده است، در حالی که توسعه دهنده دیگری تقریباً در هر متنی که با استفاده ازWhisper تولید نمود، توهمات را کشف کرده که در مجموع به 26000 میرسد.
در حالی که کاربران همیشه میتوانند انتظار داشته باشند که رونویسکنندههای هوش مصنوعی یک کلمه یا املایی را اینجا و آنجا اشتباه بگیرند، محققان خاطرنشان کردند که آنها «هرگز ابزار رونویسی مجهز به هوش مصنوعی دیگری به اندازهWhisper توهم ندیدهاند».
OpenAI میگویدWhisper، یک شبکه عصبی منبع باز، "به استحکام و دقت در سطح انسانی در تشخیص گفتار انگلیسی نزدیک میشود." این به طور گسترده در چندین صنعت برای انواع رایج تشخیص گفتار، از جمله رونویسی و ترجمه مصاحبهها و ایجاد زیرنویسهای ویدئویی، ادغام شده است.
این سطح از همه جا میتواند به سرعت متن ساختگی، نقل قولهای نادرست نسبت داده شده و اختراع شده و سایر اطلاعات نادرست را در چندین رسانه منتشر کند، که میتواند بر اساس ماهیت مطالب اصلی از نظر اهمیت متفاوت باشد. به گفتهAP، Whisper در برخی از نسخههایChatGPT، در مراکز تماس، دستیارهای صوتی و پلتفرمهای ابریOracle وMicrosoft تعبیه شده است و ماه گذشته بیش از 4.2 میلیون بار ازHuggingFace دانلود شده است.
کارشناسان بهAP گفتند، نکته نگرانکنندهتر این است که متخصصان پزشکی به طور فزایندهای از «ابزارهای مبتنی برWhisper» برای رونویسی مشاورههای بیمار و پزشک استفاده میکنند. AP با بیش از 12 مهندس، محقق و توسعهدهنده مصاحبه کرد که تأیید کردندWhisper عبارات و جملات کاملی را در متن رونویسی ساخته است، که برخی از آنها «میتواند شامل تفسیر نژادی، لفاظیهای خشونتآمیز و حتی درمانهای پزشکی خیالی باشد».
آلوندرا نلسون، استاد مؤسسه مطالعات پیشرفته، میگوید: هیچ کس خواهان تشخیص اشتباه نیست.
OpenAI ممکن است از موارد استفاده پزشکی حمایت نکرده باشد. این شرکت توصیه میکند "در مقابل استفاده در حوزههای پرخطر مانند زمینههای تصمیمگیری، جایی که نقص در دقت میتواند منجر به نقصهای آشکار در نتایج شود" باید دقت کرد اما قرار دادن این ابزار در بازار و تبلیغ دقت آن به این معنی است که احتمالاً توسط چندین صنعت که تلاش میکنند بدون توجه به خطرات احتمالی، کار را تسریع بخشند و کارآیی ایجاد کنند.
به گزارش آسوشیتدپرس، دانشمندان کامپیوتر اخیراً برخی از توهمات را در نمونههای صوتی کوتاه و واضح یافتهاند. محققان بهAP گفتند که این روند "به دهها هزار رونویسی معیوب در میلیون ها ضبط منجر میشود."
به گزارش آسوشیتدپرس، «تشخیص کامل این مشکل دشوار است، اما محققان و مهندسان گفتند که اغلب در کار خود با توهمات ویسپر مواجه شدهاند». علاوه بر این، همانطور که کریستین ووگلر، مدیر برنامه دسترسی به فناوری دانشگاه گالودت و ناشنوا است، خاطرنشان کرد، کسانی که ناشنوا یا کم شنوا هستند نمیتوانند توهمات "پنهان شده در میان این همه متن دیگر" را ببینند.
یافتههای محققان نشاندهنده یک مشکل گستردهتر در صنعت هوش مصنوعی است: ابزارها برای کسب سود خیلی سریع به بازار عرضه میشوند، بهویژه در حالی که ایالات متحده هنوز مقررات مناسب هوش مصنوعی را ندارد. این همچنین با توجه به بحثهای جاریOpenAI در مقابل غیرانتفاعی و پیشبینیهای اخیر رهبری که خطرات هوش مصنوعی را در نظر نمیگیرند، مرتبط است.
AP نوشت: «سخنگویOpenAI گفت که این شرکت به طور مداوم در حال مطالعه چگونگی کاهش توهمات است و از یافتههای محققان قدردانی میکند و اضافه کرد کهOpenAI بازخورد را در بهروزرسانیهای مدل گنجانده است.
منبع
حدود 57 درصد از افرادی که امسال برای گزارش اتحادFIDO مورد بررسی قرار گرفتند، از کلیدهای عبور آگاه هستند، در حالی که فقط دو سال پیش 39 درصد افزایش داشت.
آیا شروع به استفاده از کلیدهای عبور(Passkeys) برای بیشتر حسابهای آنلاین خود کردهاید؟ طبق یک نظرسنجی جدید ازFIDO Alliance، آگاهی و پذیرش کلیدهای عبور(Passkeys) از زمان معرفی دو سال پیش افزایش یافته است.
برای چهارمین بارومتر احراز هویت آنلاین سالانه، اتحادFIDO بهSapio Research دستور داد تا یک نظرسنجی آنلاین در ماه آگوست برای دریافت بازخورد در مورد کلیدهای عبور، رمزهای عبور و امنیت آنلاین انجام دهد. این نظرسنجی به 10000 مصرف کننده در سراسر ایالات متحده، بریتانیا، فرانسه، آلمان، استرالیا، سنگاپور، ژاپن، کره جنوبی، هند و چین رسید.
بیش از نیمی (57٪) از افراد شرکت کننده در نظرسنجی گفتند که از کلیدهای عبور آگاه هستند، در مقایسه با 39٪ که در سال 2022 از آنها اطلاع داشتند. تنها 16٪ از پاسخ دهندگان گفتند که از کلیدهای عبور بیاطلاع هستند که در مقایسه با 28٪ در دو سال گذشته کاهش یافته است. قبل در میان کسانی که میدانند رمز عبور چیست، 62٪ گفتند که از آنها برای ایمن کردن حسابهای وب سایت و برنامه خود استفاده میکنند.
در همان زمان، استفاده از رمز عبور کاهش یافته است. میانگین درصد پاسخ دهندگانی که در دو ماه گذشته رمز عبور را به صورت دستی وارد کردهاند از 38 درصد در سال 2022 به 28 درصد در سال جاری کاهش یافته است. نیاز به وارد کردن دستی رمز عبور در سایتها و برنامههای مختلف از جمله خدمات مالی، حسابهای کاری، اجتماعی کاهش یافته است. حسابهای رسانهای، سرویسهای رسانه و جریان و دستیارهای خانه هوشمند.
دارن گوچیونه، مدیرعامل و یکی از بنیانگذارانKeeper Security گفت: «افراد با استفاده از کلیدهای عبور در روالهای دیجیتالی خود، بیشتر از کلیدهای عبور آگاه میشوند و امنیت سایبری شخصی خود را در اولویت قرار میدهند.
"کلیدهای عبور با استفاده از رمزنگاری کلید عمومی کار میکنند، که در آن هر رمز عبور شامل یک کلید خصوصی است که به صورت محلی در دستگاهی که برای ایجاد رمز عبور استفاده کردهاید و همچنین یک کلید عمومی که با شرکتی که حساب خود را با آن ساختهاید ذخیره میشود. این بدان معنی است که حتی در صورت وجود نقض، مجرمان سایبری فقط میتوانند به کلید عمومی دسترسی داشته باشند که اساساً بدون کلید خصوصی بیفایده است."
امنیت یکی از اصلیترین دلایلی است که مردم به سمت کلیدهای عبور و دوری از رمز عبور جذب میشوند. کلیدهای عبور معمولاً به نوعی از احراز هویت بیومتریک متکی هستند که نسبت به رمزهای عبور ایمنتر و کمتر قابل هک است.
در پاسخ به این سوال که کدام روشهای احراز هویت را امنترین روش میدانند، 29 درصد از شرکتکنندگان در نظرسنجی بیومتریک را نام بردند. فقط 15 درصد به رمز عبور پیچیده ای اشاره کردند که فقط آنها آن را به خاطر میسپارند، در حالی که 14 درصد به رمز عبور یک بار مصرفی که به دستگاه تلفن همراهشان ارسال شده اشاره کردند.
روشهایی که کمتر ایمن در نظر گرفته میشوند عبارتند از تکمیل فرم خودکار مرورگر برای وارد کردن رمز عبور، برنامه احراز هویت، مدیر رمز عبور، کلید امنیتی فیزیکی و کدQR. پاسخ دهندگان همچنین این روشها را به همان ترتیبی که روش ترجیحی خود برای ورود به حسابهای خود ذکر کردند، ذکر کردند.
جیسون سوروکو، عضو ارشدSectigo، گفت: «گذرواژهها به همراه تأیید هویت چند عاملی(MFA) از نظر سختتر کردن زندگی مهاجم، نوار را بالاتر میگذارند، اما کامل نیستند.
"کلیدهای عبور به خلاص شدن از شر اسرار مشترکی که برای احراز هویت استفاده میکنیم کمک میکند و ما را به دنیایی نزدیک میکند که در آن احراز هویت ما بر اساس اسرار نامتقارن است [کلیدهای خصوصی که برای رمزگذاری و رمزگشایی دادهها استفاده میشود]. ماهیت اسرار نامتقارن این است که سختتر هستند. برای برداشت، چه از طریق مهندسی اجتماعی و چه از طریق یک نقطه پایانی در معرض خطر."
بر اساس نظرسنجی، کلاهبرداریها و تهدیدهای آنلاین بیشتر نگران کننده برای مصرف کنندگان است. بیش از نیمی (53 درصد) از شرکت کنندگان در نظرسنجی گفتند که در سال جاری شاهد افزایش پیام های مشکوک و کلاهبرداریهای آنلاین بودهاند.
برخی از مناطقی که به عنوان خطرناکتر ذکر شدهاند عبارتند از پیامهایSMS، ایمیل، تلفن و پیامهای صوتی، رسانههای اجتماعی، پیامرسانی فوری، پیامرسان فیسبوک، تبلیغات جعلی و مقالات جعلی. علاوه بر این، بیش از نیمی از آنها گفته اند که در مورد پیام های مشکوک شاهد پیچیدگی بیشتری بودهاند.
اندرو شیکیار، مدیر عاملFIDO Alliance در بیانیهای مطبوعاتی گفت: وقتی مصرف کنندگان از کلیدهای عبور اطلاع دارند، از آنها استفاده میکنند.
"به طور هیجان انگیزی، 20 درصد از 100 وب سایت و سرویس برتر جهان در حال حاضر از کلیدهای عبور پشتیبانی میکنند. از آنجایی که صنعت تلاشهای خود را برای آموزش و پیادهسازی تا حد امکان سادهتر میکند، ما از برندهای بیشتری میخواهیم که با ما همکاری کنند تا کلیدهای عبور را برای مصرف کنندگان در دسترس قرار دهند. سرعت استقرار و استفاده از رمز عبور قرار است در 12 ماه آینده شتاب بیشتری بگیرد و ما مشتاق هستیم که به برندها و مصرف کنندگان کمک کنیم تا این تغییر را انجام دهند.
منبع