‫ fars_sakha بلاگ

IBM این کار را با استفاده از داده‌های پیش‌آموزشی از مجموعه داده‌های در دسترس عموم، مانندGitHub Code Clean، داده‌هایStarcoder، مخازن کد عمومی و مشکلاتGitHub انجام داده است. IBM تمام تلاش خود را کرده تا از مشکلات احتمالی کپی رایت یا حقوقی جلوگیری کند.

منبع باز و هوش مصنوعی رابطه ناآرامی دارند. هوش مصنوعی بدون منبع باز نمی‌تواند وجود داشته باشد، اما تعداد کمی از شرکت‌ها می‌خواهند برنامه‌های هوش مصنوعی خود یا مدل‌های زبان بزرگ(LLM) را منبع باز کنند. به استثنایIBM که قبلاً مدل‌های گرانیتی خود را منبع باز می‌کرد. اکنون، Big Blue با انتشار آخرین مدل‌هایGranite AI 3.0 تحت مجوزApache 2.0، هوش مصنوعی منبع باز خود را دو برابر می‌کند.

چرا سایر شرکت‌های بزرگ هوش مصنوعی این کار را انجام نداده‌اند؟ یک دلیل بزرگ این است که مجموعه داده‌های آن‌ها مملو از داده‌های دارای حق چاپ یا سایر داده‌های حفاظت شده از مالکیت معنوی است. اگر آنها داده‌های خود را باز کنند، خود را نیز به شکایت باز می‌کنند. به عنوان مثال، نشریاتNews Corp مانند وال استریت ژورنال و نیویورک پست ازPerplexity به دلیل سرقت محتوای آنها شکایت می‌کنند.

در مقابل، مدل‌های گرانیت، LLM‌هایی هستند که به‌طور خاص برای موارد استفاده تجاری طراحی شده‌اند و تأکید زیادی بر برنامه‌نویسی و توسعه نرم‌افزار دارند. آی‌بی‌ام ادعا می‌کند که این مدل‌های جدید با سه برابر داده‌هایی که در اوایل سال جاری عرضه شدند، آموزش داده شده‌اند. آنها همچنین دارای انعطاف‌پذیری بیشتر در مدل‌سازی و پشتیبانی از متغیرهای خارجی و پیش‌بینی‌های متحرک هستند.

به طور خاص، مدل‌های زبان جدیدGranite 3.0 8B و 2B به‌عنوان مدل‌های «اسب کار» برای هوش مصنوعی سازمانی طراحی شده‌اند که عملکرد قوی را برای کارهایی مانندRetrieval Augmented Generation (RAG)، طبقه‌بندی، خلاصه‌سازی، استخراج موجودیت و استفاده از ابزار ارائه می‌کنند.

این مدل‌ها در انواعInstruct وGuardian نیز عرضه می‌شوند. همانطور که از نام آن قول می‌دهد، به افراد کمک می‌کند تا یک زبان خاص را یاد بگیرند. Guardian برای شناسایی خطرات در درخواست‌های کاربر و پاسخ‌های هوش مصنوعی طراحی شده است. این امر حیاتی است، زیرا همانطور که بروس شیندلر، کارشناس امنیتی در کنفرانسSecure-Source Software (SOSS) Fusion اشاره کرد، "تزریق [حملات] سریع کار می‌کند زیرا من داده‌های هوش مصنوعی را ارسال می‌کنم که آن را به عنوان دستور تفسیر می‌کند"  که می‌تواند منجر شود به پاسخ‌های فاجعه آمیز.

مدل‌های کد گرانیتی از 3 تا 34 میلیارد پارامتر متغیر هستند و بر روی 116 زبان برنامه‌نویسی و 3 تا 4 ترابایت توکن آموزش دیده‌اند که داده‌های کد گسترده و مجموعه داده‌های زبان طبیعی را ترکیب می‌کنند. این مدل‌ها از طریق چندین پلتفرم از جملهHugging Face، GitHub، Watsonx.ai متعلق بهIBM و هوش مصنوعیRed Hat Enterprise Linux (RHEL) قابل دسترسی هستند. مجموعه‌ای از مدل‌هایGranite 3.0 نیز درOlama وReplicate موجود است.

علاوه بر این، IBM نسخه جدیدی ازWatsonx Code Assistant خود را برای توسعه اپلیکیشن منتشر کرده است. در آنجا، Granite کمک برنامه‌نویسی همه‌منظوره را در زبان‌هایی مانندC، C++، Go، Java وPython با قابلیت‌های پیشرفته مدرن‌سازی اپلیکیشن برای برنامه‌های جاوای سازمانی ارائه می‌کند. قابلیت‌های کد گرانیت اکنون از طریق پسوندVisual Studio Code، IBM Granite.Code قابل دسترسی است.

مجوز آپاچی 2.0 امکان استفاده تحقیقاتی و تجاری را نیز فراهم می‌کند، که در مقایسه با سایرLLM‌های اصلی، که ممکن است ادعا کنند منبع باز هستند اماLLM های خود را با محدودیت‌های تجاری مرتبط می کنند، مزیت قابل توجهی است. بارزترین مثال از آن لاما متا است.

با در دسترس قرار دادن این مدل‌ها، IBM موانع ورود برای توسعه و استفاده از هوش مصنوعی را کاهش می‌دهد. IBM همچنین با دلیل بر این باور است که از آنجایی که آنها واقعاً منبع باز هستند، توسعه دهندگان و محققان می‌توانند به سرعت مدل‌ها را ساخته و بهبود بخشند.

IBM همچنین ادعا می‌کند که این مدل‌ها می‌توانند عملکردی قابل مقایسه با مدل‌های بسیار بزرگ‌تر و بسیار گران‌تر ارائه دهند.

منبع

زدنت

 

هفته گذشته، AP گزارش داد که یک محقق در دانشگاه میشیگان "در هشت رونوشت صوتی از هر 10 رونویسی صوتی که بررسی کرده بود" که توسطWhisper در طول مطالعه جلسات عمومی تهیه شده بود، توهم پیدا کرد.

 به طور جداگانه، یک مهندس که 100 ساعت رونویسیWhisper را بررسی نموده بهAP گفت که تقریباً در 50٪ آنها توهم پیدا کرده است، در حالی که توسعه دهنده دیگری تقریباً در هر متنی که با استفاده ازWhisper تولید نمود، توهمات را کشف کرده که در مجموع به 26000 می‌رسد

در حالی که کاربران همیشه می‌توانند انتظار داشته باشند که رونویس‌کننده‌های هوش مصنوعی یک کلمه یا املایی را اینجا و آنجا اشتباه بگیرند، محققان خاطرنشان کردند که آنها «هرگز ابزار رونویسی مجهز به هوش مصنوعی دیگری به اندازهWhisper توهم ندیده‌اند».

OpenAI می‌گویدWhisper، یک شبکه عصبی منبع باز، "به استحکام و دقت در سطح انسانی در تشخیص گفتار انگلیسی نزدیک می‌شود." این به طور گسترده در چندین صنعت برای انواع رایج تشخیص گفتار، از جمله رونویسی و ترجمه مصاحبه‌ها و ایجاد زیرنویس‌های ویدئویی، ادغام شده است.

این سطح از همه جا می‌تواند به سرعت متن ساختگی، نقل قول‌های نادرست نسبت داده شده و اختراع شده و سایر اطلاعات نادرست را در چندین رسانه منتشر کند، که می‌تواند بر اساس ماهیت مطالب اصلی از نظر اهمیت متفاوت باشد. به گفتهAP، Whisper در برخی از نسخه‌هایChatGPT، در مراکز تماس، دستیارهای صوتی و پلتفرم‌های ابریOracle وMicrosoft تعبیه شده است و ماه گذشته بیش از 4.2 میلیون بار ازHuggingFace دانلود شده است.

کارشناسان بهAP گفتند، نکته نگران‌کننده‌تر این است که متخصصان پزشکی به طور فزاینده‌ای از «ابزارهای مبتنی برWhisper» برای رونویسی مشاوره‌های بیمار و پزشک استفاده می‌کنند. AP با بیش از 12 مهندس، محقق و توسعه‌دهنده مصاحبه کرد که تأیید کردندWhisper عبارات و جملات کاملی را در متن رونویسی ساخته است، که برخی از آنها «می‌تواند شامل تفسیر نژادی، لفاظی‌های خشونت‌آمیز و حتی درمان‌های پزشکی خیالی باشد».

آلوندرا نلسون، استاد مؤسسه مطالعات پیشرفته، می‌گوید: ‌هیچ کس خواهان تشخیص اشتباه نیست.

OpenAI ممکن است از موارد استفاده پزشکی حمایت نکرده باشد. این شرکت توصیه می‌کند "در مقابل استفاده در حوزه‌های پرخطر مانند زمینه‌های تصمیم‌گیری، جایی که نقص در دقت می‌تواند منجر به نقص‌های آشکار در نتایج شود" باید دقت کرد اما قرار دادن این ابزار در بازار و تبلیغ دقت آن به این معنی است که احتمالاً توسط چندین صنعت که تلاش می‌کنند بدون توجه به خطرات احتمالی، کار را تسریع بخشند و کارآیی ایجاد کنند.

 به گزارش آسوشیتدپرس، دانشمندان کامپیوتر اخیراً برخی از توهمات را در نمونه‌های صوتی کوتاه و واضح یافته‌اند. محققان بهAP گفتند که این روند "به ده‌ها هزار رونویسی معیوب در میلیون ها ضبط منجر می‌شود."

به گزارش آسوشیتدپرس، «تشخیص کامل این مشکل دشوار است، اما محققان و مهندسان گفتند که اغلب در کار خود با توهمات ویسپر مواجه شده‌اند». علاوه بر این، همانطور که کریستین ووگلر، مدیر برنامه دسترسی به فناوری دانشگاه گالودت و ناشنوا است، خاطرنشان کرد، کسانی که ناشنوا یا کم شنوا هستند نمی‌توانند توهمات "پنهان شده در میان این همه متن دیگر" را ببینند.

یافته‌های محققان نشان‌دهنده یک مشکل گسترده‌تر در صنعت هوش مصنوعی است: ابزارها برای کسب سود خیلی سریع به بازار عرضه می‌شوند، به‌ویژه در حالی که ایالات متحده هنوز مقررات مناسب هوش مصنوعی را ندارد. این همچنین با توجه به بحث‌های جاریOpenAI در مقابل غیرانتفاعی و پیش‌بینی‌های اخیر رهبری که خطرات هوش مصنوعی را در نظر نمی‌گیرند، مرتبط است.

AP نوشت: «سخنگویOpenAI گفت که این شرکت به طور مداوم در حال مطالعه چگونگی کاهش توهمات است و از یافته‌های محققان قدردانی می‌کند و اضافه کرد کهOpenAI بازخورد را در به‌روزرسانی‌های مدل گنجانده است.

منبع

زدنت

 

حدود 57 درصد از افرادی که امسال برای گزارش اتحادFIDO مورد بررسی قرار گرفتند، از کلیدهای عبور آگاه هستند، در حالی که فقط دو سال پیش 39 درصد افزایش داشت.

آیا شروع به استفاده از کلیدهای عبور(Passkeys) برای بیشتر حساب‌های آنلاین خود کرده‌اید؟  طبق یک نظرسنجی جدید ازFIDO Alliance، آگاهی و پذیرش کلیدهای عبور(Passkeys) از زمان معرفی دو سال پیش افزایش یافته است.

برای چهارمین بارومتر احراز هویت آنلاین سالانه، اتحادFIDO بهSapio Research دستور داد تا یک نظرسنجی آنلاین در ماه آگوست برای دریافت بازخورد در مورد کلیدهای عبور، رمزهای عبور و امنیت آنلاین انجام دهد. این نظرسنجی به 10000 مصرف کننده در سراسر ایالات متحده، بریتانیا، فرانسه، آلمان، استرالیا، سنگاپور، ژاپن، کره جنوبی، هند و چین رسید.

بیش از نیمی (57٪) از افراد شرکت کننده در نظرسنجی گفتند که از کلیدهای عبور آگاه هستند، در مقایسه با 39٪ که در سال 2022 از آنها اطلاع داشتند. تنها 16٪ از پاسخ دهندگان گفتند که از کلیدهای عبور بی‌اطلاع هستند که در مقایسه با 28٪ در دو سال گذشته کاهش یافته است. قبل در میان کسانی که می‌دانند رمز عبور چیست، 62٪ گفتند که از آنها برای ایمن کردن حساب‌های وب سایت و برنامه خود استفاده می‌کنند.

در همان زمان، استفاده از رمز عبور کاهش یافته است. میانگین درصد پاسخ دهندگانی که در دو ماه گذشته رمز عبور را به صورت دستی وارد کرده‌اند از 38 درصد در سال 2022 به 28 درصد در سال جاری کاهش یافته است. نیاز به وارد کردن دستی رمز عبور در سایت‌ها و برنامه‌های مختلف از جمله خدمات مالی، حساب‌های کاری، اجتماعی کاهش یافته است. حساب‌های رسانه‌ای، سرویس‌های رسانه و جریان‌ و دستیارهای خانه هوشمند.

دارن گوچیونه، مدیرعامل و یکی از بنیان‌گذارانKeeper Security گفت: «افراد با استفاده از کلیدهای عبور در روال‌های دیجیتالی خود، بیشتر از کلیدهای عبور آگاه می‌شوند و امنیت سایبری شخصی خود را در اولویت قرار می‌دهند.

"کلیدهای عبور با استفاده از رمزنگاری کلید عمومی کار می‌کنند، که در آن هر رمز عبور شامل یک کلید خصوصی است که به صورت محلی در دستگاهی که برای ایجاد رمز عبور استفاده کرده‌اید‌ و همچنین یک کلید عمومی که با شرکتی که حساب خود را با آن ساخته‌اید ذخیره می‌شود. این بدان معنی است که حتی در صورت وجود نقض، مجرمان سایبری فقط می‌توانند به کلید عمومی دسترسی داشته باشند که اساساً بدون کلید خصوصی بی‌فایده است."

امنیت یکی از اصلی‌ترین دلایلی است که مردم به سمت کلیدهای عبور و دوری از رمز عبور جذب می‌شوند. کلیدهای عبور معمولاً به نوعی از احراز هویت بیومتریک متکی هستند که نسبت به رمزهای عبور ایمن‌تر و کمتر قابل هک است.

در پاسخ به این سوال که کدام روش‌های احراز هویت را امن‌ترین روش می‌دانند، 29 درصد از شرکت‌کنندگان در نظرسنجی بیومتریک را نام بردند. فقط 15 درصد به رمز عبور پیچیده ای اشاره کردند که فقط آنها آن را به خاطر می‌سپارند، در حالی که 14 درصد به رمز عبور یک بار مصرفی که به دستگاه تلفن همراهشان ارسال شده اشاره کردند.

روش‌هایی که کمتر ایمن در نظر گرفته می‌شوند عبارتند از تکمیل فرم خودکار مرورگر برای وارد کردن رمز عبور، برنامه احراز هویت، مدیر رمز عبور، کلید امنیتی فیزیکی و کدQR. پاسخ دهندگان همچنین این روش‌ها را به همان ترتیبی که روش ترجیحی خود برای ورود به حساب‌های خود ذکر کردند، ذکر کردند.

جیسون سوروکو، عضو ارشدSectigo، گفت: «گذرواژه‌ها به همراه تأیید هویت چند عاملی(MFA) از نظر سخت‌تر کردن زندگی مهاجم، نوار را بالاتر می‌گذارند، اما کامل نیستند.

"کلیدهای عبور به خلاص شدن از شر اسرار مشترکی که برای احراز هویت استفاده می‌کنیم کمک می‌کند و ما را به دنیایی نزدیک می‌کند که در آن احراز هویت ما بر اساس اسرار نامتقارن است [کلیدهای خصوصی که برای رمزگذاری و رمزگشایی داده‌ها استفاده می‌شود]. ماهیت اسرار نامتقارن این است که سخت‌تر هستند. برای برداشت، چه از طریق مهندسی اجتماعی و چه از طریق یک نقطه پایانی در معرض خطر."

بر اساس نظرسنجی، کلاهبرداری‌ها و تهدیدهای آنلاین بیشتر نگران کننده برای مصرف کنندگان است. بیش از نیمی (53 درصد) از شرکت کنندگان در نظرسنجی گفتند که در سال جاری شاهد افزایش پیام های مشکوک و کلاهبرداری‌های آنلاین بوده‌اند.

برخی از مناطقی که به عنوان خطرناک‌تر ذکر شده‌اند عبارتند از پیام‌هایSMS، ایمیل، تلفن و پیام‌های صوتی، رسانه‌های اجتماعی، پیام‌رسانی فوری، پیام‌رسان فیسبوک، تبلیغات جعلی و مقالات جعلی. علاوه بر این، بیش از نیمی از آنها گفته اند که در مورد پیام های مشکوک شاهد پیچیدگی بیشتری بوده‌اند.

اندرو شیکیار، مدیر عاملFIDO Alliance در بیانیه‌ای مطبوعاتی گفت: ‌وقتی مصرف کنندگان از کلیدهای عبور اطلاع دارند، از آنها استفاده می‌کنند.

"به طور هیجان انگیزی، 20 درصد از 100 وب سایت و سرویس برتر جهان در حال حاضر از کلیدهای عبور پشتیبانی می‌کنند. از آنجایی که صنعت تلاش‌های خود را برای آموزش و پیاده‌سازی تا حد امکان ساده‌تر می‌کند، ما از برندهای بیشتری می‌خواهیم که با ما همکاری کنند تا کلیدهای عبور را برای مصرف کنندگان در دسترس قرار دهند. سرعت استقرار و استفاده از رمز عبور قرار است در 12 ماه آینده شتاب بیشتری بگیرد و ما مشتاق هستیم که به برندها و مصرف کنندگان کمک کنیم تا این تغییر را انجام دهند.

منبع

زدنت