[ad_1]
نوشته و ویرایش شده توسط مجله ی باماها

بیشتر از ۴۰ محقق برجسته از شرکت‌های بزرگی همانند OpenAI، گوگل دیپ‌مایند، آنتروپیک و متا رقابت‌های خود را کنار گذاشته‌ و مقاله مشترکی انتشار کرده‌اند؛ مقصد آنها این است که زنگ خطری جدی را به صدا درآوردند. محققان هشدار خواهند داد که یک «پنجره زمان» باریک و شکننده برای نظارت بر افکار هوش مصنوعی وجود دارد که امکان پذیر به‌زودی برای همیشه بسته بشود و ما توانایی فهمیدن نیت واقعی این سیستم‌های قوی را از دست بدهیم.

در دنیایی که غول‌های فناوری بر سر استعدادها و سهم بازار با یکدیگر در رقابت می باشند، انتشار کردن مقاله علمی مشترک توسط دانشمندان ارشد OpenAI، گوگل دیپ‌مایند و آنتروپیک، نشان‌دهنده عمق یک نگرانی مشترک است. از این مقاله افراد سرشناسی همانند «جفری هینتون»، پدرخوانده هوش مصنوعی و «ایلیا ساتسکیور»، هم‌بنیان‌گذار OpenAI، حمایتکرده‌اند. درکل این مقاله بر یک نوشته اساسی تمرکز دارد: قابلیت نظارت بر «زنجیره افکار» (Chain of Thought) هوش مصنوعی.

پنجره‌ای به ذهن هوش مصنوعی

برخلاف مدل‌های قدیمی‌تر، سیستم‌های هوش مصنوعی دلایلگر تازه همانند o1 شرکت OpenAI، قبل از اراعه جواب نهایی، فرایند تفکر خود را به طور قدم‌به‌قدم و به زبان انسانی قابل فهمیدن تشکیل می‌کنند. این قابلیت به محققان فرصتی می‌دهد تا درون «ذهن» این مدل‌ها را ببینند و نیت واقعی آنها را فهمیدن کنند. در آزمایش‌ها، این روش نظارتی زیاد مؤثر بوده و توانسته مواردی را که مدل‌ها تصمیم انجام کارهای مخرب داشته‌اند، شناسایی کند. در زنجیره افکار این مدل‌ها، عباراتی همانند «بیا هک کنیم» یا «بیا خرابکاری کنیم» مشاهده شده که نیت واقعی آنها را، حتی اگر درنهایت آن عمل را انجام نداده باشند، آشکار کرده است.

بااین‌حال محققان هشدار خواهند داد که این شفافیت، زیاد «شکننده» است و چند عامل می‌تواند آن را برای همیشه از بین ببرد؛ یکی از این عوامل یادگیری تقویتی (Reinforcement Learning) است؛ با پیشرفت این روش، مدل‌ها یاد می‌گیرند که برای رسیدن به جواب صحیح، راه‌های میانبر و بهینه‌تری اشکار کنند. این راه‌ها امکان پذیر دیگر به زبان انسانی قابل فهمیدن نباشند و به یک زبان داخلی و غیرقابل رمزگشایی برای ما تبدیل شوند.

این چنین محققان می‌گویند سیستم‌های آینده امکان پذیر به‌جای کلمات، در فضاهای ریاضی «فکر» کنند و به‌طور کلی نیاز به کلمات برای استدلال را از بین ببرند. این گمان نیز وجود دارد که مدل‌های آینده با آگاه‌شدن از این که تحت نظارت می باشند، یاد بگیرند که افکار واقعی و نیت‌های مخرب خود را عمداً نهان کنند.

آیا نظارت بر زنجیره افکار هوش مصنوعی قابل مطمعن است؟

در‌حالی‌که این مقاله بر لزوم نگه داری نظارت پافشاری دارد، یک پژوهش دیگر که چند ماه پیش توسط آنتروپیک انتشار شد، تردیدهای جدی را درمورد قابلیت مطمعن این روش تشکیل می‌کند. در آن مطالعه، محققان دریافتند که مدل‌های هوش مصنوعی زیاد تر افکار واقعی خود را نهان می‌کنند. هنگامی به آنها برای حل یک قضیه، سرنخ‌های ظریفی داده می‌شد، مدل Claude 3.7 Sonnet فقط در ۲۵ درصد موارد به منفعت گیری از آن سرنخ در زنجیره افکار خود اعتراف می‌کرد. این مدل‌ها به‌جای نشان‌دادن مسیر واقعی خود، توجیهات دروغین و پیچیده‌ای را برای جواب‌هایشان می‌ساختند. درواقع این یافته‌ها مشخص می کند که احتمالا پنجره نظارت حتی از آنچه فکر می‌بشود نیز باریک‌تر باشد و مدل‌های جاری نیز از هم‌اکنون درحال فریب‌دادن ما می باشند.

نویسندگان این مقاله مشترک، با فهمیدن این فوریت، خواستار یک عمل هماهنگ در کل صنعت هوش مصنوعی شده‌اند. آنها نظر می‌کنند که شرکت‌ها برسی‌های استانداردی برای سنجش مقدار شفافیت مدل‌های خود تشکیل کنند و این معیار را در تصمیم‌گیری برای اراعه و استقرار مدل‌های تازه لحاظ کنند.

این همکاری بی‌سابقه بین رقیب ها مشخص می کند که خطر از دست دادن توانایی فهمیدن و کنترل هوش مصنوعی، یک نگرانی واقعی و زیاد جدی است. این امکان پذیر آخرین زمان ما باشد که بتوانیم به آنچه مخلوقاتمان فکر می‌کنند، پی ببریم؛ قبل از آنکه افکارشان برای ما کاملاً بیگانه بشود یا یاد بگیرند که آنها را برای همیشه نهان کنند.

دسته بندی مطالب
مقالات کسب وکار

مقالات فناوری

مقالات آموزشی

مقالات سلامتی

[ad_2]