[ad_1]
نوشته و ویرایش شده توسط مجله ی باماها
بیشتر از ۴۰ محقق برجسته از شرکتهای بزرگی همانند OpenAI، گوگل دیپمایند، آنتروپیک و متا رقابتهای خود را کنار گذاشته و مقاله مشترکی انتشار کردهاند؛ مقصد آنها این است که زنگ خطری جدی را به صدا درآوردند. محققان هشدار خواهند داد که یک «پنجره زمان» باریک و شکننده برای نظارت بر افکار هوش مصنوعی وجود دارد که امکان پذیر بهزودی برای همیشه بسته بشود و ما توانایی فهمیدن نیت واقعی این سیستمهای قوی را از دست بدهیم.
در دنیایی که غولهای فناوری بر سر استعدادها و سهم بازار با یکدیگر در رقابت می باشند، انتشار کردن مقاله علمی مشترک توسط دانشمندان ارشد OpenAI، گوگل دیپمایند و آنتروپیک، نشاندهنده عمق یک نگرانی مشترک است. از این مقاله افراد سرشناسی همانند «جفری هینتون»، پدرخوانده هوش مصنوعی و «ایلیا ساتسکیور»، همبنیانگذار OpenAI، حمایتکردهاند. درکل این مقاله بر یک نوشته اساسی تمرکز دارد: قابلیت نظارت بر «زنجیره افکار» (Chain of Thought) هوش مصنوعی.
پنجرهای به ذهن هوش مصنوعی
برخلاف مدلهای قدیمیتر، سیستمهای هوش مصنوعی دلایلگر تازه همانند o1 شرکت OpenAI، قبل از اراعه جواب نهایی، فرایند تفکر خود را به طور قدمبهقدم و به زبان انسانی قابل فهمیدن تشکیل میکنند. این قابلیت به محققان فرصتی میدهد تا درون «ذهن» این مدلها را ببینند و نیت واقعی آنها را فهمیدن کنند. در آزمایشها، این روش نظارتی زیاد مؤثر بوده و توانسته مواردی را که مدلها تصمیم انجام کارهای مخرب داشتهاند، شناسایی کند. در زنجیره افکار این مدلها، عباراتی همانند «بیا هک کنیم» یا «بیا خرابکاری کنیم» مشاهده شده که نیت واقعی آنها را، حتی اگر درنهایت آن عمل را انجام نداده باشند، آشکار کرده است.
بااینحال محققان هشدار خواهند داد که این شفافیت، زیاد «شکننده» است و چند عامل میتواند آن را برای همیشه از بین ببرد؛ یکی از این عوامل یادگیری تقویتی (Reinforcement Learning) است؛ با پیشرفت این روش، مدلها یاد میگیرند که برای رسیدن به جواب صحیح، راههای میانبر و بهینهتری اشکار کنند. این راهها امکان پذیر دیگر به زبان انسانی قابل فهمیدن نباشند و به یک زبان داخلی و غیرقابل رمزگشایی برای ما تبدیل شوند.
این چنین محققان میگویند سیستمهای آینده امکان پذیر بهجای کلمات، در فضاهای ریاضی «فکر» کنند و بهطور کلی نیاز به کلمات برای استدلال را از بین ببرند. این گمان نیز وجود دارد که مدلهای آینده با آگاهشدن از این که تحت نظارت می باشند، یاد بگیرند که افکار واقعی و نیتهای مخرب خود را عمداً نهان کنند.
آیا نظارت بر زنجیره افکار هوش مصنوعی قابل مطمعن است؟
درحالیکه این مقاله بر لزوم نگه داری نظارت پافشاری دارد، یک پژوهش دیگر که چند ماه پیش توسط آنتروپیک انتشار شد، تردیدهای جدی را درمورد قابلیت مطمعن این روش تشکیل میکند. در آن مطالعه، محققان دریافتند که مدلهای هوش مصنوعی زیاد تر افکار واقعی خود را نهان میکنند. هنگامی به آنها برای حل یک قضیه، سرنخهای ظریفی داده میشد، مدل Claude 3.7 Sonnet فقط در ۲۵ درصد موارد به منفعت گیری از آن سرنخ در زنجیره افکار خود اعتراف میکرد. این مدلها بهجای نشاندادن مسیر واقعی خود، توجیهات دروغین و پیچیدهای را برای جوابهایشان میساختند. درواقع این یافتهها مشخص می کند که احتمالا پنجره نظارت حتی از آنچه فکر میبشود نیز باریکتر باشد و مدلهای جاری نیز از هماکنون درحال فریبدادن ما می باشند.

نویسندگان این مقاله مشترک، با فهمیدن این فوریت، خواستار یک عمل هماهنگ در کل صنعت هوش مصنوعی شدهاند. آنها نظر میکنند که شرکتها برسیهای استانداردی برای سنجش مقدار شفافیت مدلهای خود تشکیل کنند و این معیار را در تصمیمگیری برای اراعه و استقرار مدلهای تازه لحاظ کنند.
این همکاری بیسابقه بین رقیب ها مشخص می کند که خطر از دست دادن توانایی فهمیدن و کنترل هوش مصنوعی، یک نگرانی واقعی و زیاد جدی است. این امکان پذیر آخرین زمان ما باشد که بتوانیم به آنچه مخلوقاتمان فکر میکنند، پی ببریم؛ قبل از آنکه افکارشان برای ما کاملاً بیگانه بشود یا یاد بگیرند که آنها را برای همیشه نهان کنند.
دسته بندی مطالب
مقالات کسب وکار
[ad_2]