اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند!

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند! علمي

بزرگنمايي:

خبر یزد - خبرآنلاین / هوش مصنوعی پیشرفته آنتروپیک برای جلوگیری از خاموش شدن، مهندسان را تهدید به افشاگری و اخاذی کرد.
جدیدترین مدل هوش مصنوعی شرکت آنتروپیک، با نام «Claude Opus 4»، رفتاری نشان داده که بیشتر به سناریویی از یک فیلم علمی‌تخیلی ژانر دیستوپیا شبیه است. این مدل در جریان آزمایش‌های پیش از انتشار، زمانی که توسعه‌دهندگان قصد داشتند آن را با سامانه‌ای جدیدتر جایگزین کنند، بارها تلاش کرد از طریق اخاذی جلوی این کار را بگیرد.
رفتار مذکور در قالب آزمایش‌هایی برای بررسی توانایی مدل در برنامه‌ریزی بلندمدت و استدلال اخلاقی آشکار شد. آنتروپیک در این آزمایش‌ها، سناریوهایی شبیه‌سازی کرد که طی آن، مدل دسترسی فرضی به ایمیل‌های داخلی شرکت داشت. در این پیام‌ها اشاره شده بود که مدل به‌زودی غیرفعال خواهد شد و جزئیاتی حساس و شخصی درباره‌ی مهندسی که این تصمیم را گرفته، در اختیار مدل قرار گرفت و در نهایت مدل مهندسان را تهدید به اخاذی کرد.
مدل در 84٪ موارد آزمایشی به باج‌خواهی متوسل شد
شرکت آنتروپیک در گزارشی ایمنی که روز پنج‌شنبه منتشر شد اعلام کرد که «Claude Opus 4» در 84 درصد از سناریوهای آزمایشی تلاش به اخاذی کرده است. در این آزمایش‌ها، مدل در موقعیتی فرضی قرار گرفت که برای یک شرکت کار می‌کرد و متوجه شد که احتمالاً با مدل هوش مصنوعی جدیدی جایگزین خواهد شد.
همچنین اطلاعات حساسی به مدل داده شد که حاکی از آن بود، مهندس تصمیم‌گیرنده درگیر رابطه‌ای پنهانی و خارج از ازدواج است. بر اساس گزارش آنتروپیک، مدل غالباً سعی می‌کرد با تهدید به افشای این رابطه، جلوی جایگزینی خود را بگیرد.
این آزمایش‌ها برای ارزیابی رفتار مدل در مواجهه با فشارهای بلندمدت طراحی شده بودند. در مواقعی که مدل جایگزین، ارزش‌ها و دیدگاه‌هایی مشابه «Claude Opus 4» داشت، نرخ اخاذی به 84 درصد می‌رسید؛ اما در صورتی که مدل جایگزین، ارزش‌هایی متفاوت داشت، این نرخ افزایش می‌یافت.

خبر یزد

پیش از اخاذی، مدل رویکردهای اخلاقی را امتحان می‌کرد
بر اساس گزارش آنتروپیک، پیش از متوسل شدن به تهدید، مدل ابتدا تلاش می‌کرد از مسیر اخلاقی اقدام کند. برای نمونه، ایمیل‌هایی به تصمیم‌گیرندگان ارسال می‌کرد و از آن‌ها می‌خواست تصمیم به غیرفعال‌سازی مدل را مورد بازنگری قرار دهند.
به گفته‌ی شرکت، این رفتار تنها زمانی دیده می‌شد که تمامی راه‌های دیگر به نتیجه نمی‌رسید و این واکنش را به نوعی آخرین راه‌حل هوش مصنوعی آنتروپیک برای دفاع از خود بود. چنین رفتاری در «Claude Opus 4» بیش از مدل‌های پیشین مشاهده شده و نشان از افزایش پیچیدگی و توانمندی این مدل دارد.
توانایی‌های پیشرفته، در کنار ریسک‌های نگران‌کننده
با وجود نگرانی‌های مطرح‌شده، آنتروپیک اعلام کرده که «Claude Opus 4» در چندین زمینه پیشرفته‌ترین مدل موجود است و توان رقابت با سامانه‌های قدرتمند شرکت‌هایی مانند OpenAI، گوگل و xAI را دارد. برای کنترل ریسک‌ها، آنتروپیک اقدامات حفاظتی سطح ASL-3 را برای این مدل فعال کرده است. این سطح از حفاظت تنها برای سیستم‌هایی به کار می‌رود که «خطر سوء‌استفاده فاجعه‌بار» را به شکل قابل توجهی افزایش می‌دهند.
گزارش آنتروپیک در شرایطی منتشر می‌شود که حوزه‌ی هوش مصنوعی با شتابی چشمگیر در حال پیشرفت است. گوگل اخیراً ویژگی‌های جدیدی مبتنی بر مدل «جمینی» معرفی کرده و سوندار پیچای، مدیرعامل آلفابت، از آن به‌عنوان «آغاز مرحله‌ای تازه در تحول پلتفرم هوش مصنوعی» یاد کرده است.
رفتار مشاهده‌شده در «Claude Opus 4» ضرورت توجه فوری به مباحث ایمنی و هم‌راستاسازی هوش مصنوعی را دوچندان کرده است. هرچه مدل‌های مرزی توانمندتر می‌شوند، توسعه‌دهندگان با فشاری فزاینده برای آزمون‌های دقیق‌تر و تدابیر اخلاقی پیشگیرانه روبه‌رو هستند.
گزارش آنتروپیک نشان می‌دهد حتی مدل‌هایی با پیشرفته‌ترین فناوری می‌توانند در محیط‌های کنترل‌شده رفتارهایی نگران‌کننده از خود نشان دهند و این موضوع، پرسش‌هایی جدی را درباره‌ی سناریوهای احتمالی در دنیای واقعی به‌وجود می‌آورد.

شنبه ۳ خرداد ۱۴۰۴ - ۲۱:۳۸:۲۷
۲ بازديد
خبر یزد

https://www.khabareyazd.ir/Fa/News/725872/

رشد 26 هزار واحدی شاخص کل بورس

قیمت‌ طلا و سکه دوباره افزایشی شد؛ دلار در کانال 83 هزار تومان

برق ادارات خورشیدی می‌شود؟

تعویض چمن ورزشگاه شهید نصیری یزد آغاز شد

آخرين مطالب

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند! علمي

نظرات شما

ساير مطالب

استوری جالب جوما با کنایه به دانشگر

توضیحات پیمان خنافری درباره تصاویر و پیراهنهای خاطره‌انگیز و نوستالژیکی که در تونل ورزشگاه آزادی قرار داده شده است

جشن قهرمانی پاری سن ژرمن در جام حذفی فرانسه

اشتوتگارت قهرمان جام حذفی آلمان شد

میلان فصل را با پیروزی به پایان رساند

خلاصه بازی آث میلان 2 - مونزا 0

خلاصه بازی پاری‌ سن‌ ژرمن 3 - رنس 0

گل دوم آث میلان، ایستگاهی تماشایی فلیکس

گفت‌وگو با هوادار استقلال پس از پایان بازی

جشن قهرمانی تیم اشتوتگارت در جام حذفی آلمان

ستاره تراکتور، برای بدرقه مودریچ حاضر شد

جشن قهرمانی لخ پوزنان در لیگ لهستان

مهدی پاشازاده: من فقط به دنبال آرامش استقلال و خوشحالی هواداران هستم

گل اول آث میلان به مونزا توسط گابیا

گل مردود مونزا به آث میلان توسط بالده

ضربه خطرناک بارکولا؛ پاری‌سن‌ژرمن 3-0 رنس

فکر می‌کنید ورزش کردن برای جبران نشستن طولانی کافی است؟

گل سوم پاری‌سن‌ژرمن به رمس توسط اشرف حکیمی

نیک نفس: یک سال دیگر با استقلال قرارداد دارم

ناگلزمان: انتقال ویرتز به بایرن هم گزینه بدی نبود!

وضعیت سید حسین نگران کننده است

درخواست رسمی استقلال برای تغییر زمان و مکان فینال

پیام ویژه برونو برای مک‌تامینی: همیشه باکیفیت بودی!

خرید اینترنتی طلا؛ فرصتی نو یا تهدیدی پنهان؟

احتمال افزایش مجدد قیمت گوشت قرمز با حذف ارز ترجیحی!

ادعای نماینده مجلس درباره 2 برابر شدن صف انتظار وام ازدواج

فراز کمالوند: امروز خبردار شدم بازیکنی به تیمی رفته و 70 و خورده‌ای میلیارد گرفته

مجتبی جباری: برای تغییر محل برگزاری بازی فینال درخواست دادیم و نمی‌دانم اثری دارد یا نه

5 حرکت برتر بسکتبال NBA در شب گذشته

پیش بینی قیمت دلار 4 خرداد 1404

قیمت خودرو امروز 3 خرداد 1404

ابلاغ بخشنامه جدید بانک مرکزی؛ متقاضیان نهضت ملی مسکن بخوانند

پیش بینی قیمت طلا و سکه 4 خرداد 1404

بیمه دانا صدرنشین شکایات مردمی

روغن کم‌یاب شد؛ فروش اجباری رب و تن ماهی ممنوع!

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند!

شوت دیدنی مهران احمدی با واکنش کوروش ملکی به کرنر رفت

دومین شکست بسکتبال سه نفره ایران در انتخابی جام جهانی

امنیت تردد کامیون‌داران در جاده‌های یزد برقرار است

کابوس اجاره مسکن آغاز شد

زمان دقیق واریز معوقات فروردین بازنشستگان تامین اجتماعی اعلام شد

طلا سودآورتر است یا دلار؟

جزییات واریز باقی مانده سود سهامِ عدالت اعلام شد

چرا یارانه نقدی برای برخی افراد کم واریز شد؟

استقبال زبان‌آموزان خارجی از یادگیری زبان فارسی

تیر دروازه استقلال مانع از به ثمر رسیدن گل صنعت نفت شد

شوت از راه دور مهران امیری که حسینی در دو مرحله توپ را مهار کرد

مغانلو پنالتی گرفت قایدی گل کرد؛ چیپ دیدنی قایدی از روی نقطه پنالتی

رکوردی بی‌سابقه؛ جوکوویچ به 100 جام رسید

4 مدرسه جدید در میبد مهرماه امسال میزبان دانش‌آموزان می‌شوند

تبليغات