چطور میتوان هوش مصنوعی را مسموم کرد؟_آینده
به گزارش آینده
یک تحقیق مشترک بین انستیتو امنیت هوش مصنوعی انگلیس، انستیتو آلن تورینگ و شرکت هوش مصنوعی آنتروپیک نشان داد نزدیک به ۲۵۰ سند میتوانند یک «در پشتی» تشکیل کنند که علتمیشود مدلهای زبانی بزرگ متنهای نامفهوم تشکیل کنند.
این شکاف از آن جهت دلواپسکننده است که زیاد تر مدلهای زبانی مشهور بر پایه متنهای عمومی در سراسر اینترنت، از جمله وبسایتهای شخصی و پستهای وبلاگی، آموزش دیدهاند. این نوشته جهت میشود هر فردی بتواند محتوایی تشکیل کند که داخل دادههای آموزشی مدلهای هوش مصنوعی شود.
آنتروپیک در یک پست وبلاگی درمورد این نوشته نوشت: عاملان بد میتوانند متنهای خاصی را به این پستها اضافه کنند تا یک مدل رفتارهای خطرناک یا نامطلوب را بیاموزد. این فرایند «مسمومسازی داده» نامیده میشود. یکی از انواع این حملات از طریق «درهای پشتی» انجام میشود. درهای پشتی واژگان خاصی می باشند که رفتاری اختصاصی را در مدل فعال میکنند، رفتاری که در حالت عادی نهان است.
به گفتن مثال، مدلهای زبانی بزرگ امکان پذیر به طوری آلوده شوند که هنگامی مهاجم عبارتی خاص را در ورودی قرار میدهد، دادههای حساس را آشکار کنند. یافتههای این پژوهش نگرانیهایی درمورد امنیت هوش مصنوعی به وجود اورده است و محققان اعتقاد دارند این نوشته میتواند پتانسیل منفعت گیری از این فناوری را در کاربردهای حساس محدود کند.
دسته بندی مطالب
اخبار کسب وکارها