چطور می‌توان هوش مصنوعی را مسموم کرد؟

چطور می‌توان هوش مصنوعی را مسموم کرد؟_آینده


به گزارش آینده

 یک تحقیق مشترک بین انستیتو امنیت هوش مصنوعی انگلیس، انستیتو آلن تورینگ و شرکت هوش مصنوعی آنتروپیک نشان داد نزدیک به ۲۵۰ سند می‌توانند یک «در پشتی» تشکیل کنند که علتمی‌شود مدل‌های زبانی بزرگ متن‌های نامفهوم تشکیل کنند.

این شکاف از آن جهت دلواپس‌کننده است که زیاد تر مدل‌های زبانی مشهور بر پایه متن‌های عمومی در سراسر اینترنت، از جمله وب‌سایت‌های شخصی و پست‌های وبلاگی، آموزش دیده‌اند. این نوشته جهت می‌شود هر فردی بتواند محتوایی تشکیل کند که داخل داده‌های آموزشی مدل‌های هوش مصنوعی شود.

آنتروپیک در یک پست وبلاگی درمورد این نوشته نوشت: عاملان بد می‌توانند متن‌های خاصی را به این پست‌ها اضافه کنند تا یک مدل رفتارهای خطرناک یا نامطلوب را بیاموزد. این فرایند «مسموم‌سازی داده» نامیده می‌شود. یکی از انواع این حملات از طریق «درهای پشتی» انجام می‌شود. درهای پشتی واژگان خاصی می باشند که رفتاری اختصاصی را در مدل فعال می‌کنند، رفتاری که در حالت عادی نهان است.

به گفتن مثال، مدل‌های زبانی بزرگ امکان پذیر به طوری آلوده شوند که هنگامی مهاجم عبارتی خاص را در ورودی قرار می‌دهد، داده‌های حساس را آشکار کنند. یافته‌های این پژوهش نگرانی‌هایی درمورد امنیت هوش مصنوعی به وجود اورده است و محققان اعتقاد دارند این نوشته می‌تواند پتانسیل منفعت گیری از این فناوری را در کاربردهای حساس محدود کند.

دسته بندی مطالب
اخبار کسب وکارها

خبرهای ورزشی

خبرهای اقتصادی

اخبار فرهنگی

تازه‌ترین اخبار و تحلیل‌ها درباره انتخابات، سیاست، اقتصاد، ورزش، حوادث، فرهنگ وهنر و گردشگری را در آینده دنبال کنید.

اخبار تکنولوژی

اخبار پزشکی