Microsoft се опитва да направи по-трудно за хората да заблуждават чатботове с изкуствен интелект (ИИ) да правят странни неща.
В Azure AI Studio, услуга, базирана на OpenAI, която позволява на разработчиците да създават персонализирани асистенти с изкуствен интелект, използвайки собствените си данни, се вграждат нови функции за безопасност, съобщи компанията от Редмънд, Вашингтон, в публикация в блога си в четвъртък.
Инструментите включват "щитове за подбуди", които са предназначени за откриване и блокиране на умишлени опити - известни също като атаки за инжектиране на подбуди или пробиви на защитата - да се накара моделът на ИИ да се държи по непредвиден начин. Microsoft се занимава и с "индиректни подбудителни инжекции", когато хакери вкарват злонамерени инструкции в данните, по които е обучен даден модел, и го подмамват да извърши такива неразрешени действия като кражба на потребителска информация или превземане на система.
Такива атаки са "уникално предизвикателство и заплаха", казва Сара Бърд, главен продуктов директор на Microsoft за отговорен изкуствен интелект. Новите защити са проектирани така, че да откриват подозрителни входни данни и да ги блокират в реално време.
Microsoft желае да повиши доверието в своите инструменти за генеративен изкуствен интелект, които вече се използват както от потребители, така и от корпоративни клиенти. През февруари компанията разследва инциденти, свързани с нейния чатбот Copilot, който генерираше отговори, вариращи от странни до вредни. След като разгледа инцидентите, Microsoft заяви, че потребителите умишлено са се опитали да заблудят Copilot да генерира отговорите.
"Въпреки това не може да се разчита само на модела", каза тя.
Четете повече в bloombergtv.bg.
Снимка: БГНЕС
АПС с очакване вотът на недоверие да е успешен
Украйна потвърди: Неизвестни дронове са преследвали самолета на Зеленски
Ванс: САЩ се надява на "добри новини“ за уреждането на конфликта в Украйна
За първи път: Бебе бенгалски тигър се роди в зоопарка в Стара Загора
Минимално инвазивна естетика - с нарастваща тенденция
Жълт кантарион – действие и приложение и лекарствени взаимодействия
Гастропареза след вирусна инфекция
Национално проучване проследява пътя на пациента с рак на белия дроб в България
Телескопът Hubble е заснел отново междузвездната комета 3I/ATLAS
Проби от въздуха, събрани преди 35 г., разкриват забележима промяна в сезоните
Мощни бури в едното полукълбо генерират перести облаци в другото
Antares събра $96 млн. за разработване на ядрени реактори за Земята и Космоса
Осем пострадали при тежка катастрофа край Абланица
Борисов: Помолих Теменужка Петкова да махне от бюджета това, което искаха бизнесът и синдикатите
Желязков: Тази година България има два пъти по-висок икономически растеж от средния за Европа
Защитата на Благомир Коцев оспорва размера на паричната гаранция от 200 000 лв.
Днес във Варна ще бъдат връчени наградите "Доброволец на годината"
Цената на биткойна е с 30% надолу от рекордния си връх и това е напълно нормално
Toyota изненада с напълно електрически концептуален суперавтомобил
Пред шести вот на недоверие: Кабинетът "Желязков" няма да подава оставка
Германските фабрични поръчки скачат заради 87% ръст в транспортния сектор