Microsoft се опитва да направи по-трудно за хората да заблуждават чатботове с изкуствен интелект (ИИ) да правят странни неща.
В Azure AI Studio, услуга, базирана на OpenAI, която позволява на разработчиците да създават персонализирани асистенти с изкуствен интелект, използвайки собствените си данни, се вграждат нови функции за безопасност, съобщи компанията от Редмънд, Вашингтон, в публикация в блога си в четвъртък.
Инструментите включват "щитове за подбуди", които са предназначени за откриване и блокиране на умишлени опити - известни също като атаки за инжектиране на подбуди или пробиви на защитата - да се накара моделът на ИИ да се държи по непредвиден начин. Microsoft се занимава и с "индиректни подбудителни инжекции", когато хакери вкарват злонамерени инструкции в данните, по които е обучен даден модел, и го подмамват да извърши такива неразрешени действия като кражба на потребителска информация или превземане на система.
Такива атаки са "уникално предизвикателство и заплаха", казва Сара Бърд, главен продуктов директор на Microsoft за отговорен изкуствен интелект. Новите защити са проектирани така, че да откриват подозрителни входни данни и да ги блокират в реално време.
Microsoft желае да повиши доверието в своите инструменти за генеративен изкуствен интелект, които вече се използват както от потребители, така и от корпоративни клиенти. През февруари компанията разследва инциденти, свързани с нейния чатбот Copilot, който генерираше отговори, вариращи от странни до вредни. След като разгледа инцидентите, Microsoft заяви, че потребителите умишлено са се опитали да заблудят Copilot да генерира отговорите.
"Въпреки това не може да се разчита само на модела", каза тя.
Четете повече в bloombergtv.bg.
Снимка: БГНЕС
Експерти: Няма да е приятно да видим наполовина банковите си сметки
Надежда Йорданова: Най-добре е изборите да бъдат проведени през март
"Билд": Скоро ще пристигнат нови милиарди евромонети от България
Вежди Рашидов: Аз ще защитавам Борисов
Чрез микропластмасата се разпространяват опасни бактерии
Клиника по неврохирургия в УМБАЛ „Св. Иван Рилски“ отпразнува своята 20-годишнина
Защо се будим малко преди алармата?
Наследствена ли е шизофренията?
На повърхността на луната на Юпитер – Европа, е забелязан гигантски черен „паяк“
Лунната почва може да съдържа следи от земната атмосфера
Антитела, проектирани от изкуствен интелект, ще бъдат тествани на хора
Признаци за бъдеща катастрофа в Антарктида
До дни ще се родят първите бебета, създадени с помощта на изкуствен интелект
Какви защити имат евробанкнотите и как да разпознаем истинските?
Броят на чужденците в Европа се увеличава, нужни са за работна ръка
Какво вещаят звездите за 2026 година?
Една от най-известните медии в света: Намаля ентусиазма от приемането на еврото в България
Ръководството на лекарския съюз получи мандат да подпише нов рамков договор за 2026-2028 г.
Baidu запълва празнината, която Nvidia остави на пазара на AI чипове в Китай
Cartier е новият Rolex за поколението Z благодарение на Тейлър Суифт
Парижкото споразумение за климата навърши 10 години, но мисията е далеч от изпълнена