Какво е promptware? Произход, определение...

Какво е promptware? Произход, определение, опасности и мерки за защита

Ако по какъвто и да е начин сте близо до ИТ сферата в днешно време — в най-широкия смисъл на този термин — “промпт” вероятно е нещо, което чувате по-често, отколкото ви се иска. С появата на големите езикови модели (LLM), често наричани ИИ, тази проста дума излезе на преден план, тъй като чрез подаване на промпт потребителят казва на тези модели какво да направят и какъв да е резултатът.

Обхватът на изкуствения интелект във всички аспекти на нашето ежедневие нараства. Дори ако отчетете маркетинговите трикове, които експлоатират понятието за ИИ, когато всъщност няма такъв, разпространението на технологията е впечатляващо. И това прави нещата по-естествени и полезни: да пишете или изговаряте заявки (промпти) на обикновен език и те да бъдат изпълнявани е удобно преживяване в повечето случаи.

Разбира се, тази монета има и обратна страна. Изглежда, че колкото по-умна е системата, толкова повече входни точки предлага на злонамерени лица и толкова по-голяма вреда те могат да нанесат, щом поемат контрол. А един от начините да се стигне дотам е чрез разгръщане на promptware атака.

И така, какво е promptware?

Терминът promptware е въведен от група китайски изследователи в тяхната статия “Promptware Engineering: Software Engineering for LLM Prompt Development” (публикувана на 4 март 2025 г.), която, както подсказва заглавието, разглежда промптването като инструмент за програмиране, използваем с LLM, и предлага формализиране на promptware инженерството в самостоятелна дисциплина със собствена методология и система.

Заплахата от promptware атаки

Друго скорошно изследване, озаглавено “Invitation is All You Need,” показа как всъщност работи promptware атака. Накратко, екипът зад тази публикация успя да измами Gemini на Google да върши куп вредни неща, от объркване на настройките на смарт дома, през експлоатиране на онлайн екосистемата (разпращане на спам, генериране на токсично съдържание, изтриване на събития в календара, извличане на имейли и т.н.), до проследяване на местоположението на потребителя. ИИ бе принуден да направи всичко това чрез обикновена покана в календар; оказва се, че (всяко?) действие, което потребителят предприеме в отговор на подобно събитие, например да каже на Gemini да изпрати благодарствено писмо, може да бъде спусък, който отключва злонамерени инструкции, вградени в заглавието на поканата. Казват, че това работи и с теми на имейли.

Prompt hacking (injection, hijacking) срещу promptware атака

Възможно е да сте чували за prompt hacking, injection или hijacking преди (тези понятия до голяма степен са взаимозаменяеми и се различават в някои по-сложни специфики). Как тази техника се различава от promptware атака?

Prompt hacking представлява създаване на промпти по начин, който позволява манипулиране на LLM към нежелано или вредно поведение. В промпта се вграждат инструкции, предназначени да заобиколят/прескочат вградените ограничения на ИИ. Терминът се появи през 2022 г.; днес е обобщаващ етикет за злонамерени опити да се накарат моделите на ИИ да правят неща, за които не са предназначени.

Promptware атака описва тип атаки, които експлоатират промпти на естествен език, използвани като програмен интерфейс, с цел контрол върху поведението на LLM. Тя е по-дълбока и по-широка от prompt hacking или injection и всъщност може да включва тази техника като един от компонентите на каскадна атака. Promptware атаките са следващата еволюционна стъпка на злонамерени дейности, насочени към компрометиране и експлоатация на интегрирани ИИ екосистеми.

Как да се защитите от promptware атаки

Prompt injection не е нещо ново, което означава, че разработчиците на ИИ системи вече са създали защитни решения, способни да отблъснат и promptware атаки. Освен това има нови правила за дигитална хигиена, които помагат да се предотвратят всякакви неблагоприятни развития.

Избирайте доставчици на ИИ с добра репутация. Да, гореспоменатият експеримент експлоатира Gemini на Google, но подобни уроци обикновено се научават бързо. Ако искате да оборудвате дома си с асистент, задвижван от ИИ, изберете доставчици, които са прецизни в защитата на клиентите си.
Защитете системата от неоторизиран достъп. Повечето конфигурации за смарт дом и други потребителски системи, разчитащи на LLM, позволяват настройване на нивото на сигурност от разхлабено до строго. Изберете строгото, дори ако това ограничава възможностите на въпросната система.
Защитете всичко останало от ИИ. Днес повечето софтуер иска да научи възможно най-много за вас, тъй като подобна информация може да се монетизира. Системите, задвижвани от LLM, вероятно ще се държат по сходен начин, независимо от предназначението им. Прилагайте принципа за най-малка привилегия: ограничете достъпа на ИИ само до данните или контролите, необходими за конкретната задача, за която е внедрен.
Наблюдавайте взаимодействията и поведението на ИИ. Всяка сериозна система пази дневници (логове) (ако не го прави, това е червен флаг); преглеждайте ги от време на време и не се колебайте поне да проверите онлайн подозрителни записи или, още по-добре, да се свържете с поддръжката и да попитате какво е положението.
Поддържайте активни само необходимите функции. В контекста на смарт дом, например, може вече да не ви е нужен автоматичен хранилник за котка. Когато се отървете от физическото устройство, не забравяйте да го изключите и от ИИ.

В случай че става дума за информация, която можете да изгубите чрез promptware атака, има смисъл да внедрите надежден план за архивиране. Прочетете тези публикации за съвети и софтуерни препоръки: