Може ли изкуственият интелект да бъде „отровен“
Източник: iStock/GettyImages
2

И зкуственият интелект (AI) е много популярен в момента и изглежда сякаш е нова, атрактивна технология. Всъщност, това са предимно резултатите на години труд в обучаването и усъвършенстването на досегашните проекти.

Очакванията към AI са много големи. Толкова големи, че да преобърнат и преоткрият цели индустрии и да променят начина на живот на цялото човечество. Това е и голяма отговорност, която логично повдига въпроса за доверието в AI. Как може да сме сигурни, че тези алгоритми ще взимат правилните решения? Може ли да им се повлияе?

И макар да има множество и различни умни алгоритми, които се конкурират помежду си, те имат и много общо помежду си. Най-вече фактът, че практически всички алгоритми разчитат на някаква база данни с информация за конкретната тема, по която са обучавани. AI за разпознаване на обекти в снимки например се нуждае от кадри, за да ги анализира и да се научи как да различава обектите. AI за генериране на текст, както е популярният в момента ChatGPT, има нужда от база данни, която има разнообразна информация, която да използва като отправна точка, за да създава своите идеи.

Именно това може да се окаже слабо звено на AI като цяло – възможността да бъде „отровен“ чрез компрометиране не са алгоритъма, а на данните, с които се обучава. Това предупреждават учени от университета ETCH Zurich, които са направили проучване заедно с експерти от Google, Nvidia и Robust Intelligence, съобщава онлайн изданието IEEE Spectrum.

CAIDP: GPT-4 е опасен и трябва да бъде спрян

Те са открили поне два метода за „отравяне“ на базите данни, което може да повлияе пряко на развитието на изкуствения интелект, който използва тази информация. Добрата новина е, че няма информация методите да са познати на хакери и да са били прилагани.

Лошата е, че атаките са много лесни за реализиране и не изискват големи усилия за реализация. Не е нужно да се компрометира голяма част от базата, за да се изкриви обучението и съответно разбирането на алгоритъма. Един от методите е струвал само 60 долара, за да се „отрови“ 0.01% от две бази данни. Такива атаки може да манипулират AI в различни посоки – например да взима сексистки или расистки решения, да развие други тези и мнения, които са в противоречие с основната му цел и т.н.

Бил Гейтс: Започна ерата на изкуствения интелект

Мъск иска спиране на опитите с изкуствен интелект

Възможно е чрез тези методи и да се внедри „задна врата“ за по-късен достъп до модела и управление на поведението му в последствие. Колкото по-сложен е един алгоритъм и колкото по-голяма цел има, от толкова по-огромна база данни има нужда, за да се обучи. Това пък прави откриването на „отровена“ информация вътре в нея още по-трудно.

Учените препоръчват да се разработят методи за допълнителна защита на базите данни от манипулации. Някои рисковете трудно могат да се предвидят. Например чатботовете често използват събрана от интернет информация. В нея неизменно ще попаднат и фалшиви новини или дори съзнателно компрометирани интернет страници и публикации с цел да подведат AI. Трудно може да се направи верификация на милиони публикации.

ChatGPT застрашава 19% от професиите в САЩ

Въпреки това си струва да се помисли за решения, казват учените. В противен случай има рискове както от гледна точка на по-опасни манипулации, така и чисто търговски опити за подвеждане на изкуствен интелект да предпочита даден бранд повече от друг и съответно да го препоръчва при определени въпрос, казва Флориан Трамер от ETH Zurich.

Наследникът на ChatGPT е още по-умен и "визуален"

Китайският отговор на ChatGPT се казва ERNIE Bot

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Коментари 2
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

2 коментара
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
ГЕРБ предлага Симеон Дянков за председател на Фискалния съвет

ГЕРБ предлага Симеон Дянков за председател на Фискалния съвет

България Преди 3 часа

ГЕРБ - СДС предлага Васил Големански за шеф на КФН, БСП пък предлага Росен Карадимов за шеф на КЗК

Бомби в най-малко пет автобуса в Израел, три избухнаха

Бомби в най-малко пет автобуса в Израел, три избухнаха

Свят Преди 4 часа

Изпратени са големи полицейски сили за издирване на заподозрени

Човек на Тръмп оглави ФБР

Човек на Тръмп оглави ФБР

Свят Преди 5 часа

Начело на бюрото застава верен съмишленик на американския президент

Затварят АМ „Хемус“ тази нощ за ремонта на тунел „Топли дол“

Затварят АМ „Хемус“ тази нощ за ремонта на тунел „Топли дол“

България Преди 5 часа

Превозните средства ще бъдат пренасочени по обходен маршрут по път I-1 Ботевград - София

Мицкоски не каза: България, но я сравни с Русия

Мицкоски не каза: България, но я сравни с Русия

Свят Преди 5 часа

Според него тези "двойни стандарти" създават недоволство

ОИК отстрани кмета на район „Слатина“

ОИК отстрани кмета на район „Слатина“

България Преди 6 часа

По-рано ОИК отстрани от заеманите кметски постове Георги Кузмов от „Оборище“ и Ясен Русев от „Искър“

Доживотен затвор за мексиканец, убил ММА-боец в Хасково

Доживотен затвор за мексиканец, убил ММА-боец в Хасково

България Преди 6 часа

Става дума за предумишлено убийство

<p>НС отхвърли предложение България да напусне СЗО</p>

Здравната комисия в парламента отхвърли прекратяване на споразумението със Световната здравна организация

България Преди 7 часа

Против проекта гласуваха 14 от депутатите, "за" бяха четирима, а двама се въздържаха

Русия: Нямам да приемем войски на НАТО в Украйна

Русия: Нямам да приемем войски на НАТО в Украйна

Свят Преди 7 часа

Песков: Това придобива съвсем различен смисъл от гледна точка на нашата сигурност

Голям пожар в блок в София, евакуираха сградата

Голям пожар в блок в София, евакуираха сградата

България Преди 8 часа

На място има 5 пожарни и 2 линейки

Стрелба с незаконен пистолет рани дете и мъж в Болярино

Стрелба с незаконен пистолет рани дете и мъж в Болярино

България Преди 8 часа

Двамата са настанени в болница, като по данни на лекарите няма опасност за живота им

Задържаха "българския Ескобар" и кокаин за стотици хиляди левове

Задържаха "българския Ескобар" и кокаин за стотици хиляди левове

България Преди 9 часа

ГДБОП арестува над 10 лица, като са повдигнати обвинения на 7 от тях

Vivacom е в ТОП 5 на най-бързоразвиващите се оператори в света за сателитни услуги за бизнеса

Vivacom е в ТОП 5 на най-бързоразвиващите се оператори в света за сателитни услуги за бизнеса

Технологии Преди 9 часа

За първи път телекомът влиза и в класацията Топ 10 на независими доставчици за 2024

По-скъпи винетки и по-високи тол такси предвижда Бюджет 2025

По-скъпи винетки и по-високи тол такси предвижда Бюджет 2025

България Преди 9 часа

Това би означавало, че годишната винетка отново ще струва 97 лева

Ключова промяна във филма за Джеймс Бонд

Ключова промяна във филма за Джеймс Бонд

Любопитно Преди 10 часа

Amazon MGM Studios ще има творчески контрол върху бъдещето на франчайза

Колумбия в криза: Насилие и страх в над 11 региона

Колумбия в криза: Насилие и страх в над 11 региона

Свят Преди 10 часа

Колумбия в тревога заради нарастващото насилие между въоръжени групировки