Може ли изкуственият интелект да бъде „отровен“
Източник: iStock/GettyImages

И зкуственият интелект (AI) е много популярен в момента и изглежда сякаш е нова, атрактивна технология. Всъщност, това са предимно резултатите на години труд в обучаването и усъвършенстването на досегашните проекти.

Очакванията към AI са много големи. Толкова големи, че да преобърнат и преоткрият цели индустрии и да променят начина на живот на цялото човечество. Това е и голяма отговорност, която логично повдига въпроса за доверието в AI. Как може да сме сигурни, че тези алгоритми ще взимат правилните решения? Може ли да им се повлияе?

И макар да има множество и различни умни алгоритми, които се конкурират помежду си, те имат и много общо помежду си. Най-вече фактът, че практически всички алгоритми разчитат на някаква база данни с информация за конкретната тема, по която са обучавани. AI за разпознаване на обекти в снимки например се нуждае от кадри, за да ги анализира и да се научи как да различава обектите. AI за генериране на текст, както е популярният в момента ChatGPT, има нужда от база данни, която има разнообразна информация, която да използва като отправна точка, за да създава своите идеи.

Именно това може да се окаже слабо звено на AI като цяло – възможността да бъде „отровен“ чрез компрометиране не са алгоритъма, а на данните, с които се обучава. Това предупреждават учени от университета ETCH Zurich, които са направили проучване заедно с експерти от Google, Nvidia и Robust Intelligence, съобщава онлайн изданието IEEE Spectrum.

CAIDP: GPT-4 е опасен и трябва да бъде спрян

Те са открили поне два метода за „отравяне“ на базите данни, което може да повлияе пряко на развитието на изкуствения интелект, който използва тази информация. Добрата новина е, че няма информация методите да са познати на хакери и да са били прилагани.

Лошата е, че атаките са много лесни за реализиране и не изискват големи усилия за реализация. Не е нужно да се компрометира голяма част от базата, за да се изкриви обучението и съответно разбирането на алгоритъма. Един от методите е струвал само 60 долара, за да се „отрови“ 0.01% от две бази данни. Такива атаки може да манипулират AI в различни посоки – например да взима сексистки или расистки решения, да развие други тези и мнения, които са в противоречие с основната му цел и т.н.

Бил Гейтс: Започна ерата на изкуствения интелект

Мъск иска спиране на опитите с изкуствен интелект

Възможно е чрез тези методи и да се внедри „задна врата“ за по-късен достъп до модела и управление на поведението му в последствие. Колкото по-сложен е един алгоритъм и колкото по-голяма цел има, от толкова по-огромна база данни има нужда, за да се обучи. Това пък прави откриването на „отровена“ информация вътре в нея още по-трудно.

Учените препоръчват да се разработят методи за допълнителна защита на базите данни от манипулации. Някои рисковете трудно могат да се предвидят. Например чатботовете често използват събрана от интернет информация. В нея неизменно ще попаднат и фалшиви новини или дори съзнателно компрометирани интернет страници и публикации с цел да подведат AI. Трудно може да се направи верификация на милиони публикации.

ChatGPT застрашава 19% от професиите в САЩ

Въпреки това си струва да се помисли за решения, казват учените. В противен случай има рискове както от гледна точка на по-опасни манипулации, така и чисто търговски опити за подвеждане на изкуствен интелект да предпочита даден бранд повече от друг и съответно да го препоръчва при определени въпрос, казва Флориан Трамер от ETH Zurich.

Наследникът на ChatGPT е още по-умен и "визуален"

Китайският отговор на ChatGPT се казва ERNIE Bot

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
<p>Оставиха за постоянно в ареста Жоро Мазния</p>

Оставиха за постоянно в ареста Жоро Мазния, опитал да открадне жилището на възрастна жена

България Преди 6 минути

Съдът счита, че той може да извърши друго престъпление, както и да повлияе на свидетели, които предстои да бъдат разпитани

<p>20 чата в Signal: Екипът на Майк Уолц под прицел</p>

Екипът на Майк Уолц има най-малко 20 чата в Signal за обсъждане на националната сигурност

Свят Преди 18 минути

Чатове обхващат политиката спрямо Украйна, Китай, Газа, Близкия изток, Африка и Европа

Тръгна делото за измама с тролейбуси във Враца

Тръгна делото за измама с тролейбуси във Враца

България Преди 40 минути

Става въпрос за обществена поръчка по проект на стойност 4,5 милиона евро

Как да увеличите шансовете на детето си за прием в градина или ясла

Как да увеличите шансовете на детето си за прием в градина или ясла

България Преди 57 минути

15 хиляди родители се борят за 13 хиляди места в София

Радев: С Георги Марков си отива частица от легендарното поколение на българския рок

Радев: С Георги Марков си отива частица от легендарното поколение на българския рок

България Преди 1 час

Държавният глава изрази съболезнования на семейството и колегите на музиканта

,

Обясниха как ще се пресмята втората пенсия в евро

България Преди 1 час

Осигурените ще виждат парите си и в двете валути за известен период

<p>Най-богатата жена в света за 2025 г</p>

Алис Уолтън: Новата най-богата жена в света с 101 милиарда долара

Свят Преди 1 час

Уолтън е най-новият член на „Клуба на стомилиардерите“

"Ще ми липсваш...": Шер отдаде почит на бившия си Вал Килмър

"Ще ми липсваш...": Шер отдаде почит на бившия си Вал Килмър

Любопитно Преди 1 час

Звездата от "Топ Гън", който водеше дълга битка с рак на гърлото, си отиде във вторник

Снимката е архивна

Парламентът одобри стратегическа сделка за ВМС: новите патрулни кораби получават високотехнологична комуникационна защита

България Преди 1 час

Системите Link-22 ще осигурят на българските Военноморски сили защитен обмен на тактически данни с НАТО. Сделката на стойност 1,4 млн. долара включва оборудване, обучение и техническа поддръжка

<p>Фехтовачка дисквалифицирана за протест срещу транссексуален опонент&nbsp;</p>

Фехтовачка дисквалифицирана за отказ да се състезава срещу транссексуален спортист

Свят Преди 1 час

Сензационно видео показва как Стефани Търнър коленичи, вместо да се състезава срещу транссексуалния спортист Редмънд Съливан

Пеевски: Кабинетът да се захваща със събирането на приходи, за да има средства за хората

Пеевски: Кабинетът да се захваща със събирането на приходи, за да има средства за хората

България Преди 1 час

По думите му в парламента се занимават само с това, което става навън

<p>&quot;Трудно е да си представим, че ще има мир&quot;</p>

Украйна - "Трудно е да си представим, че ще има мир"

Свят Преди 1 час

В края на март руската армия отново засили нападенията си по Покровското направление

Цветомир от Hell's Kitchen: С брат ми преминаваме през всички трудности заедно (ВИДЕО)

Цветомир от Hell's Kitchen: С брат ми преминаваме през всички трудности заедно (ВИДЕО)

Любопитно Преди 1 час

Заедно с водещия Станислав Иванов обсъдиха създалата се ситуация между Виктория и Тоника

Oт МЕЧ също подготвят вот на недоверие, обмислят кога да го внесат

Oт МЕЧ също подготвят вот на недоверие, обмислят кога да го внесат

България Преди 1 час

Ще търсим подкрепа от всички в Народното събрание, които искат свалянето на това правителство, заяви Радостин Василев

<p>САЩ потвърдиха ангажимента си към чл. 5 на НАТО</p>

Обрат: САЩ потвърдиха ангажимента си към чл. 5 на НАТО

Свят Преди 1 час

Новият постоянен представител на САЩ в НАТО посланик Матю Уитакър заяви, че основните задачи в неговата работа ще бъдат насърчаването на мира и стабилността чрез сила