4

И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Коментари 4
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

4 коментара
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Екшън в Пловдивско: Задържаха контрабандни цигари за 2 млн. лева

Екшън в Пловдивско: Задържаха контрабандни цигари за 2 млн. лева

България Преди 7 минути

Арестувани са четирима души, сред които двама чужденци

<p>Нова номинация за главен прокурор в САЩ: Тръмп избра жена</p>

След оттеглянето на Мат Гейц: Тръмп избра Пам Бонди за главен прокурор в САЩ

Свят Преди 36 минути

Бонди е бивш главен прокурор на Флорида и отдавнашен съюзник на Тръмп

Костадинов: Няма да отменим кандидатурата ни за председател на НС

Костадинов: Няма да отменим кандидатурата ни за председател на НС

България Преди 49 минути

Петър Петров е най-добрият кандидат, отбеляза лидерът на "Възраждане"

Меркел

Защо Меркел е била против членството на Украйна в НАТО

Свят Преди 55 минути

Отговорна ли е политиката на Ангела Меркел спрямо Русия отчасти за войната в Украйна?

Почитаме двама светци, единият бил воин, българин

Почитаме двама светци, единият бил воин, българин

Любопитно Преди 1 час

По време на двегодишното си затворничество в Рим апостол Павел изпратил послание до Филимон, което е запазено в Библията

Четирима са номинираните за изгонване от Big Brother

Четирима са номинираните за изгонване от Big Brother

Любопитно Преди 1 час

Зрителите ги спасят чрез гласуване в приложението на NOVA PLAY

Решаващ разговор за Шенген: Атанас Илков е на ключова визита в Будапеща

Решаващ разговор за Шенген: Атанас Илков е на ключова визита в Будапеща

България Преди 1 час

Срещата е организирана от Унгарското председателство на Съвета на ЕС

Радев в Сингапур: Инвестирането в хората, образованието, иновациите е ключът към успеха

Радев в Сингапур: Инвестирането в хората, образованието, иновациите е ключът към успеха

Свят Преди 2 часа

Визитата на президента има за цел да стимулира развитието на двустранния диалог на най-високо политическо ниво

<p>Ден на пирати, крале и президенти</p>

Ден на пирати, крале и президенти – 22 ноември в историята

Любопитно Преди 2 часа

Ден на възходи и падения, вижте какво се е случило на 22 ноември

Сезонът на Стрелците е пред нас: Добрите и лошите страни на най-позитивния знак

Сезонът на Стрелците е пред нас: Добрите и лошите страни на най-позитивния знак

Любопитно Преди 2 часа

Хората, родени между 22 ноември и 21 декември, са представители на зодия Стрелец и са под влиянието на планетата Юпитер

Дълга умора: Изтощението, което остава след COVID-19

Дълга умора: Изтощението, което остава след COVID-19

Свят Преди 2 часа

С пандемията на COVID-19 се появява и дългият COVID

Силните изпращат двама от своите на елиминации в “Игри на волята”

Силните изпращат двама от своите на елиминации в “Игри на волята”

Любопитно Преди 9 часа

Анджела и Силвия ще се изправят срещу Малвина и Магдалена от Храбрите утре вечер

Румъния подписа със САЩ за купуване на изтребители F-35

Румъния подписа със САЩ за купуване на изтребители F-35

Свят Преди 10 часа

Румъния планира да "пенсионира" F-16 през 2040 г.

САЩ наложиха санкции на десетки руски банки

САЩ наложиха санкции на десетки руски банки

Свят Преди 11 часа

Включително най-голямата, която досега не беше санкционирана

Гейц оттегли кандидатурата си за главен прокурор на САЩ

Гейц оттегли кандидатурата си за главен прокурор на САЩ

Свят Преди 11 часа

Гейц: Министерството на правосъдието на Тръмп трябва да е работещо

Посолството на Украйна награди и Бойко Борисов и Кирил Петков

Посолството на Украйна награди и Бойко Борисов и Кирил Петков

България Преди 12 часа

Отличията са от Върховната рада на Украйна