И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Най-младият участник в историята на Hell’s Kitchen отпадна от надпреварата

Най-младият участник в историята на Hell’s Kitchen отпадна от надпреварата

Любопитно Преди 1 час

Златка от Златните и Ивайло от Червените заслужиха имунитет

Нетаняху: Израелската армия прави дисекция на Газа

Нетаняху: Израелската армия прави дисекция на Газа

Свят Преди 2 часа

Нетаняху: Докато те не върнат нашите заложници, натискът ще се засилва

Протести срещу педофилията и насилието над деца в София и други градове

Протести срещу педофилията и насилието над деца в София и други градове

България Преди 3 часа

Повод за гражданското недоволство са зачестилите случаи на детско насилие

Уволнения в МВР след разкритията на БОЕЦ

Уволнения в МВР след разкритията на БОЕЦ

България Преди 4 часа

За тях съобщи вътрешният министър Даниел Митов, а Бойко Борисов го подкрепи

Ново начало за трима кметове на Доган

Ново начало за трима кметове на Доган

България Преди 4 часа

Това доведе до остра реакция от страна на ДПС-Доган

Министърът предлага нов предмет в училище - „Добродетели и религии“

Министърът предлага нов предмет в училище - „Добродетели и религии“

България Преди 4 часа

Вълчев: Това, което ние водим като разговор, е предметът да бъде част от задължителния учебен план

Общо 36 деца с хранително натравяне в „Боровец“

Общо 36 деца с хранително натравяне в „Боровец“

България Преди 4 часа

Проверки са направени от служители на РЗИ и Областната дирекция по безопасност на храните

Шофьорът, предизвикал катастрофа, в която загина малко момиче, остава в ареста

Шофьорът, предизвикал катастрофа, в която загина малко момиче, остава в ареста

България Преди 5 часа

Той е санкциониран многократно за управление на моторно превозно средство с превишена скорост

Полицията издирва 41-годишен мъж

Полицията издирва 41-годишен мъж

България Преди 6 часа

Той е в неизвестност от 2 ноември 2024 г.

Сидни се събуди под ударите на разярения океан – огромни вълни, съчетани с прилива, връхлетяха австралийския бряг, предизвиквайки хаос и разрушения

Наводнения, разрушения и евакуации - огромни вълни удариха крайбрежието на Сидни

Свят Преди 7 часа

„Беше просто опустошително“, казва генералният мениджър на басейн, пострадал от стихията

Европол разби педофилска мрежа с милиони потребители

Европол разби педофилска мрежа с милиони потребители

Свят Преди 7 часа

Според Европол това е една от най-големите педофилски мрежи в света

Снимката е илюстративна

Правнучката на Махатма Ганди почина на 92 години

Свят Преди 7 часа

През целия си живот Ниламбен Парих следваше принципите на Ганди

Кирил Петков: Няма да подкрепим вот на недоверие преди дата за еврозоната

Кирил Петков: Няма да подкрепим вот на недоверие преди дата за еврозоната

България Преди 7 часа

Кирил Петков: Нашата позиция е ясна – ние сме за Европа и сме против корупцията

Човекът, който прекара два месеца под земята и промени разбирането ни за времето

Човекът, който прекара два месеца под земята и промени разбирането ни за времето

Любопитно Преди 7 часа

Цялата история може да прочетете в следващите редове

Блясък и класа: Виктория Бекъм впечатли на юбилея на Дейвид

Блясък и класа: Виктория Бекъм впечатли на юбилея на Дейвид

Любопитно Преди 8 часа

Звездното парти беше първото от поредицата празненства за рождения ден на Бекъм, който е на 2 май

<p>Двойни стандарти в разследванията: Тръмп срещу Клинтън и Байдън&nbsp;</p>

Администрацията на Тръмп искаше обвинения срещу Хилари и Байдън, но мълчи за скандала със Signal

Свят Преди 8 часа

„Изтичането на класифицирана информация е федерално престъпление, наказуемо с над десет години затвор"