4

И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Коментари 4
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

4 коментара
 
- Мамо, днес директорът на училището ме попита дали съм единствено дете в семейството. - Единствено си. И какво? - Директорът каза: "Слава Богу!".
Прочети целия
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Мицкоски се надява Тръмп да вкара РС Македония в ЕС

Мицкоски се надява Тръмп да вкара РС Македония в ЕС

Свят Преди 7 часа

Мицкоски: Ние сме сред първите, които подкрепят новото нормално

<p>Съдът остави в ареста четирима за вандалския акт в София</p>

Съдът остави в ареста четирима за вандализирането на сградата на ЕК в София

България Преди 8 часа

Адвокат Петров от „Възраждане“: Ще обжалваме определението

Шествие за Украйна в центъра на София

Шествие за Украйна в центъра на София

България Преди 11 часа

Три години след началото на войната, светът показва солидарност към украинските граждани и военнослужещи

Почина звезда, носителка на "Грами", изпяла суперхитове

Почина звезда, носителка на "Грами", изпяла суперхитове

Свят Преди 11 часа

Флак печели пет награди "Грами", номинирана е осем пъти

Жестока автобусна катастрофа с много ранени в Германия

Жестока автобусна катастрофа с много ранени в Германия

Свят Преди 12 часа

Говорител на полицията съобщи, че 12 деца от детска градина са сред пострадалите

Румен Радев: Вандализмът е покушение срещу България

Румен Радев: Вандализмът е покушение срещу България

България Преди 12 часа

Президентът: Всеки има право на мнение и на протест, но законът е за всички

NOVA

Димитър Рачков и Герасим Георгиев - Геро преживяват всяко едно изпълнение в “Като две капки вода”

Любопитно Преди 13 часа

Любимото предаване „Като две капки вода“ навлиза в света на подкастите - всеки понеделник в 16:00 ч.

<p>България ще иска извънредни доклади от ЕК и ЕЦБ</p>

Росен Желязков: Внасяме бюджетите в Народното събрание още днес

България Преди 13 часа

Теменужка Петкова: България покрива критериите за еврозоната

Северът обеща мощна военна подкрепа за Украйна

Северът обеща мощна военна подкрепа за Украйна

Свят Преди 14 часа

Изходът от войната ще има фундаментални и дълготрайни последици

.

Къде заплатите растат най-много

България Преди 14 часа

Средният годишен бонус на работещите варира сериозно за различните сектори

<p>Ужас в Ню Йорк: Три жертви и един изчезнал след инцидент с лодка</p>

Ужас в Ню Йорк: Три жертви и един изчезнал след инцидент с лодка

Свят Преди 14 часа

Подробности за лодката и самоличността на пътниците не се разкриват

Георг Георгиев: Украйна има законното право сама да определя своето бъдеще

Георг Георгиев: Украйна има законното право сама да определя своето бъдеще

Свят Преди 14 часа

България потвърди категоричната си подкрепа за Украйна

Сметките ще ударят по джоба през март

Сметките ще ударят по джоба през март

България Преди 14 часа

Този февруари е най-студеният за последните години

Си обяви "безграничното партньорство" с Русия

Си обяви "безграничното партньорство" с Русия

Свят Преди 14 часа

Що се отнася до Украйна, Си заяви, че Китай е "доволен да види положителните усилия, положени от Русия"

Въоръжен взе заложници и уби един от тях в Турция

Въоръжен взе заложници и уби един от тях в Турция

Свят Преди 14 часа

На този етап няма информация за възможните мотиви на нападателя