М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

-Какво те разсмива винаги? -Изборът ми на мъже в миналото.  
Прочети целия
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Необичайна снежна буря удари Алпите

Необичайна снежна буря удари Алпите

Свят Преди 45 минути

Има загинал, двама души са в неизвестност, а хиляди са без ток

Шкодров след Hell’s Kitchen – ето каква е истината за Едуард, интригите и любовта с Марина (ВИДЕО)

Шкодров след Hell’s Kitchen – ето каква е истината за Едуард, интригите и любовта с Марина (ВИДЕО)

Любопитно Преди 1 час

В новия епизод на подкаста „Кухнята след Ада“ младият троянец разкри най-личните си емоции и преживявания

Агресията и грабежът в Борисовата градина: Повдигнаха обвинение на нападателите

Агресията и грабежът в Борисовата градина: Повдигнаха обвинение на нападателите

България Преди 2 часа

Потърпевшите са майка с дете, разследването по случая продължава

Мир с Украйна „много скоро“? Тръмп чака отговор от Русия

Мир с Украйна „много скоро“? Тръмп чака отговор от Русия

Свят Преди 2 часа

„Не съм голям фен на Зеленски“, заяви американският държавен глава

Венеция удвои входната такса за еднодневни екскурзии

Венеция удвои входната такса за еднодневни екскурзии

Свят Преди 3 часа

Тя се прилага през всички дни до първия уикенд на май, а след това през всички уикенди от петък до неделя до края на юли

<p>Смъртоносни удари в Йемен: 38 жертви и нова ескалация на конфликта</p>

САЩ удариха петролно пристанище в Йемен, най-малко 38 загинали

Свят Преди 3 часа

Това е един от най-смъртоносните дни, откакто САЩ започнаха атаките си срещу подкрепяните от Иран бунтовници

Как да не качим килограми по време на Великденските празници

Как да не качим килограми по време на Великденските празници

Любопитно Преди 3 часа

Ето някои полезни и приложими съвети, които могат да ви бъдат от полза:

С положителни проби за алкохол и наркотици: Задържаха шофьор на АМ "Хемус"

С положителни проби за алкохол и наркотици: Задържаха шофьор на АМ "Хемус"

България Преди 4 часа

Пред полицаите водачът обяснил, че пътува за Бургас, където смятал да прекара празниците

Заря, подготвена за Великден в Бургас, предизвика обществено недоволство

Заря, подготвена за Великден в Бургас, предизвика обществено недоволство

България Преди 4 часа

Предложението е на Сливенската митрополия

Промени в организацията на движението на градския транспорт в София за Великден

Промени в организацията на движението на градския транспорт в София за Великден

България Преди 4 часа

В нощта на 19 срещу 20 април линии на обществения транспорт ще се движат по разписания с удължено работно време до 01:30 ч.

САЩ и Украйна подписаха меморандум за полезните изкопаеми

САЩ и Украйна подписаха меморандум за полезните изкопаеми

Свят Преди 5 часа

Това съобщи първият вицепремиер и министър на икономиката на Украйна Юлия Свириденко

Имен ден днес празнуват...

Имен ден днес празнуват...

Любопитно Преди 5 часа

Вижте на кого отдава почит църквата на 18 април

<p>Днес е&nbsp;най-скръбният ден за християните</p>

Разпети петък е, най-скръбният ден за християните

Любопитно Преди 5 часа

В него си припомняме страданията, съденето, разпъването на кръста, смъртта и погребението на Иисус Христос

Направи си сам Великден: Красива декорация без излишни разходи

Направи си сам Великден: Красива декорация без излишни разходи

Любопитно Преди 6 часа

Създайте стилна и цветна празнична атмосфера с тези забавни DIY идеи, подходящи за цялото семейство

Сватбата на Грейс Кели и принц Рение III

Коя е сватбата, обявена за венчавката на XX век

Любопитно Преди 6 часа

Нека си припомним една от най-великите любовни истории за всички времена