Н ауката е чудесен инструмент за иновации и подобряване на живота ни, но нека си признаем, че има някои неща, които сме усвоили до голяма степен. Не бихте очаквали, например, че можем да подобрим нещо като... като броенето.

(Във видеото може да научите повече за: Митко Христов - учител по математика от ново поколение)

Затова може да е изненада, че група учени са направили точно това: намерили са нов начин за решаване на проблем с десетилетна давност, който задава въпрос, който на пръв поглед изглежда много прост - колко различни неща има пред мен?

Това е по-труден проблем - и по-умно решение - отколкото си мислите.

Проблемът за отчетливите елементи

Компютрите могат да бъдат много интелигентни, но могат да бъдат и много, много... неинтелигентни. Доказателство за това е неотдавнашният бум на чатботовете с изкуствен интелект: те са страхотни в това да звучат интелигентно, но ако ги подложите на изпитание, може да се окажете в блато от глупости.

Понякога най-много проблеми създават нещата, които изглеждат почти смешно прости за човека. Вземете например броенето - по-конкретно броенето на отделни обекти. За нас това е лесно: гледаме колекцията от обекти и мозъкът ни просто автоматично ги подрежда в групи вместо нас. Почти не ни се налага да работим върху това.

За компютрите, от друга страна, това е фундаментален проблем с десетилетна давност. И той наистина се нуждае от отговор, тъй като приложенията му в съвременния свят обхващат всичко - от анализ на мрежовия трафик - представете си Facebook или Twitter, които следят колко хора са влезли в даден момент - до откриване на измами, биоинформатика, анализ на текст и много други.

Очевидно е, че от известно време насам можем да правим тези неща и това е така, защото този въпрос за преброяването - правилно известен като Проблемът за отчетливите елементи - наистина има отговори. Те просто не са много добри. 

"Всички по-рано известни алгоритми бяха "базирани на хеширане" и качеството на този алгоритъм зависеше от качеството на хеширащите функции, които този алгоритъм избира", обясни Винодчандран Вариям, професор в Училището по информатика към Университета Небраска-Линкълн, в изявление от миналата година. 

Заедно с колегите си Сурав Чакраборти от Индийския статистически институт и Кулдип Мил от Университета в Торонто той открива начин за значително опростяване на проблема: "Новият алгоритъм използва само стратегия за вземане на проби, а анализът на качеството може да се извърши с помощта на елементарни техники."

Как работи?

Новият метод, наречен CVM алгоритъм в чест на създателите си, драстично намалява нуждите от памет - важно предимство в съвременната ера на големите данни - и го прави с помощта на хитър трик от теорията на вероятностите. За да илюстрирате концепцията, разгледайте примера, изследван от Вариам и колегите му, както и неотдавнашната статия в Quanta Magazine: представете си, че броите броя на уникалните думи в "Хамлет" на Шекспир, но разполагате с достатъчно памет, за да съхраните само 100 думи едновременно. 

Първо, правите очевидното: записвате първите 100 уникални думи, на които сте попаднали. Сега мястото ви е изчерпано - затова вземате монета и я хвърляте за всяка дума. Орел - тя остава; опашка - забравяте я.

В края на този процес в списъка ви ще има около 50 уникални думи. Започвате отново процеса отпреди - но този път, ако попаднете на дума, която вече е в списъка, отново хвърляте монетата, за да видите дали да я изтриете. След като достигнете 100 думи, отново преминавате през списъка, като хвърляте монета за всяка дума и я изтривате или запазвате според указанията.

Във втория рунд нещата са малко по-сложни: вместо една глава, за да запазите дума в списъка, са необходими две поредни - всичко останало се изтрива. По същия начин в третия кръг ще трябва да получите три поредни глави, за да остане; в четвъртия кръг ще са необходими четири поредни глави и така нататък, докато стигнете до края на "Хамлет".

В тази лудост има метод - и то интелигентен. Като сте преминали през текста по този начин, сте се уверили, че всяка дума в списъка ви има еднаква вероятност да присъства: 1/2k, където k е броят на пътищата, които трябваше да преминете през списъка. Така че, да кажем, че са ви били необходими шест кръга, за да стигнете до края на "Хамлет", и сте останали със списък от 61 отделни думи: след това можете да умножите 61 по 26, за да получите приблизителна оценка на броя на думите.
 
Ще ви спестим отварянето на приложението ви за калкулатор: отговорът е 3 904 - а според Вариам и ко действителният отговор е 3 967 (да, те пресметнаха.) Ако имате памет, която може да съхранява повече от 100 думи, точността се повишава още повече: при възможност за съхраняване на 1 000 думи алгоритъмът оценява отговора като 3 964 - вече едва ли има грешка при закръгляването - и "разбира се", казва Вариам, "ако паметта е толкова голяма, че да побере всички думи, тогава можем да получим 100-процентова точност".

Прост подход

Той е ефективен, но това, което прави алгоритъма още по-интригуващ, е неговата простота.

"Новият алгоритъм е изумително прост и лесен за изпълнение", казва пред Quanta Андрю Макгрегър, професор в Колежа по информационни и компютърни науки в Масачузетския университет в Амхърст.

Действително, след публикуването му през януари 2023 г. - и като изключим няколко дребни забележки и грешки междувременно - алгоритъмът привлече вниманието и възхищението на много други компютърни учени.

Това означава, че макар статията, в която подробно е описан алгоритъмът, да не е била рецензирана в официалния смисъл на думата, тя определено е била рецензирана от колеги. Всъщност Доналд Кнут, автор на "Изкуството на компютърното програмиране" и така нареченият "баща на анализа на алгоритми", пише статия, в която възхвалява алгоритъма през май 2023 г.

Междувременно различни екипи - включително Чакраборти, Вариям и Мил - прекараха последната година в проучване и усъвършенстване на алгоритъма. Някои от тях, казва Вариам, вече го преподават в своите курсове по информатика.

"Смятаме, че това ще бъде основен алгоритъм, който ще се преподава в първия курс по информатика за алгоритми като цяло и вероятностен алгоритъм в частност", каза той.

Кнут е съгласен: "Той е чудесно пригоден за преподаване на ученици, които изучават основите на информатиката. Почти съм сигурен, че нещо подобно в крайна сметка ще се превърне в стандартна тема за учебник".

И така, как един толкова революционен алгоритъм е останал незабелязан толкова дълго време? Според Вариам това не е толкова невероятно, колкото звучи.

"Учудващо е, че този прост алгоритъм не е бил открит по-рано. В науката не е необичайно простотата да бъде пропусната в продължение на няколко години", казва той.

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Тръмп няма да слага мита на телефоните, компютрите и чиповете

Тръмп няма да слага мита на телефоните, компютрите и чиповете

Свят Преди 1 час

Това сочат нови насоки, издадени от Службата за гранична и митническа охрана на САЩ

Протест на „Правосъдие за всеки” в София срещу Пеевски

Протест на „Правосъдие за всеки” в София срещу Пеевски

България Преди 2 часа

В района има засилено полицейско присъствие

Земетресение недалеч от София

Земетресение недалеч от София

България Преди 3 часа

Земетресението е станало днес в 15:34 часа

Бащата на Сияна: Майка ѝ е в много тежко състояние

Бащата на Сияна: Майка ѝ е в много тежко състояние

България Преди 4 часа

Николай Попов: Ако Сияна можеше да види всичко, би благодарила на всички, които ни подкрепят

Скоро трудовата книжка става електронен документ

Скоро трудовата книжка става електронен документ

България Преди 4 часа

Старите хартиени трудови книжки трябва да бъдат върнати на работещите

Тръмп запасява САЩ с редки метали от дъното на Тихия океан

Тръмп запасява САЩ с редки метали от дъното на Тихия океан

Свят Преди 4 часа

Китай произвежда около 90 процента от преработените редкоземни метали в света

Престрелка между турски и гръцки кораби в Егейско море

Престрелка между турски и гръцки кораби в Егейско море

Свят Преди 5 часа

По гръцкия кораб са открити пробойни от стрелбата

<p>НАТО: Русия може да разположи ядрени оръжия в космоса</p>

НАТО: Русия може да разположи ядрени оръжия в космоса

Свят Преди 6 часа

През 2021 г. в НАТО е взето решение клаузата за колективна отбрана по член 5 да се прилага и за нападения във или от космоса

<p>Нови арести за смъртоносния пожар в Кочани</p>

Нови арести за смъртоносния пожар в Кочани

Свят Преди 7 часа

За пожара в Кочани Основната прокуратура досега е започнала разследване срещу 27 физически и три юридически лица

Румен Радев и Дейвид Бейкър
Ексклузивно

Радев: Доставката на F-16 е само началото на ангажимента ни към ВВС

България Преди 8 часа

Президентът се срещна със заместник помощник секретаря по отбраната за Европа и НАТО в Департамента по отбраната на САЩ Дейвид Бейкър

Принц Уилям и крал Чарлз III

Чарлз III няма да предаде трона на принц Уилям

Любопитно Преди 8 часа

Защо кралят няма да абдикира въпреки болестта си

<p>Fitch потвърди креднития рейтинг на България с положителна перспектива</p>

Fitch потвърди креднития рейтинг на България с положителна перспектива

България Преди 9 часа

Положителната прогноза отразява перспективите за приемане на еврото, което ще доведе до по-нататъшно подобряване на външните показатели

Протестът в Телиш

Бащата на Сияна: Един знак можеше да я спаси

България Преди 9 часа

В Телиш се стичат хора за протест под мотото „България няма деца за убиване!“

Нови военни съюзи на Балканите: Колко опасно е това?

Нови военни съюзи на Балканите: Колко опасно е това?

Свят Преди 10 часа

В средата на март Хърватия, Албания и Косово сключиха военен съюз

<p>Имотите у нас поскъпват най-много от целия ЕС</p>

Имотите у нас поскъпват най-много от целия ЕС

България Преди 10 часа

Цените у нас са нараснали с 18.3% през 2024 г. спрямо 2023 г