„Лаборатория Касперски" е патентовала нова технология за ефективно откриване на текстове и спам от растеризирани изображения без необходимостта от машинно разпознаване на графични образи. Методиката е разработена от Евгений Смирнов. Издаването на патента е одобрено от Федералната служба по интелектуална собственост, патенти и търговски знаци на 13 януари 2009 г.
В основата й лежи вероятностно-статистически метод, според който решението за това дали текстът съдържа изображение се приема, основавайки се на характера на разположение на вероятните графични образи от думи и редове и съдържащите се в тях явни образи на букви и думи. Наличието на специални филтри осигурява устойчивост на системата към шумови елементи и разбиване на текста на рамки и линии, а използването на особен способ за показване на редове - към срещащи се в графичния спам изкривявания като извивки на текста и писането му във вид на вълна.
Освен засичане на текста в изображения системата е способна са определя дали открития текст е спам, сравнявайки го със сигнатура от шаблоните със спам, съхранявани в базата данни. Не е тайна, че спамърите често използват методи за заобикаляне на антиспам системите, скривайки рекламни текстове в изображения. Новата технология не изисква предварително машинно разпознаване на графични образи и преобразуването им в текстов вид, затова се осигурява висока скорост на детектиране и позволяват намирането на текстове практически на всеки език.
CW/Б
Източник: IDG.BG
* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!