ści w obrazach w celu zamaskowania tekstu. Filtrowanie spamu graficznego jest o wiele trudniejsze – zanim filtr antyspamowy będzie mógł określić, czy zawarty w wiadomości tekst jest spamem, musi najpierw wykryć tekst w obrazie. Większość metod wykorzystywanych w celu wykrywania tekstu w obrazach opiera się na maszynowym rozpoznawaniu obrazów. Rozpoznawanie maszynowe wymaga jednak ujednolicenia rozmiaru, stylu i rozmieszczenia symboli. To ograniczenie wykorzystywane jest przez spamerów, którzy celowo zniekształcają i tworzą „szum” w grafice, aby utrudnić wykrywanie.
Przełomowa technologia firmy Kaspersky Lab została zaprojektowana w celu zapewnienia skutecznego wykrywania tekstu i spamu w obrazach rastrowych bez konieczności stosowania maszynowego rozpoznawania obrazów. Podejście to zapewnia szybkie wykrywanie oraz możliwość rozpoznawania tekstu w prawie każdym języku. Nowa technologia antyspamowa firmy Kaspersky Lab została rozwinięta przez Jewgienija Smirnowa. Federalny Urząd ds. Własności Intelektualnej, Patentów i Znaków Handlowych przyznał jej patent 13 stycznia 2009 roku.
„Z jednej strony nasza nowa metoda całkiem dobrze radzi sobie w wykrywaniu obrazów, które zawierają tekst w niemal każdym języku” – powiedział Jewgienij Smirnow, twórca technologii i menedżer ds. rozwoju technologii antyspamowych w Kaspersky Lab. „Z drugiej strony, nie próbujemy czytać tekstu przy użyciu rozpoznawania maszynowego, dlatego metoda ta ma wystarczająco niskie wymagania dotyczące zasobów, aby mogła być wykorzystana w wysoce wydajnym filtrze spamowym firmy Kaspersky Lab”.
Nowa opatentowana przez Kaspersky Lab technologia opiera się na probabilistycznym i statystycznym podejściu. To, czy obraz zawiera tekst, określa rozmieszczenie graficznych wzorów słów i linii, jak również zawartość liter i słów w tych wzorach. Dzięki wyspecjalizowanym filtrom na system nie mają wpływu elementy „szumu” ani złamania tekstu w obrębie obrazów, natomiast wykorzystanie unikatowej metody wykrywania wierszy tekstu przeciwdziała stosowanym w spamie graficznym technikom zaciemniania, takim jak zniekształcanie obrazu i obracanie. Nowy system potrafi również skutecznie rozpoznać, czy wykryty tekst jest spamem poprzez porównanie jego sygnatury z zawartymi w bazach danych szablonami spamu.
„Wynalazek ten ma istotne znaczenie dla branży antyspamowej” – powiedział Nadieżda Kaszenko, menedżer ds. praw patentowych w firmie Kaspersky Lab. „Warto wspomnieć, że istnieje wiele różnych technologii wykrywania spamowych wiadomości tekstowych, ale bardzo niewiele rozwiązań rozpoznaje spamową wiadomość tekstową w obrazie. Rozwiązania te są bardzo skomplikowane i nieefektywne, ponieważ najpierw muszą znaleźć tekst w obrazie, a dopiero później zdecydować, czy to spam. Metoda Jewgienija Smirnowa jest unikatowa. Jest to technologia nowej generacji, dlatego mogliśmy wystąpić o przyznanie jej prawa patentowego”.
Kaspersky Lab posiada obecnie ponad 30 nierozstrzygniętych wniosków patentowych w Stanach Zjednoczonych i Rosji. Dotyczą one różnych technologii opracowanych przez pracowników firmy. Ponadto, wiele z dzisiejszych technologii antywirusowych zostało stworzonych przez firmę Kaspersky Lab i jest obecnie wykorzystywanych na zasadach licencji przez producentów oprogramowania i sprzętu na całym świecie, między innymi: Microsoft, Bluecoat, Juniper Networks, Clearswift, Borderware, Checkpoint, Sonicwall, Websense, LanDesk, Alt-N, ZyXEL, ASUS oraz D-Link.
Źródło: Kaspersky Lab