Входен текст
Разбиване на текста
(shingles - N думи)
Изчисляване на
хеш стойности
Хеш таблица
(ключ → документ)
База от хешове
Проверка за съвпадения
Резултат:
Степен на сходство
by delete