Какво е херпес зостер Форум За Интернет маркетинг
Изберете такъв подниз може да бъде различен. На първо място, това е възможно да се вземе друга стъпка, например: знак, дума, изречение. На второ място, решавате как да отида - припокриване (точно така, получена е "херпес зостер"), или дупето. На трето място, необходимо е да се разбере, какъв размер трябва да бъде подниза: избран размер трябва да се намали случайните повторения, че е трябва да бъде достатъчно голям. В този случай той трябва да остане и да бъде достатъчно малък, че типичните промени в текста не се унищожават голяма част от подписите. Точните цифри тук, аз не носят, те не трябва да се рекламират по очевидни причини. На четвърто място, е необходимо да се реши дали да се фиксира техния размер. И пето, поради възможна podstrochek в текста прекалено много, трябва да изберете - какво да помним и какво да изхвърлите.
Ако си спомняте проверка по сума, за фиксирана дължина на линиите ще гръб до гръб, след това поставете и изтриване на един знак (особено в началото на текста), ще унищожи всички тях, тъй като те не са избрани. Това определено е най-лошият вариант.
Въпреки това, ако отмяна дължина фиксиране и поемат индексът от една функция точка в текста към другия (например, буквата "w" на буквата "w", или dvuhbukviya, сумата от числените стойности на символи (символи), който е кратно на 50, към следващия на същото ), вкарването (или изрязване) е вероятно да унищожи само плочка, където се наблюдава.
Когато очевидно наясно, че документът се променя, макар и силен, но в малък брой местоположения, този тип подпис се прилага успешно. Например: прехвърляне на един и същи вид на HTML-файлове, прокси сървъри, или синхронизиране на хранилище на изходния код.
За съжаление, в този вариант, подписът е твърде много, освен ако, разбира се, да не се избират конкретни точки, разположени средно досега. Но тогава линиите са твърде големи, а алгоритъмът става прекалено нестабилна към малки промени в текста. За вероятностна сравнение на двата документа все пак ще трябва да се намали на пробата, както и за това по-късно.
На пръв поглед изглежда, че проверка по сума, разчитам на всички линии се припокриват - странна идея. Необходимо е също така да се намали количеството данни за сравнения и в тази версия е страшно се увеличава? Все пак, това е начина, по който се гарантира, че никога не пропуска подниз на текста (определена дължина), и при условие, че ще бъде в състояние да излезе с по устойчив начин, за да отнеме херпес зостер, ние сме в състояние да идентифицираме точно документите, които са част от съвпадение.
Вземане на проби. Какви са херпес зостер трябва да запомните?
Класически алгоритъм Broder предлага избран или същото количество за минималната стойност на херпес зостер, херпес зостер, или всички, значенията на който са разделени в някои малък брой (10-30). В първия случай имаме фиксиран размер на извадката (което понякога е удобно) и приличен размер набор от херпес зостер, дори и за сравнително кратък документи, но такива няма да бъдат съдени от сетовете на херпес зостер по закрепването на документи до един на друг. Във втория случай броят на херпес зостер, пропорционално на размера на документа, т.е., той е променлив, което е неудобно, но е възможно да се наемат херпес зостер оценяват такива интересни неща, като приложен документ един в друг или процентът на пресичането им. И накрая, най-накрая, най-много "модерно" алгоритъм генерира определен размер на извадката се определя от определен брой (85 за уеб документи) различни независими случайни функции, всяка от които се съхранява точно един чакъл, минималната стойност на контролната сума. Този подход съчетава предимствата на предишните две.
Кратки документи. Какво може да се направи?
Какво да правим с много кратък документ, за който алгоритъм херпес зостер за подбор (т.е. втори), може да не изберат всеки подходящ? Или изберете твърде малко? Знам, че две алтернативи: един от тях: глава в текста на документа, който е на практика да продължи своето начало след края за постигане на необходимия за това броят на херпес зостер, дори в такива условия. Вторият подход, използван в Yandex-Mail, е да се използва проба, размерът на която има логаритмична зависимост от размера на документа.
Ако всяка буква, за да изберете повече от един речен чакъл, ние сме изправени пред задачата на документи за самоличност само с няколко керемиди съвпадащи. Без значение колко ние намали броя на херпес зостер, тя все още е нетривиален количество работа: много данни, дори и да падне твърде редки и твърде често херпес зостер; Там е без течаща незабавно да поиска за идентифициране на даден документ и т.н.
Поради това, на практика, често на набор от херпес зостер документ се счита за друга контролна, така наречените "supershingl". Очевидно след това съвпада ще се считат само онези документи, с напълно съвпадащи херпес зостер комплекти. Въпреки това, с правилен подбор на алгоритъма и неговите параметри, които не може да бъде достатъчно за доста добри детектор писма. Задачата ще бъде ограничена до изчисляването на само един номер и да го намерите в проста база данни.
Подмяна supershingla: лексикални подписи
Не е необходимо да изглеждат много подобни документи, контролна и индексът сложно. Доста добре (поне в задачи за търсене в мрежата) работа и лексикално (на базата на думи) методи. Всички различни методи вече са разделени на две групи: местни и глобални лексикални подписи.
__________________
С уважение, Ярослав Деревягин
"Намерени" уеб агенция