post Категории: SEO статьиpost Comments (11)

Почитал сейчас тему на трахобизе про уникализацию картинок и каким образом палятся дубликаты. Увидел много идиотских решений и выводов. Те кто имел опыт в распознавании капчей знают каким образом сравниваются изображения и что безсмысленно использовать что бы картинки не были похожи.
Список из того что вам НЕ поможет я даже не буду делать, ибо он бесконечен. Просто покажу как все работает (именно это загадка для многих).

Уникализация изображений

Получаем везде совпадения 98-100%

В итоге получается бинарная маска. Я в своих программах по распознаванию капчи подгоняю ее под единый размер, что помогает ее сравнивать с другими изображениями, и хотя у меня очень узкая задача, но вполне подходит и для данных целей.
Причем вот это значение порога при котором идет разделение цвета - обсчитывается математически исходя от общего арифметического (статически его задавать нельзя, иначе получатся некоторые картинки просто белыми, а некоторые просто черными).

Так что ни мелкие шумы, ни изменение размеров, ни растягивание, ни поворот на маленький градус, и даже смещение по вертикали или горизонтали - не датут вам результата. Получите ли вы уникальную картинку - вне всякого сомнения. НО мы изначально неверно ставим задачу. Получить нужно НЕПОХОЖУЮ картинку, а не уникальную. Причем непохожую на глаз, бинарная маска которой будет отличаться достаточно сильно что бы машина ее отфильтровала и присвоила флаг уникальности.

К слову, как все уже поняли - если вотермарки сделать достаточно контрастными и выразительными - изображение считается уникальным. Но просто до невыносимости галимым.

Видел кто-то сделал замечание, что негатив решает проблему. И действительно:

Негатив бинарной маски

Но во-первых это не решение, а во-вторых даже я делаю инверсию таким образом, что бы доминировал всегда одно значение цвета, так что если там сочтут это своей недоработкой, то даже этот вариант перестанет работать.

Теперь палю тему как это решается.
Задача в моем случае, как правило, ограничивается уникализацией картинок таблеток и прочих товаров - там всегда есть задний план. Вот тут у нас открывается поле для экспериментов.
Добавляем конктрастные текстуры, и...

Уникализация заднего плана

О чудо! Мы получили не только другой порог контрастности, но и другое изображение.

Теперь ваши прогеры мало-мальски работавшие с изображениями без проблем смогут отделить задний фон от основного изображения и добавить в бэкграунд любые текстуры (очень хорошо для этого подходят татушки). У кого в команде прогеров нет - можно воспользоваться услугами негров.

Для больших объемов рекомендую все же заказать софт, но сразу предуреждаю, что за $50 я этим заниматься не буду.

#1

Я так понимаю следующим шагом поисковики будут искать способы выделения фона. На указанной картинке с текстурой эта задача реализуема.

Все же поворот надежней, ну и какое нибудь “заворачивание угла”

fStrange, 05/04/2011 - 21:13
#2

Одну и ту же картинку много раз повернуть не получится, а фонов можно подставить сколько душе угодно

Zuzlan, 05/04/2011 - 21:23
#3

Обычно поворачиваю на 2-3 градуса, этого хватает.

Vadim, 07/04/2011 - 15:08
#4

М-да! И как только не извращаются над картинками. Все равно скоро придумают еще какие нибудь способы от копирования.

Яна, 07/04/2011 - 16:53
#5

и что, помогает? И вообще, зачем уник картинки?

anubarak, 07/04/2011 - 19:13
#6

Что бы получать траф с поиска картинок. Дубликаты там не выводятся.

Zuzlan, 07/04/2011 - 19:21
#7

А я часто использую соединение двух картинок. Правда, у меня не таблетки, но разные элементы для блога тоже неплохо бы уникализировать.

Александр, 09/04/2011 - 03:46
#8

поворот самое верное на сегодняшний день

Чебурек, 20/04/2011 - 19:23
#9

Чебурек, верно. Кажется самый простой метод.

Алексей, 21/04/2011 - 21:53
#10

И стоит так из за этого париться если у тебя в блоге от силы пара картинок, и то которые для наглядности

Да врядле сейчас много трафика получится от этого, подумаешь выдача картинки будет в поиске картинок

Даже париться из за этого не стоит, разве только что у тебя сайт не посвящён ворованным картинкам!

О_о, 05/05/2011 - 08:59
#11

O_o, Это для магазинов. Там картинки есть ко всем товарам. А тематический траф на магазине любыми средствами хорош.

Zuzlan, 05/05/2011 - 11:15