Stepochka писал(а):По алгоритму определения дублей, думаю была бы полезна настройка при каком %% считать файлы дублями.
ИМХО сейчас это значение сильно завышено (ну или занижено , что то я запутался =))
Я видел там несколько реальных дублей пока сканировалось, как выдалось их 1500 так Я и потерял их =)
Я не к тому что алгоритм плох, совсем наоборот, но для сканера он мне кажется избыточно привередлив. Лучше будет отдельный плагин на нём сваять по поиску дубликатов книжков в базе
Именно такую настройку я предложил сразу же как увидел алгоритм.
Собственно при добавлении книги происходит поиск синонимов авторов, по другому алгоритму чем у меня или у cd_spb... Не очень кстати надёжному. Там неучитывается возможность написания ФИО в произвольном порядке. А таких написаний в моей например базе было выше крыши.


про авторов
