+2
Under review

Поиск дубликатов

Stepan 6 years ago • updated by ve51 6 years ago 3

Ну наверное в качестве хотелки на долгосрочную перспективу.

Надо что то делать с дубликатами.. хотя понятно что их надо найти и изничтожить.
О! Надо что делать с поиском дубликатов, наверное нужен плагин. Автор где то оговорился недавно что скоро даст писать плагины.
Хотелось бы что бы плагин искал дубликаты книг и авторов, вместе и по раздельности, разными алгоритмами и выводил результаты в таблички (grid) где найденное можно просмотреть, изменить, удалить.

Алгоритмы: идентичные, похожие, soundex, fuzzy, бинарное сравнение.
Видел что то подобное в Калибре, очень хочется и у себя покопаться в дубликатаххх
Тщательный отлов дубликатов при добавлении не всегда возможен.

+1

Попробуйте fb2duplicates, я с год назад чистил, вцелом - доволен. Чем реализация в виде плагина, лучше отдельной утилиты? эта функция будет использоваться не часто и напрямую не связана с работой программы.
http://ditkovski2000.narod.ru/

Спасибо за совет, но с fb2duplicates у меня почему то не сложилось когда она вышла.. Надо будет ещё попробовать.
Согласен что используется не часто - потому плагин.
Почему не утилита - потому что я всё храню в БД, искать дубликаты сторонними утилитами, значит выгружать базу, потом опять загружать. И даже если хранить в файловой системе, после чистки всё равно базу перезаливать наверное придётся.

А я храню в файлах - гибче, безопаснее, а хранить в базе не вижу смысла.