Версия 1.6
Добавлено автоопределение языка текста.
Алгоритм и fingerprints взяты с
http://boxoffice.ch/pseudo/code_functions.php.
В директории LM находятся таблица языков LangTable.txt и файлы "отпечатков пальцев" языков (fingerprints) *.lm.
Сделано два режима автоопределения :
1. "Только для пустого" - работает, когда в fb2-файле не указан язык.
2. "Проводить всегда" - происходит сравнение с указанным в fb2.
Параметр "Размер текста для автоопределения языка" указывает минимальный объем в Кб (точнее в килосимволах)
строки, передающейся в модуль автоопределения. Строка формируется из первых текстовых тегов раздела body.
По умолчанию - объем 2 Кб.
При обоих режимах, если язык fb2-файла пуст, происходит автопределение и автоматическая вставка в fb2.
При режиме "Проводить всегда" при несовпадении языка или отсутствии соответствующего файла lm для языка в fb2
возможны два варианта поведения программы:
1. Выключена проверка имени автора или стоит режим "Переносить в спецдир при подозрительном имени" -
такие файлы будут падать в спецдир.
2. В противном случае будет запускаться диалог обработки для подтверждения или замены языка.
В текущую версию не включены fingerprints китайского и японского языков - автоопределение с fingerprints
с сайта boxoffice.ch нормально для этих языков не работает, а найти причину автору программы мешает полное их незнание.
Чтобы добавить какой-то язык для автоопределения, необходимо в директорию LM поместить lm-файл.
Имя файла lm имеет вид <английское название языка>[-кодировка].lm. Для правильного функционирования
<английское название языка> должно совпадать с наименованием в первой колонке LangTable.txt.
Добавлен режим проверки автора "Останавливаться на каждой книге", при котором диалог обработки запускается
для каждого файла.
Изменен режим "Требовать обработку наименования серии"
Теперь в этом режиме (при режиме обработки имени "Запрашивать при подозрительном" или "Запрашивать всегда")
диалог обработки запускается для любого файла и требуется подтверждение и наименования, и номера (если он пуст)
серии. В форму справочника серий добавлена кнопка "удалить все записи"
Добавлен параметр "Показывать ошибки валидации".
При его включении в журнал попадает расшифровка ошибки для плохих и невалидных файлов.
Добавлен параметр "Перед обработкой переименовывать файлы из Unicode в ANSI"
Без его включения архивы, в имени которых присутствуют символы unicode, не обрабатываются
(используемая библиотека их просто не видит). При включении параметра unicode символы в имени файла
меняются на соответствующие ANSI и файл переименовывается.
В диалогах справочников доработан поиск по первым буквам.
Мелкие исправления в интерфейсе.