Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Программы, утилиты

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение Stepochka » Пт янв 22, 2010 15:35

А присоветуйте чем работать с DBF в UTF-8, мой CDBF оказывается работает только с ANSI/OEM
Stepochka
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 358
Зарегистрирован: Чт авг 11, 2005 11:35
Откуда: Москва

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение Stepochka » Пн янв 25, 2010 21:59

Иногда глючит навигация по справочнику и его редактирование, если вызвать справочник через кнопку "..." из всплывающей формы
Stepochka
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 358
Зарегистрирован: Чт авг 11, 2005 11:35
Откуда: Москва

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Пн янв 25, 2010 23:50

Stepochka писал(а):Иногда глючит навигация по справочнику и его редактирование, если вызвать справочник через кнопку "..." из всплывающей формы

Попробуйте подправленную версию.
FB2Move
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение Stepochka » Вт янв 26, 2010 11:07

Спасибо за оперативность! Пока полёт нормальный
Stepochka
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 358
Зарегистрирован: Чт авг 11, 2005 11:35
Откуда: Москва

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение ve51 » Чт янв 28, 2010 20:13

Хоршо бы сделать:
1. автоматическое удаление лишних пробелов в тегах (если в список авторов попадает вначале запись с пробелом, то последующие книги без пробела или пробелом в другом месте определяются как новые авторы)
2. при исправлении жанра - запоминать последний, так как сделано при добавлении жанра
ve51
Новенький участник форума
Новенький участник форума
 
Сообщений: 6
Зарегистрирован: Ср дек 09, 2009 11:36

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Чт янв 28, 2010 23:01

ve51 писал(а):Хоршо бы сделать:
1. автоматическое удаление лишних пробелов в тегах (если в список авторов попадает вначале запись с пробелом, то последующие книги без пробела или пробелом в другом месте определяются как новые авторы)
2. при исправлении жанра - запоминать последний, так как сделано при добавлении жанра

Лишние пробелы и сейчас убираются до анализа, о чем пишется в журнале. Можно пример файла, по которому это не происходит?
п.2 - сделаю
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Пт янв 29, 2010 23:00

Версия 1.6

Добавлено автоопределение языка текста.

Алгоритм и fingerprints взяты с http://boxoffice.ch/pseudo/code_functions.php.
В директории LM находятся таблица языков LangTable.txt и файлы "отпечатков пальцев" языков (fingerprints) *.lm.
Сделано два режима автоопределения :
1. "Только для пустого" - работает, когда в fb2-файле не указан язык.
2. "Проводить всегда" - происходит сравнение с указанным в fb2.
Параметр "Размер текста для автоопределения языка" указывает минимальный объем в Кб (точнее в килосимволах)
строки, передающейся в модуль автоопределения. Строка формируется из первых текстовых тегов раздела body.
По умолчанию - объем 2 Кб.
При обоих режимах, если язык fb2-файла пуст, происходит автопределение и автоматическая вставка в fb2.
При режиме "Проводить всегда" при несовпадении языка или отсутствии соответствующего файла lm для языка в fb2
возможны два варианта поведения программы:
1. Выключена проверка имени автора или стоит режим "Переносить в спецдир при подозрительном имени" -
такие файлы будут падать в спецдир.
2. В противном случае будет запускаться диалог обработки для подтверждения или замены языка.

В текущую версию не включены fingerprints китайского и японского языков - автоопределение с fingerprints
с сайта boxoffice.ch нормально для этих языков не работает, а найти причину автору программы мешает полное их незнание.

Чтобы добавить какой-то язык для автоопределения, необходимо в директорию LM поместить lm-файл.
Имя файла lm имеет вид <английское название языка>[-кодировка].lm. Для правильного функционирования
<английское название языка> должно совпадать с наименованием в первой колонке LangTable.txt.

Добавлен режим проверки автора "Останавливаться на каждой книге", при котором диалог обработки запускается
для каждого файла.

Изменен режим "Требовать обработку наименования серии"
Теперь в этом режиме (при режиме обработки имени "Запрашивать при подозрительном" или "Запрашивать всегда")
диалог обработки запускается для любого файла и требуется подтверждение и наименования, и номера (если он пуст)
серии. В форму справочника серий добавлена кнопка "удалить все записи"

Добавлен параметр "Показывать ошибки валидации".
При его включении в журнал попадает расшифровка ошибки для плохих и невалидных файлов.

Добавлен параметр "Перед обработкой переименовывать файлы из Unicode в ANSI"
Без его включения архивы, в имени которых присутствуют символы unicode, не обрабатываются
(используемая библиотека их просто не видит). При включении параметра unicode символы в имени файла
меняются на соответствующие ANSI и файл переименовывается.

В диалогах справочников доработан поиск по первым буквам.

Мелкие исправления в интерфейсе.
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение Stepochka » Сб янв 30, 2010 0:00

Ещё раз СПАСИБО!
Stepochka
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 358
Зарегистрирован: Чт авг 11, 2005 11:35
Откуда: Москва

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение ve51 » Вс янв 31, 2010 23:18

У меня появились проблемы со списком авторов - при попытке принять(добавить) автора ошибка:
Assertion failure (D:\DELPHI\VCL2007\tdbf\dbf_idxfile.pas, line 955)
при попытке открыть список авторов:
Assertion failure (D:\DELPHI\VCL2007\tdbf\dbf_idxfile.pas, line 1263)
при закрытии программы:
Assertion failure (D:\DELPHI\VCL2007\tdbf\dbf_idxfile.pas, line 682)

Сразу после запуска можно просмотреть список авторов из закладки "обработка fb2",
из окна диалога авторы открываются, но видны частично.
При работе с новым(пустым) списком авторов проблем нет.
ve51
Новенький участник форума
Новенький участник форума
 
Сообщений: 6
Зарегистрирован: Ср дек 09, 2009 11:36

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Вс янв 31, 2010 23:44

ve51 писал(а):У меня появились проблемы со списком авторов - при попытке принять(добавить) автора ошибка:
Assertion failure (D:\DELPHI\VCL2007\tdbf\dbf_idxfile.pas, line 955)
при попытке открыть список авторов:
Assertion failure (D:\DELPHI\VCL2007\tdbf\dbf_idxfile.pas, line 1263)
при закрытии программы:
Assertion failure (D:\DELPHI\VCL2007\tdbf\dbf_idxfile.pas, line 682)

Сразу после запуска можно просмотреть список авторов из закладки "обработка fb2",
из окна диалога авторы открываются, но видны частично.
При работе с новым(пустым) списком авторов проблем нет.


Скорее всего поврежден или заблокирован другой программой индексный файл. Попробуйте выйти из программы и удалить файл authors.mdx
При запуске утилиты он пересоздастся
Если ошибка не пропадет, вышлите мне authors.dbf
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение ve51 » Пн фев 01, 2010 2:07

Спасибо, помогло удаление authors.mdx
ve51
Новенький участник форума
Новенький участник форума
 
Сообщений: 6
Зарегистрирован: Ср дек 09, 2009 11:36

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Ср фев 10, 2010 21:40

Версия 1.7

Реализован поиск похожих авторов в справочнике.

При достаточно большом справочнике авторов часто легко не заметить, что в справочнике уже присутствует данный автор с немного другим написанием (например Тэйлор и Тейлор или Вогт и ван Вогт). Поэтому в диалог корректировки добавил выпадающий список с похожими именами авторов.
Для поиска похожих имен используется алгоритм Дейтча-Мокотоффа (Daitch-Mokotoff Soundex Coding) по поиску похожих фамилий для восточноевропейских языков, немного адаптированный для того, чтобы захватывались и английские имена.
Программа вычисляет саундекс-код по lastname+firstname автора и ищет аналогичные в справочнике soundex.dbf (для одного имени может быть несколько вариантов звучания - поэтому создан дополнительный справочник).
Кроме того, в выпадающий список включаются авторы с аналогичной фамилией и соответствующим инициалом имени (и наоборот, если ищется фамилия с инициалом - то с подходящими именами).
При наличии в фамилии частиц ван, фон, де и т.д. для вычисления кодов используются два варианта: без частицы и с частицей слитно с фамилией (чтобы находились ЛеГуин, Гуин, ле Гуин).
Режим включается галкой "Показывать похожих авторов". Кроме того, на форме авторов кнопкой "Саундекс" необходимо расчитать коды для существующих авторов. Также данной кнопкой необходимо пересчитывать коды после правки справочника авторов внешней программой или с отключенной галкой "Показывать похожих авторов".
На форме авторов также присутствует кнопка "Похожие" для поиска похожих для текущего автора.
Список саундекс-кодов для текущего автора можно посмотреть по клавише F4. При двойном нажатии левой клавиши мыши или клавиши ввода на авторе в списке похожих осуществляется переход на соответствующую запись в справочнике авторов.

+мелкие исправления
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Чт фев 11, 2010 17:53

Случайно выложил не ту версию. Перевыложил правильную с парой исправленных ошибок 1.7.1
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Пт фев 12, 2010 20:47

Версия 1.7.2

Исправлена ошибка расчета кодов с частицами в фамилиях.
Добавлена обработка частиц 'СЕНТ' и 'SAINT'.
Для правильного функционирования необходимо пересчитать коды кнопкой "Саундекс".
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Re: Утилита предв. обработки fb2-файлов перед приемом в FBLibrar

Сообщение olvid » Ср фев 17, 2010 13:31

Версия 1.7.3

В расчет кодов добавлен вариант с отчеством (Для поиска похожих САРТР;ЖАН-ПОЛЬ; и САРТР;ЖАН;ПОЛЬ).
В диалоге корректировки при поиске похожих используются все перестановки непустых lastname,firstname,middlename
для учета случая перепутанных местами ФИО.

В справочник жанров добавлены жанры из "Таблицы автоматической конвертации жанров FB2.0 - FB2.1".
При старте программы при условии установленной галки "Проверять жанры" или при открытии справочника по кнопке "Жанры"
в случае наличия в папке программы файла fb20_fb21.txt, данные из этого файла переносятся в справочник, а файл затем удаляется.

Исправлены ошибки
Автоматическая капитализация имен при действии "Всегда оставлять исходные ФИО" оставлена только для имен, все символы которых в одном регистре.
Не запоминался режим "Останавливаться на каждой книге".
Не обрезались лишние unicode пробелы.
olvid
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 112
Зарегистрирован: Ср мар 11, 2009 11:30

Пред.След.

Вернуться в Сделано для FB

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1