Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Программы, утилиты

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение DikBSD » Пн фев 01, 2010 11:26

Выложил новую персию пакета, версия OOoFBTools-1.14:
1. Конвертер ExportToFB21:
а). Исправлена ошибка экспорта файлов с картинками при 'root' логине на Linux, FreeBSD и т.д. (спасибо dimgord).
б). Старая схема Жанров FictionBookGenres.xsd заменена на новую.
в). В Выпадающий список Жанров для Схемы 2.2 добавлены жанры: Для Раздела "Справочники" - "GEO Справочники" (geo_guides); для раздела "Документальное" - "Периодика" (periodic).
г). Запоминание выбранной Схемы Жанров и Кодировки при закрытии и восстановление при запуске основной формы конвертера.
д). Запоминание выбранной Схемы Жанров и Списка Жанров для диалога Избранных Жанров.
е). Запоминание выбранной Схемы Жанров и Списка Жанров для диалога вставки Жанров в Служебную область.
ж). Улучшена инициализация запуска основной формы конвертера - визуальное отображение прогресса.
2. Валидатор:
а). Улучшение работы.
3. Инструмент "Поиск OCR ошибок в тексте":
б). Для режима "Место с недостающим пробелом между словами (вероятно)" усовершенствовал алгоритм автоматического определения местоположения для вставки недостающего пробела.
в). Для режима "Место с недостающим пробелом между словами (вероятно)" теперь реализована возможность поиска нескольких "слипшихся" подряд слов (букв) после OCR. Например: ц.н.с. Раньше алгоритм находил только "ц.н" и игнорировал "н.с" в этом же "слове". Теперь, после обработки "ц.н" будет найдено "н.с".
г). Название режима "Обрыв предложения на словах, знаках препинания, кавычках и скобках" переименовал в "Обрыв абзаца на словах, знаках препинания, кавычках и скобках".
д). Для режима "Обрыв абзаца на словах, знаках препинания, кавычках и скобках" введена кнопка "Склеить". Если кнопка "Обработать" удаляет разрыв и вставляет пробел, то новая кнопка "Склеить" просто удаляет разрыв. Часто после OCR (Особенно в FR10) слово оказывается разорванным. Например: Он при¶шел домой. Если нажать "Обработать", то получится "Он при шел домой". Если "Склеить", то "Он пришел домой".
4. Генератор сносок:
а). Расстановка закладок для глав и списка(ов) примечаний - Исправлена ошибка проверки местоположения уже существующих закладок и их числа. В некоторых случаях программа "вылетала".
б). Увеличено число шаблонов для № примечания в списке примечаний (Сложная генерация сносок).
в). Исправил ошибку для режима Сложной генерации сносок, нумерация - сквозная, список примечаний - а конце книги: На шаблонах, отличных от "x." тест показывал число обработанных номеров примечаний во всех главах книги больше, чем их есть на самом деле (хотя на генерацию сносок это никак не отражалось). Теперь данные теста корректны.
г). Исправлена ошибка - Тест вылетал, если в Документе встречались Текстовые Врезки и/или Таблицы. Исправлено.
д). Улучшил генерацию текста Теста. Убрал вывод лишней информации, которая только отвлекает, и ввел вывод сообщения, что ВСЕ OK, если найдено полное соответствие всем номерам примечаний в каждой главе соответствующим им текстам примечаний из Списков....
е). Для режима Сложной генерации сносок ввел проверку на наличие Текстовых Врезок и Таблиц в Документе. Если в Документе есть хоть одна Врезка или Таблица, выдается сообщение-подсказка, что нужно сделать. Дело в том, что OOo Writer не может вставлять Таблицы в сноски. А Генератор сносок и Тест не могут корректно работать, если в Списках примечаний есть таблица и/или Текстовая Врезка. Поэтому, в случае такой ситуации выдается сообщение-подсказка в текстовом поле формы Генератора сносок. Дальнейшая работа - на ваш страх и риск. Лучшее - просмотреть Документ, в частности все Списки примечаний (они помечены закладками _ooo_ocr_tc_foot_note_list_zone_dikbsd_ ... _ooo_ocr_tc_foot_note_list_zone_dikbsd_1 ... _ooo_ocr_tc_foot_note_list_zone_dikbsd_N - легко найти в Навигаторе OOo - по F5), и откорректировать Списки. Для этого надо в Списках примечаний текст Врезки вынести из нее в текст Списка примечаний, Врезку удалить. А Таблицы можно отскриншотить в виде картинки, саму таблицу удалить, а после генерации сносок вставить эту картинку в нужное место нужной сноски.
Такая защита сделана в силу ограничения самого OOo Writer, а также, во избежания неверной работы генератора сносок.
ж). Расширил раздел Справки, посвященный Генератору сносок и Тесту. Посмотрите - много вопросов отпадет!
5. Интерактивное преобразование номеров примечаний в верхнем индексе:
а). Увеличено число шаблонов для № примечания в списке примечаний.
б). Исправлена ошибка - при преобразовании найденного номера(символа) в верхнем индексе к выбранному шаблону для номеров примечаний в Списке примечаний, не вставлялась левая часть шаблона (до номера или символа).
5. Нумерация выделенных абзацев:
а). Увеличено число шаблонов для нумерации.

Сайт пакета: http://code.google.com/p/ooofbtools/
Скачать пакет: http://ooofbtools.googlecode.com/files/ ... s-1.14.zip

P.S. Планируется:
1. Новые режимы инструмента поиска OCR-ошибки:
а). Поиск Мусора
б). Поиск результата Искривления строк сканов
2. Улучшенный ID с GUID
3. Генератор сносок - другие виды примечаний (верхний индекс, звездочки...). Тест...
4. Новый ручной инструмент склейки разорванных абзацев...
5. Конвертор разных видов сайтов и форумов (по мере времени, сил и мозгов :-) ).
6. Улучшение уже написанных инстурментов и конвертора.
7. Другие инструменты...
DikBSD
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 269
Зарегистрирован: Ср ноя 14, 2007 23:04
Откуда: Рязань

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение BooxReader » Чт фев 11, 2010 15:15

Я надеюсь, именно здесь можно задавать вопросы?
ООо 3.2 Билд 9432
1. В тестовые ОДТ при конвертации не встают ни картинки, ни таблицы... Конвертация проходит штатно, без сообщений. Все установки (кроме запуска валидатора и просмотрщика) - дефолтные. Куда можно покопать?
2. Кроме того, справа не раскрывается табличка со стилями. Что-то нужно нажать?
3. Валидатор вылетает с ошибкой сценария fb2-valid-win32.vbs, строка 5, симв.1. "Системе не удаётся найти указанный путь"
В пятой строке вот что:
8<-------
cache.add "http://www.gribuser.ru/xml/fictionbook/2.0","file:///C:/Documents%20and%20Settings/%D0%90%D0%B4%D0%BC%D0%B8%D0%BD%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%82%D0%BE%D1%80/Application%20Data/OpenOffice.org/3/user/uno_packages/cache/uno_packages/1A.tmp_/OOoFBTools.oxt\fb2-schema\FictionBook.xsd"
8<--------
Так действительно должно быть?
BooxReader
Новенький участник форума
Новенький участник форума
 
Сообщений: 1
Зарегистрирован: Чт фев 11, 2010 13:50

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение vadimnt » Чт фев 25, 2010 12:05

Благодарю разработчика за прекрасный инструмент.

В последней версии (1.14) мной замечена ошибка:
если в СНОСКАХ есть маркированные списки, то при конвертации в них пропадают маркеры.
В более ранних версиях этой ошибки не было.
vadimnt
Новенький участник форума
Новенький участник форума
 
Сообщений: 1
Зарегистрирован: Чт фев 25, 2010 11:48

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение DikBSD » Пн мар 01, 2010 11:30

Спасибо за все сообщения. Сейчас нет времени подробно ответить - посмотрю, что исправить - исправлю...
DikBSD
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 269
Зарегистрирован: Ср ноя 14, 2007 23:04
Откуда: Рязань

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение mage » Пн мар 01, 2010 12:56

Поиском не нашел. Дано. linux + openoffice (постоянно обновляется, сейчас 3.2.0, было и раньше) + OOfbTools 1.1.12 (было и раньше)
Проблема в следующем. Конвертирую по умолчанию в utf-8 (вся система у меня utf-8)
Текст в windows mobile (alreader) читается отлично, а заголовок, который Название, Авторы и так далее - кракозябры, которые опознаются как символы utf-8 написанные в кодировке cp1251 as is. То же самое сделанное из под windows 7 + open office 3.2.0 + 1.1.13 читается полностью нормально. Похоже что заголовок формируется в системной кодировке (неправда, из под линукс, если сказать cp1251, то все сформировалось в cp1251, только что проверил)
Так, попробовал только что обновить OOfbTools до последних (1.1.14). Сделал 2 книги - одна в cp1251, другая в utf-8. Содержимое в WM в обеих читается, а заголовок - в обеих не читается (хотя в одной он cp1251, в другой - utf8, vim рулит)
Ничего не понимаю. Сделанные книги из-под windows читается заголовок нормально
Как сделать нормальный заголовок под linux? (В принципе-то читать не мешает, но как-то не аккуратненько)
mage
Новенький участник форума
Новенький участник форума
 
Сообщений: 1
Зарегистрирован: Пн мар 01, 2010 12:36

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение DikBSD » Чт мар 11, 2010 20:26

У меня все нормально - и под Виндовс и под Линуксом...
НО! У меня стоит пока еще OOo3.1, а у вас - 3.2. Возможно дело в этом. Сейчас ужасно занят до конца месяца точно. Потом поставл. 3.2 - посмотрю, что получится (есть сообщения, что под 3.2 беда с картинками и маркерами - УСТАЛ исправлять одно и то же постоянно из-за изменений в OOo!!!!)
Посмотрю чуть позже, ладно?
DikBSD
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 269
Зарегистрирован: Ср ноя 14, 2007 23:04
Откуда: Рязань

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение onk » Ср апр 07, 2010 9:56

Есть предложение добавить в список импортируемых форматов еще и fb2.
Или оно есть, а я не понял как?
onk
Новенький участник форума
Новенький участник форума
 
Сообщений: 3
Зарегистрирован: Пт янв 18, 2008 13:58

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение DikBSD » Вт апр 13, 2010 10:21

onk писал(а):Есть предложение добавить в список импортируемых форматов еще и fb2.
Или оно есть, а я не понял как?

В будущем планируется, но пока - одни трудности с этим (уже пытался делать импорт fb2):
1. DOM в OOo работает коряво с кирилицей - вернее - вообще не работает. Так что придется забыть про xml и писать свой парсе fb2-файлов для импорта. А этол - все равно, что написать новый конвертер ExportToFB21 - по объему!
2. Если fb2-файлы имеют структуру - все в один абзац (как с Либрусека ) - то переменные в Ooo не позолят загрузить огромные блоки. Надо будет писать спец алгоритмы. А это - время.
Это - то с чем я столкнулся уже, когда начинал писать импорт fb2. В будущем, если посетят светлые мысли, или кто что подскажет - будет делать и импорт. А пока - еще есть много задумок важных...
DikBSD
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 269
Зарегистрирован: Ср ноя 14, 2007 23:04
Откуда: Рязань

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение DikBSD » Вт апр 13, 2010 10:26

Выложил новый релиз пакета OOoFBTools-1.15:
1. Конвертер ExportToFB21:
а). Переделан экспорт Картинок, Формул и Диаграмм. Алгоритм стал более универсальным. Раньше программа "вылетала" с ошибкой, если встречался нестандартный тип картинки.
б). Исправлена ошибка вылета конвертора при экспорте картинок, если в документе была не сама картинка, а ссылка на сайт (http:/// или ftp:/// или https:///). Исправлено. Теперь экспортируется тэг этой картинки в нужном месте fb2-файла, а сама картинка - нет, т.к. ее "не достать".
в). Увеличено число экспортируемых картинок - векторная графика.
г). Дополнил FAQ по Картинкам в Справке.
д). Сделан экспорт пустых строк для Аннотации Книги.
е). Сделан экспорт нумерованных и маркерованных списков из текста сносок (Примечаний).
ж). Значительные улучшения экспорта сносок!
з). Дополнения в файле-примере ExportToFB21_Test-2.odt (Часть III. Нумерция и Маркеры в тексте Сносок)
и). Дополнения в Справке в Разделе Вопросы-Ответы/Картинки - 8. Не экспортируются Картинки и Графика из текста Сносок (Примечаний)
2. Ручная обработка абзацев - Новый инструмент. Обрабатывает либо один или несколько выделенных фрагментов текста, либо весь документ. Может делать:
1). Инструмент "Обрыв абзаца (¶)" :
а). Склейка в 1 абзац ( Замена обрыв абзаца ¶ на 1 пробел )
б). Склейка в 1 абзац ( Удаление обрыв абзаца ¶ )
в). Заменить обрыв абзаца ¶ на разрыв строки \n
2). Разрыв строки (\n)
а). Склейка в 1 абзац ( Замена обрыва строки \n на 1 пробел )
б). Склейка в 1 абзац ( Удаление обрыва строки \n )
в). Заменить разрыв строки \n на обрыв абзаца ¶
Инструменты очень удобны в тех случаях, когда надо склеить разорванные абзацы или строки в один абзац в отдельных частях документа, а автоматическая склейка в Корректоре Текста может склеить и те абзацы, которые не нуждаются в этом. Подробности см. в Справке.
a). Новый раздел в Справке "III.2. Обработка выделенных абзацев (обрыв абзаца или строки)" - описание Нового инструмента.

Сайт программы: http://code.google.com/p/ooofbtools/
Скачать пакет: http://ooofbtools.googlecode.com/files/ ... s-1.15.zip

P.S. Если у кого-то вылетает ошибка в конце конвертирования - ругань на .vbs файл (это проверка на валидность созданного fb2-файла), то просто отключите в Настройках Еонвертера проверку на валидность.
Я пока не разбирался, почему на разныых версиях Windows такое бывает - скорее всего изх-за разных xml-библиотек.
DikBSD
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 269
Зарегистрирован: Ср ноя 14, 2007 23:04
Откуда: Рязань

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение dmitry-vm » Вт апр 20, 2010 13:40

Поставил ubuntu 9.10. В результате при нажатии кнопки "export to fb2 format" получаю отладочное окно и сообщение "Basic runtime error. Object variable not set". Дебуггер стоит в строке

oInfoDlg.Model.FilenameTextField.Text = ConvertFromUrl( sCurDocFile )
InitInfoDlg() ' инициализация основной формы конвертера в зависимости от локали
InitServiceDlgMessage() ' инициализация сообщений диалога Настроек в зависимости от локали
oProgressBar.setValue(3) ' Статусбар


То же самое примерно происходит при попытке включения "Greek keyboard" и других.

Версия open office 3.1.1
dmitry-vm
Новенький участник форума
Новенький участник форума
 
Сообщений: 4
Зарегистрирован: Ср ноя 18, 2009 11:57

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение dmitry-vm » Ср апр 21, 2010 11:43

Проблема исправилась ручной установкой OpenOffice 3.2
dmitry-vm
Новенький участник форума
Новенький участник форума
 
Сообщений: 4
Зарегистрирован: Ср ноя 18, 2009 11:57

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение JAW » Пт апр 23, 2010 20:54

Ребята. Сегодня в очередной раз озадачился вопросом конвертации материалов в FB2...
Пришла мысль поискать по OpenOffice to FB2. Нашёл.
Скачал. Офигел.

Я насмотрелся и намучился с кучей инструментов для создания FB2, но ни одного, где не требовалась по сути ручная правка не нашёл.
Это, похоже первый.

Рекомендовал бы авторам ознакомиться с пакетом Перестройка Хозяйного для MS Office. Некоторую функциональность этого пакета они уже реализовали.
Хотелось бы ещё вгонку/выгонку строк (т.к. раз уж замахнулись, то не FB2 единым :) и так уже большая помощь верстальщику), пакетную замену по списку RegExp.

А если ещё таки "хакнут" вордовские макросы MathType и заведут его на OpenOffice...

А самая жирная хотелка, это не останавливаться на FB2, а двигать в сторону ePUB. Ага... С экспортом графики по классам, в частности в SVG формул и вектора :)

Создал тему на другом форуме...
http://www.the-ebook.org/forum/viewtopi ... 670#380670

Ещё раз... По хорошему поражён и восхищён. Остальные креаторы FB2 идут лесом...
JAW
Новенький участник форума
Новенький участник форума
 
Сообщений: 24
Зарегистрирован: Пн июн 18, 2007 17:39

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение JAW » Пт апр 23, 2010 21:04

Да... Есть нюансики, пакет пару часов копал, но некоторые вещи уже сейчас очевидны.

1) Вы забыли про замечательный стиль "Normal" :) Это довольно важно, т.к. он должен быть в той же группе стилей, что и стили основного шаблона.
2) В символьных стилях должны быть стили дублирующие обычные болды, италики и т.п.
3) В OpenOffice очень неудобно назначаются клавиатурные сокращения на стили. Хотелось бы над этим моментом подумать.
4) Стили OOeFBTools имеет смысл выделить в отдельную специальную группу.
5) Я не знаю, есть ли штатные средства, но нужно иметь способ групповой замены стилей на стили OOoFBTools.

6) OFF Ну и имечко Вы придумали :) /OFF
JAW
Новенький участник форума
Новенький участник форума
 
Сообщений: 24
Зарегистрирован: Пн июн 18, 2007 17:39

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение DikBSD » Сб апр 24, 2010 15:54

Спасибо за сообщение. Я рад любым свежим идеям и предложениям по развитию и улучшению пакета.
Ваши предложения занес в TODO - потом буду смотреть, что можно сделать...

Кстаити, насчет "А если ещё таки "хакнут" вордовские макросы MathType и заведут его на OpenOffice..." - стыдно сказать - никогда не сталкивался с MathType. Если дадите ссылку - посмотрю, что можно сделать...
DikBSD
Зрелый участник форума
Зрелый участник форума
 
Сообщений: 269
Зарегистрирован: Ср ноя 14, 2007 23:04
Откуда: Рязань

Re: Межплатформенный пакет инструментов OOoFBTools для OOoWriter

Сообщение JAW » Вс апр 25, 2010 9:41

DikBSD писал(а):Кстаити, насчет "А если ещё таки "хакнут" вордовские макросы MathType и заведут его на OpenOffice..." - стыдно сказать - никогда не сталкивался с MathType. Если дадите ссылку - посмотрю, что можно сделать...

http://www.dessci.com/en/products/mathtype/default.htm
Это по сути Вордовский Equation. Вернее Equation это очень старая версия MathType.
Сила его макросов в возможности пакетного форматирования формул в единый стандарт и пакетного же экспорта с оставлением ссылок на формулы и сохранением базовой линии. Таки вопрос импорта этого безобразия в InDesign... :)

А сила той "Перестройки" в том, что она дала возможность полноценной вёрстки в Ворде.

Это всё не сильно относиться к FB2, но... OpenOffice теоретически может стать полноценной заменой системам вёрстки, типа Ventura Publisher.
И ваши макросы в состоянии сдвинуть OO в соответствующем направлении. Вентуру Corel убил. А замены таки нет... :(
JAW
Новенький участник форума
Новенький участник форума
 
Сообщений: 24
Зарегистрирован: Пн июн 18, 2007 17:39

Пред.След.

Вернуться в Сделано для FB

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1