Kis
Активист
Вне Форума
Сообщений: 434
Россия, Москва
Пол:
|
Вадиму: Я тоже могу так сказать: doc я не употребляю, а fb2 мне нравится. Главное достоинство xml-ных форматов (для меня и многих читателей) в том, что для их чтения не нужны никакие спец. программы. В крайнем случае xml-ный файл можно просмотреть браузером или текстовым редактором. Просто специальные читалки отображают его более удобно и красиво. Более того, "любая винда" читает doc "сходу" довольно криво -- лишь при помощи Wordpad-а (этакого блокнота-переростка и текстового процессора-недомерка одновременно). И для более-менее комфортного чтения doc нужно (именно нужно!) ставить специальную громоздкую и очень глюкавую (особенно на больших файлах со вставленными объектами) программу MS Word. И альтернативные варианты типа OpenOffice.org не являются полноценной заменой, так как в них файл в общем случае все равно будет отображаться немного не так, как это хотел автор файла. Если внимательно перечитать мой пост #75, то, я надеюсь, станет ясно, что я не спорю о том, какой формат лучше. Я давно знаю, что в каждом формате можно найти какие-то плюсы в каждом конкретном случае. Я не требую от других делать книги в единственном любимом мною формате. Я всего лишь предлагаю делать книги в том формате, в каком это будет удобно большинству (в идеале всем). Рассмотрим для примера такую ситуацию: вы любите doc, я люблю fb2. Вы делаете для всех doc-книгу, я делаю для всех fb2-книгу. Вы скачиваете мою fb2, драг-эн-дропаете ее на ярлык скрипта fb2toany, еще пара-тройка кликов, и получаете свой любимый doc (ну или rtf, я уж точно не помню, в нашем случае это фактически одно и то же). А я скачиваю вашу doc, преобразовываю аналогичным скриптом в fb2, дальше (тихо ругаясь сквозь зубы) просматриваю результат, нахожу систематические ошибки типа склеившихся курсивных и некурсивных слов, корявых пробелов, неправильных заголовков и еще черт знает чего, наскоро обрабатываю в текстовом редакторе, внутренне плача смотрю на лишние тэги типа некурсивных пробелов внутри курсивного текста, плюю на это, загружаю в КПК и иду читать. И кто же после этого требует от других знания нелюбимых форматов? Насчет pdf и djvu: тут мое IMHO состоит в том, что мне djvu удобнее тем, что программы для его просмотра, которые я использую, гораздо менее массивны, чем Adobe Reader, и они мне привычнее и поэтому удобнее. Но я вообще еще не смотрел альтернативных программ для просмотра pdf, поэтому чего-то объективного на эту тему сказать не могу. Существенное преимущество djvu перед pdf приводил на этом форуме незабвенный перфекционист Minor, но для меня это преимущество неактуально, и поэтому с (более-менее) объективной точки зрения я не вижу существенных отличий у этих форматов. Все-таки задача у них одна, и поэтому они весьма схожи друг с другом. (Точно так же немного схожи внешне акула и дельфин: у них одна задача -- выжить в водной среде.)
Lykas-у: Холивар -- это священная война (holy war) между флеймерами. Самый классический пример -- что лучше, Linux или Windows? Причем с одной стороны главным аргументом служит выражение "Windoze mustdie", а с другой -- фраза "да видел я ваш линух, он у меня не установился, ничего в нем нет хорошего". А про формулы в Ворде со мной спорить бесполезно. У нас здесь совершенно разные критерии качества. Вам хватает того, что предлагает Ворд, а меня это категорически не устраивает. Для формул служит TeX, и это в определенной среде уже давно не обсуждается. И формулы в Ворде против формул в TeX-е -- это все равно что каляки трехлетнего ребенка против работы профессионального графика. Я тоже могу предложить вам в качестве разминки классический пример: Вы подготовили статью с сотнями формул для русского журнала (т. е. для журнала с русскими полиграфическими традициями), где значки пределов интегрирования пишутся сверху и снизу знака интеграла. А потом решили подготовить эту же статью для американского журнала (с другими полиграфическими традициями), где такие значки требуют писать справа от верхнего и нижнего хвостов знака интеграла. И решите-ка быстро эту проблему в Ворде (в TeX-е ее можно решить одной строчкой).
И для всех, кому интересна эта дискуссия: Давайте все-таки увидим лес за деревьями. Я хотел лишь узнать, зачем надо готовить OCR из этой серии? Если делать это качественно, то уйдет много времени, а если некачественно, то зачем вообще это делать? Не лучше ли потратить время на более актуальные задачи? И какая разница будет в результате между doc и djvu (и то, и другое придется читать с большого монитора, а не с КПК)? Впрочем, последнее -- это вопрос для отдельной дискуссии, как лучше читать: с монитора и сидя на стуле или с КПК и удобно устроившись на диване. Кстати, я могу дать для обработки сырые сканы имеющихся у меня книжек этой серии. Или уж лучше делать OCR библиотечки журнала "Квант", в которой я вижу наиболее близкий современный аналог НПБ. По крайней мере, такой OCR может пригодиться школьникам для изготовления своих рефератов и докладов.
Мы очень сильно ушли в оффтопик. Если дальнейшее обсуждение этой темы кому-то интересно, то прошу уважаемого модератора откусить последние посты и перенести их в более техническую часть форума (или даже во флейм).
|