RU/2: Форум. Общение пользователей и разработчиков OS/2 (eCS). : PDF конвертер


Список сообщений | Написать новое | Ответить на сообщение | Домой Поиск:
Предыдущее сообщение | Следующее сообщение
From : valerius
To : Юрий Пронякин
Subj : PDF конвертер

> > То, что русские буквы не извлекает --
> > не удивительно, т.к. русские буквы вроде в pdf сохраняются как картинки или метафайлы.
>
> Несколько не так. В картинки буквы не конвертируются, они так буквами и остаются. Вот только кодировка этих букв может быть непредсказуемой (практически, выбираемой случайным образом при создании этого файла). Причём это в равной мере относится к буквам любого алфавита, в том числе и английского. (Правда с английским это намного реже случается.)
> А теперь встань на место автора конвертера. Русские буквы в HTML нужно записать в какой-то стандартной кодировке (напр., ANSI-1251), для этого их нужно в неё переконвертировать из исходной, но как это сделать если исходная в любом случае неизвестна?

кодировка непердсказуемая? странно, а почему? А как тогда Acrobat Reader и туча других pdf-вьюверов их отображает? Почему бы и конвертеру не использовать тот же алгоритм?


Fri 15 May 2009 11:39 Mozilla/5.0 (OS/2; U; Warp 4.5; en-US; rv:1.7.10) Gecko/2005




Programmed by Dmitri Maximovich, Dmitry I. Platonoff, Eugen Kuleshov.
25.09.99 (c) 1999, RU/2. All rights reserved.
Rewritten by Dmitry Ban. All rights ignored.