RU/2: Форум. Общение пользователей и разработчиков OS/2 (eCS). : Ответить на сообщение
Имя:
e-mail:
FIDO:
Home page:
сохранить данные о вас
Тема:
> > > То, что русские буквы не извлекает -- > > > не удивительно, т.к. русские буквы вроде в pdf сохраняются как картинки или метафайлы. > > > > Несколько не так. В картинки буквы не конвертируются, они так буквами и остаются. Вот только кодировка этих букв может быть непредсказуемой (практически, выбираемой случайным образом при создании этого файла). Причём это в равной мере относится к буквам любого алфавита, в том числе и английского. (Правда с английским это намного реже случается.) > > А теперь встань на место автора конвертера. Русские буквы в HTML нужно записать в какой-то стандартной кодировке (напр., ANSI-1251), для этого их нужно в неё переконвертировать из исходной, но как это сделать если исходная в любом случае неизвестна? > > кодировка непердсказуемая? странно, а почему? А как тогда Acrobat Reader и туча других pdf-вьюверов их отображает? Почему бы и конвертеру не использовать тот же алгоритм? >
_, _, _, _, _ _, _,_
(_ | / \ |\ | / \ |_/
, ) | , \ / | \| \ / | \
~ ~~~ ~ ~ ~ ~ ~ ~
Programmed by
Dmitri Maximovich
,
Dmitry I. Platonoff
,
Eugen Kuleshov
.
25.09.99 (c) 1999,
RU/2
. All rights reserved.
Rewritten by
Dmitry Ban
. All rights ignored.