RU/2: Форум. Общение пользователей и разработчиков OS/2 (eCS). : Ответить на сообщение
Имя:
e-mail:
FIDO:
Home page:
сохранить данные о вас
Тема:
> > > > Вообще не пойму чего ты в позу встаешь... Мне самому Java очень нравится, особенно как язык програмирования (JVM - отдельная песня, но и тут прогресс налицо). Не надо из меня делать врага рода человеческого. Я просто хотел поделиться своим опытом с человеком который спрашивал. Ну нету у меня пока опыта с Java, у тебя есть - ты бы и поделился. > > > А чем, я по твоему занимаюсь? :) > > Перепалкой со мной :) Из нее человек непосвященный, кроме нескольких полезных урлов вообще ничего не извлечет мне кажется. Я - извлекаю, за что тебе спасибо :-). > > Ну если ты считаешь... В первую очередь я это для себя делаю. Неплохой полигон для полировки аргументов и открытия для себя новых плюсов и минусов любимой технологии. Ну и потом, я же вижу, что ты совсем не ламер, посему могу себе позволить иногда не вдаваться в технические подробности. :) > > > > Смертельного вообще ни в чем ничего нет. Другое дело, что после некоторого предела ты будешь обязан половину времени угрохивать на соглашения между разработчиками. > > Ну это не так уж и сложно на самом деле... > > сказал бы я, но Дима Платонов меня уже опередил. :) > > > > > В перле вообще можно делать все что угодно, так язык задуман. Может это и неправильно, признаюсь что и меня иногда достает. Но такой уж язык. Каждый язык имеет свои особенности. > > > Угу. Какойнить Вася Пупкин, чтобы достичь свои сиюминутные интересы, воспользуется моим внутренним методом (я бы в Java его protected объявил, а тут низя...), а потом, когдя я его ликвидирую или поменяю логику работы, то я еще и виноват буду, что его программа работать перестала... > > А Вася Пупкин в каком-нибудь линуксе или фре может вообще сорцы взять и там такого наворочать... Против лома нет приема. > > Одно дело, когда реализация скрыта от пользователя библиотеки (другого программиста в данном случае) и он использует только то. что торчит наружу. И совсем другое дело, когда наружу торчит все. Наличие исходников может присутствовать в обоих случаях. > > > > > В PW ничего не запускается. Перловская dll там подгружена всегда, а скрипт компилится в байткод при первом запуске, байткод кешируется в памяти и при последующих запусках отрабатывает мгновенно. > > > Это что, они свой интерпретатор перла написали и встроили его унутрь на манер mod_perl? > > Что-то среднее, насколько я понимаю. В оси екзешник перла делает довольно мало - грузит, память выделяет, препроцессирует скрипт, и все. Весь интерпретатор - в DLL. Так что PW часть функций екзешника делает сам, а дальше использует функции из перловой DLL напрямую. > > Это как раз тот самый случай закрытой технологии. Перестали разработчики поддерживать PW и он быстро и тихо устарел и загнулся. > > > > > Я же сказал - можно в базу данных слить. Сейчас как раз этим занимаюсь. Очень неплохо получается. > > > А можешь себе представить, что есть варианты и без файликов, и без базы. :) > > Можно еще в памяти держать, но это уж очень неэффективно. Меня честно говоря просто файлы вполне устраивают, с базой я развлекаюсь для самообразования. > > Как раз в памяти то и эффективно. Никакого мусора на диске... его (этот мусор) надо ведь прибивать после того, как сессия завершится (скажем по таймауту). > > > > > > Что ты проверял? Что должна такого нетривиального уметь такая "библиотека"? Где ты проверял? И ты так и не сказал зачем тебе regexpы. > > Чтобы обрабатывать сложные иерархические тексты. Есть старинная база данных, которая ведется со времен big iron, и содержит практически все что в нашей науке накоплено с 1954-го года примерно. Эта база исходно была в plain text files, на лентах нам ее присылали когда-то. По ходу дела там разработали довольно сложный язык описания данных, существующий в нескольких версиях. Кроме того, есть данные которые вообще в своем собственном стандарте формата лежат, ну так исторически сложилось. И вся эта каша в размере сотен гигабайт так и хранится в текстовых файлах. Ну ясное дело физически они сейчас загружены в какую-то RDB и даже проиндексированы :). Но сами данные так и описываются текстовым языком. Задачи две... нет, даже три. Пропарсить и разобрать эти данные, перевести в другой, новый, но тоже текстовый формат (который раз в 20 сложнее тоже нехилого старого :), потом разобрать все это на поля и загрузить в SQL базу. Ну и потом уметь сделать обратное преобразование из SQL тоже, причем динамически и в оба формата - старый и новый. Да, и еще уметь принимать от пользователя новые данные в любом из двух форматов, парсить их, проверять на синтаксическую правильность (физическую тоже, но это отдельная задача, не моя) и грузить в SQL базу. Ну еще есть масса промежуточных задач - этот новый текстовый формат описывается на трех уровнях (все - текстовые): DDL, Data Dictionary и собственно описание базы. Все это надо уметь парсить, обрабатывать, грузить в SQL и обратно, переводить из одного вида в другой. > > В общем, без regexp даже соваться в такой проект бессмысленно. Там надо обрабатывать гигабайты текста, и весьма сложного... > > Отпарсить его один раз. Положить в XML (раз уж он иерархический) и уже с XMLем и работать. > И потом, в SQL есть "унутре неонка". То есть regexpы твои. > > > Что касается моих собственных научных интересов то для них надо делать почти то же самое, но не с одной, а сразу с четырьмя (!) разными базами данных. И все - по сети, плюс интерактивный ввод пользователя. Не соскучишься... > > Хмм. > > > > > Пытался найти рабочий класс regexp для Java. Не нашел. Хотя попытки имеются, и не одна, так что народ эту проблему осознает как весьма сеьезную. Историю поисков с урлами могу изложить подробно если тебе интересно. > > > Непонятен термин "рабочий класс". :) > > Только сейчас я понял что сказал. :) > > > Работающий :). Попробовал я как-то запихнуть один свой файл всего на 5 мегабайт в какой-то из самодельных java regexp классов, так у меня ося сдохла даже не успев его до конца считать. Правда это давно было, года полтора назад. Но я следил - с тех пор сильного пргресса на этом фронте не наблюдалось. > > Хмм. Неправильно сдизайнен был видимо этот класс. По идее это должно быть сделано в виде filtered stream. А потоку уже пофигу на объемы... хотя это может от реализации потока зависить. > > > > У ru/2 ежедневных визиторов около 900. И они каждый день просматирвают порядка 7000 документов. Совсем мало. Но лично меня достало использовать 3..4 языка для разных нужд. В этом отношении Java практически идеальна. > > А для меня почти идеален оказался перл. Все относительно, для меня парсенье сложных текстов - 90% головной боли, а все остальное - мелкие детали. > > Ну изначально он для работы с текстами и предназначался. Java - она более универсальна. И в твоем случае пожалуй нужна хорошая библиотека что называется "под себя". >
__, _,_ _, __, ___,
|_) | | | |_ ` /
| \ | | | , | /
~ ~ `~' ~~~ ~~~ ~~~
Programmed by
Dmitri Maximovich
,
Dmitry I. Platonoff
,
Eugen Kuleshov
.
25.09.99 (c) 1999,
RU/2
. All rights reserved.
Rewritten by
Dmitry Ban
. All rights ignored.