[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 10.05.01 19:00 Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
Кстати, кому надо, могу перловый скриптец кинуть, каким я все это дело обрабатывал. .....
Короче - че делать будем ? Архивы довольно неплохие. Неее, очень неплохие. Может выложить куда-нибудь ?
Все это в виде архивов, неплохо оформлено. В коде HTML мусор отсутствует. :-)
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 10.05.01 19:50 Автор: NiFi... <NiFiGaSebe!> Статус: Member
> Кстати, кому надо, могу перловый скриптец кинуть, каким я > все это дело обрабатывал. ..... > Короче - че делать будем ? Архивы довольно неплохие. Неее, > очень неплохие. Может выложить куда-нибудь ? xotish, mogu u sebja na novom sajte vilozhit...?
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 11.05.01 10:50 Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
> xotish, mogu u sebja na novom sajte vilozhit...?
Так давай. Говори куда отмыливать. И какими кусками.
Все это дело упакованое ~ 1.8 Mb
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 11.05.01 03:42 Автор: falcon_fd Статус: Незарегистрированный пользователь
> > Кстати, кому надо, могу перловый скриптец кинуть, > каким я > > все это дело обрабатывал. ..... > > Короче - че делать будем ? Архивы довольно неплохие. > Неее, > > очень неплохие. Может выложить куда-нибудь ? > xotish, mogu u sebja na novom sajte vilozhit...?
Хочу скриптец.
Хочу архив.
Вот такой я халявщик :)
[Unix] Ok. Скрипт тут (+) Да и описание принципа тут же.11.05.01 10:51 Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
Этот архвив с сайта www.linux.org.ru. Я всял страницы "индексные" (с вопросами и ссылками на ответы) и обработал скриптом. А скрипт писал так, чтобы в результате у меня получился новый "индексный файл", где ссылки на ответы будут локальными, и чтобы получился файл .GRX, для импорта в GetRight...
Короче тут легко разобраться.
# Program by KMiNT21
#!perl.exe
# Для обработки форума с http://www.linux.org.ru:8101
opendir(Dir, $INC[2]) |die "Что-то не то с функцией opendir : $!\n";
while ($file = readdir(Dir))
{
if ($file !~m/.msg/i) { next; }
if ($file =~m/.GRX/i) { next; }
if ($file =~m/.NEW/i) { next; }
open(hFile,"$file"); open(hOutFile,">$file.HTML"); open(hGrxFile,">$file.GRX");
binmode hFile; binmode hOutFile; binmode hGrxFile;
while (!eof(hFile))
{
$c=f_getc(hFile);
if ($c eq '<') {
$s=$c.f_getc(hFile); # это для случаев, когда попадет тэг <P> или похожий
$s=$s.f_getc(hFile); if ($s =~m/>/i) { print hOutFile "$s"; next; }
$s=$s.f_getc(hFile); if ($s =~m/>/i) { print hOutFile "$s"; next; }
# Убьемвыборочносслылки "<a " (ищем анкеры)
if ($s =~m/<a /i) {
$s=$s.f_getc(hFile) until ($s =~m/>/i);
# если ссылка не на просмотр сообщения, то не будем ее трогать
if ($s !~m/view-mess/i) { print hOutFile "$s"; next; }
# теперь вырежем сам линк из всего анкера
if ($s =~ /href="/) { $s = "$'"; }
if ($s =~ /"/) { $s = "$`"; }
# и сохраняем его, предварительно сделав его глобальным
print hGrxFile "URL: http://www.linux.org.ru:8101/"."$s\r\n";
# теперь вытянем из всего линка Message ID (msgid=)
if ($s =~ /(\d+)/) { }
# и сохраним его, добавив PATH
print hGrxFile "FILE: c:\\$file.dir\\$1.html\r\n\r\n";
print hOutFile "<a href=\"$file.dir\\$1.html\">";
next;
}
# если ничего "такого", просто копируем и идем дальше
print hOutFile "$s";
}
else # Если обычный поток данных, просто записываем в файл
{
print hOutFile "$c";
}
} # next WHILE NOT EOF
close(hFile); close(hOutFile); close(hGrxFile);
} # enum FILES in DIR
closedir(Dir);
sub f_getc(hFile)
{
if (!eof(hFile)) { return getc(hFile); }
print " - bad HTML! ";
next; # продолжим нормально программу, если у нас глючно с тэгами. фиг с ними
}
!!!! нет, ну какого хрена новый скрипт борды не пропускает ??? ипоганило исходник.... 11.05.01 10:53 Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
Пока (все не будет гуд) будем
{
кричать_на_доску;
ругаться;
если (ноль внимания) то
{
выбор (настроение)
{
ok: фиг с ним;
!ok: два пошло оно все;
??: гм.... что-то тут не так
Сказать ("Эх...");
}
}
Пока (все не будет гуд) будем
{
кричать_на_доску;
ругаться;
если (ноль внимания) то
{
выбор (настроение)
{
ok: фиг с ним;
!ok: два пошло оно все;
??: гм.... что-то тут не так
Сказать ("Эх...");
}
}