информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Где водятся OGRыСетевые кракеры и правда о деле Левина
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Три миллиона электронных замков... 
 Doom на газонокосилках 
 Умер Никлаус Вирт 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / programming
Имя Пароль
ФОРУМ
если вы видите этот текст, отключите в настройках форума использование JavaScript
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 10.05.01 19:50  Число просмотров: 837
Автор: NiFi... <NiFiGaSebe!> Статус: Member
<"чистая" ссылка>
> Кстати, кому надо, могу перловый скриптец кинуть, каким я
> все это дело обрабатывал. .....
> Короче - че делать будем ? Архивы довольно неплохие. Неее,
> очень неплохие. Может выложить куда-нибудь ?
xotish, mogu u sebja na novom sajte vilozhit...?
<programming>
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 10.05.01 19:00  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>
Кстати, кому надо, могу перловый скриптец кинуть, каким я все это дело обрабатывал. .....
Короче - че делать будем ? Архивы довольно неплохие. Неее, очень неплохие. Может выложить куда-нибудь ?

Все это в виде архивов, неплохо оформлено. В коде HTML мусор отсутствует. :-)
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 10.05.01 19:50  
Автор: NiFi... <NiFiGaSebe!> Статус: Member
<"чистая" ссылка>
> Кстати, кому надо, могу перловый скриптец кинуть, каким я
> все это дело обрабатывал. .....
> Короче - че делать будем ? Архивы довольно неплохие. Неее,
> очень неплохие. Может выложить куда-нибудь ?
xotish, mogu u sebja na novom sajte vilozhit...?
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 11.05.01 10:50  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>

> xotish, mogu u sebja na novom sajte vilozhit...?

Так давай. Говори куда отмыливать. И какими кусками.
Все это дело упакованое ~ 1.8 Mb
[Unix] Програмеры! Ура! :-) Я выкачал весь архив форума по прог. под Linux/unix, убрал мусор, сделал читабельным 11.05.01 03:42  
Автор: falcon_fd Статус: Незарегистрированный пользователь
<"чистая" ссылка>
> > Кстати, кому надо, могу перловый скриптец кинуть,
> каким я
> > все это дело обрабатывал. .....
> > Короче - че делать будем ? Архивы довольно неплохие.
> Неее,
> > очень неплохие. Может выложить куда-нибудь ?
> xotish, mogu u sebja na novom sajte vilozhit...?

Хочу скриптец.
Хочу архив.
Вот такой я халявщик :)
[Unix] Ok. Скрипт тут (+) Да и описание принципа тут же. 11.05.01 10:51  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>
Этот архвив с сайта www.linux.org.ru. Я всял страницы "индексные" (с вопросами и ссылками на ответы) и обработал скриптом. А скрипт писал так, чтобы в результате у меня получился новый "индексный файл", где ссылки на ответы будут локальными, и чтобы получился файл .GRX, для импорта в GetRight...

Короче тут легко разобраться.



# Program by KMiNT21
#!perl.exe

# Для обработки форума с http://www.linux.org.ru:8101

opendir(Dir, $INC[2])                        |die "Что-то не то с функцией opendir : $!\n";

while ($file = readdir(Dir))
{
  if ($file !~m/.msg/i) { next; }
  if ($file =~m/.GRX/i) { next; }
  if ($file =~m/.NEW/i) { next; }

  open(hFile,"$file"); open(hOutFile,">$file.HTML"); open(hGrxFile,">$file.GRX"); 
  binmode hFile; binmode hOutFile; binmode hGrxFile; 

  while (!eof(hFile))
    {
    $c=f_getc(hFile);
    if ($c eq '<') { 
      $s=$c.f_getc(hFile); # это для случаев, когда попадет тэг <P> или похожий
      $s=$s.f_getc(hFile); if ($s =~m/>/i) { print hOutFile "$s"; next; }
      $s=$s.f_getc(hFile); if ($s =~m/>/i) { print hOutFile "$s"; next; }

      # Убьемвыборочносслылки "<a " (ищем анкеры)
      if ($s =~m/<a /i) { 
        $s=$s.f_getc(hFile) until ($s =~m/>/i);
        # если ссылка не на просмотр сообщения, то не будем ее трогать
        if ($s !~m/view-mess/i) { print hOutFile "$s"; next; }
        # теперь вырежем сам линк из всего анкера
        if ($s =~ /href="/) { $s = "$'"; }
        if ($s =~ /"/) { $s = "$`"; }
        # и сохраняем его, предварительно сделав его глобальным
        print hGrxFile "URL: http://www.linux.org.ru:8101/"."$s\r\n";
        # теперь вытянем из всего линка Message ID (msgid=)
        if ($s =~ /(\d+)/) { }
        # и сохраним его, добавив PATH
        print hGrxFile "FILE: c:\\$file.dir\\$1.html\r\n\r\n";
        print hOutFile "<a href=\"$file.dir\\$1.html\">";
        next;
        }
      # если ничего "такого", просто копируем и идем дальше
      print hOutFile "$s";
      }
    else # Если обычный поток данных, просто записываем в файл
      {
      print hOutFile "$c";
      }

    } # next WHILE NOT EOF

  close(hFile); close(hOutFile); close(hGrxFile);


} # enum FILES in DIR
closedir(Dir);

sub f_getc(hFile)
  {
  if (!eof(hFile)) { return getc(hFile); }
  print " - bad HTML! ";
  next; # продолжим нормально программу, если у нас глючно с тэгами. фиг с ними
  }







---

http://www.linux.org.ru
!!!! нет, ну какого хрена новый скрипт борды не пропускает ??? ипоганило исходник.... 11.05.01 10:53  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>
Вот млин...
fixed 11.05.01 13:21  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
Great thenks! :-) 14.05.01 14:58  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>
Ладно, а если .... (test) 11.05.01 11:05  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>

Пока (все не будет гуд) будем { кричать_на_доску; ругаться; если (ноль внимания) то { выбор (настроение) { ok: фиг с ним; !ok: два пошло оно все; ??: гм.... что-то тут не так Сказать ("Эх..."); } }

http://localhost_
Ладно, а если .... (test) 11.05.01 11:01  
Автор: KMiNT21 <http://blog.kmint21.com> Статус: Member
<"чистая" ссылка>

Пока (все не будет гуд) будем { кричать_на_доску; ругаться; если (ноль внимания) то { выбор (настроение) { ok: фиг с ним; !ok: два пошло оно все; ??: гм.... что-то тут не так Сказать ("Эх..."); } }

http://localhost_
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2024 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach