информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Атака на InternetПортрет посетителяSpanning Tree Protocol: недокументированное применение
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Три миллиона электронных замков... 
 Doom на газонокосилках 
 Умер Никлаус Вирт 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / operating systems
Имя Пароль
ФОРУМ
если вы видите этот текст, отключите в настройках форума использование JavaScript
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
Память пробывали махать - не получилось, с другой похожей от... 27.06.05 13:24  Число просмотров: 1937
Автор: TARASA <Taras L. Stadnik> Статус: Member
<"чистая" ссылка>
> Надо бы нвчать с того, что он сам просит сделать:
>
> > Additional Information:
> > There may be some bad memory either on an adapter
> card
> > or on the motherboard. If the problem continues,
> try
> > replacing the main system memory or adapter cards to
> > prevent future parity errors.
>
> Память регистрОвая, с четностью? Должна быть разумеется, на
> этих аппаратах другая может и не заработать.
> Видимо прошляпили, когда начали сыпаться "мягкие"
> (восстанавливаемые) ошибки. Поперли уже "жесткие", которые
> он определяет и понимает, что не может восстановить.
> Начать с чистки кнтактов модулей памяти и плат расширения.
> Погонять тесты с (если это возможно) отключенной проверкой
> четности.
> Или просто сразу память махнуть.

Память пробывали махать - не получилось, с другой похожей от Compaq сервер просто не стартует.
Встроенными компаковскими тестами память гоняли - сбоев небыло. Искать компоненты к нему материнку, процессорный блок etc .. - быстро не реально сейчас найти. Переодичность его такого поведения корреляции не поддается предпоследний раз - полтора года назад.

> Ну чего ему умирать (Новелю то). А регулярных сбоев надо
> недопускать, есть куча методов. Любить надо железо и тогда
> оно будет служить верой и правдой.

Под UPS стоит, в отдельно выделенном помещении без окон с кондиционером. Доступ имеют 4 человека
максимум сколько за один раз было шестеро. Любовью, имхо, эта железяка не обделена :)
Началось это все из-за сбоев по питанию, скачки напряжения такие, что UPS тихо дохнут, или вообще питание оключается часа на полтора. Скачки были всю последнюю неделю. С энергетиками уже устали ругаться.

> Это уже вскрытие покажет - может он пылью забит.
см. выше.

С суботы с обеда стоит работает без глюков.. может прошло, хотя копию ему на всякий случай сделаю на другом сервере. Этому уже 7 лет как. Может уже и пора естественным образом помереть.
<operating systems>
Novell: Server Halted 26.06.05 15:20  
Автор: TARASA <Taras L. Stadnik> Статус: Member
<"чистая" ссылка>
В последние пару дней наблюдаю переодически встающий колом Novell Netware 5.0
со следующей диагностикой:

Server WTC halted Sunday, 26 June 2005 6:09:06
Abend 1 on P00: Server-5.00a: Nonmaskable Interrupt Processor Exception (Error code 000000B0)

Registers:
CS = 0008 DS = 0010 ES = 0010 FS = 0010 GS = 0010 SS = 0010
EAX = 00000052 EBX = D2292B1D ECX = 00000006 EDX = D00D661D
ESI = D24A0A83 EDI = D2292B22 EBP = D2292D20 ESP = D2292AFC
EIP = D244CB3F FLAGS = 00000216
D244CB3F 0F8259000000 JB D244CB9E(no jump)
EIP in LFS.NLM at code start +00008B3Fh

Running process: Server 23 Process
Created by: NetWare Application
Thread Owned by NLM: SERVER.NLM
Stack pointer: D2292F88
OS Stack limit: D228F040
Scheduling priority: 67371008
Wait state: 50500F0 (Waiting for work)
Stack: --0000001A ?
--D24A0A51 ?
--D449BA20 ?
--D24A0A76 ?
D2A57CAD (NCP.NLMCode Start)+7CAD)
--D24A0A7C ?
--D2292B1C ?
--D2292D20 ?
--5F4F4600 ?
00024553 ?
--00000000 ?
--96D9106E ?
0002829D ?
D24625E4 (LSL.NLM|LSLFastSendComplete+24)
--D00DA100 ?
D35576B4 (CPQNF3.LANCode Start)+6B4)
--1F6D4638 ?
--1F6D463C ?
--1F6D4638 ?
--1F6D31E0 ?
D35612B7 (CPQNF3.LANCode Start)+A2B7)
--1F66B130 ?
--00000000 ?
--1F6D463C ?
--00000246 ?
FC01C055 ?
--D269C0A4 (FILESYS.NLM|GetFileSystemVersion+14A8)
--00000246 ?
FC01C055 ?
--D269C0A4 (FILESYS.NLM|GetFileSystemVersion+14A8)
--00000246 ?
--00000018 ?

Additional Information:
There may be some bad memory either on an adapter card or on the motherboard. If the problem continues, try replacing the main system memory or adapter cards to prevent future parity errors.

Loaded Modules:
SERVER.NLM NetWare Server Operating System
Version 5.00 27 August 1998
Code Address: FC000000h Length: 000A5000h
Data Address: FC5A5000h Length: 000C9000h
LOADER.EXE NetWare OS Loader
Code Address: 00012340h Length: 0001D000h
Data Address: 0002F340h Length: 00020CC0h
-- skip -- далее перечисляются все загруженные модули.

Вопрос: Медленно умирает или как-то витиевато умерла железка (Compaq Proliant 1600) на которой этот сервер стоит?
Нагнулся сам Novell по причине регулярных сбоев по питанию?
Или еще какая причина?

P.S Сам не специалист в Novell. Перекапывание google.com и документации конкретного ответа не дало.
Заранее спасибо за ответы - советы.
Надо бы нвчать с того, что он сам просит сделать: 27.06.05 12:38  
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
<"чистая" ссылка>
Надо бы нвчать с того, что он сам просит сделать:

> Additional Information:
> There may be some bad memory either on an adapter card
> or on the motherboard. If the problem continues, try
> replacing the main system memory or adapter cards to
> prevent future parity errors.

Память регистрОвая, с четностью? Должна быть разумеется, на этих аппаратах другая может и не заработать.
Видимо прошляпили, когда начали сыпаться "мягкие" (восстанавливаемые) ошибки. Поперли уже "жесткие", которые он определяет и понимает, что не может восстановить.
Начать с чистки кнтактов модулей памяти и плат расширения.
Погонять тесты с (если это возможно) отключенной проверкой четности.
Или просто сразу память махнуть.

> -- skip -- далее перечисляются все загруженные модули.
>
> Вопрос: Медленно умирает или как-то витиевато умерла
> железка (Compaq Proliant 1600) на которой этот сервер
> стоит?
> Нагнулся сам Novell по причине регулярных сбоев по питанию?

Ну чего ему умирать (Новелю то). А регулярных сбоев надо недопускать, есть куча методов. Любить надо железо и тогда оно будет служить верой и правдой.

> Или еще какая причина?

Это уже вскрытие покажет - может он пылью забит.

> P.S Сам не специалист в Novell. Перекапывание google.com и

Тут и не надо быть специалистом по Новелю, из-за железа любая операционка так валиться будет.

> документации конкретного ответа не дало.
> Заранее спасибо за ответы - советы.
Память пробывали махать - не получилось, с другой похожей от... 27.06.05 13:24  
Автор: TARASA <Taras L. Stadnik> Статус: Member
<"чистая" ссылка>
> Надо бы нвчать с того, что он сам просит сделать:
>
> > Additional Information:
> > There may be some bad memory either on an adapter
> card
> > or on the motherboard. If the problem continues,
> try
> > replacing the main system memory or adapter cards to
> > prevent future parity errors.
>
> Память регистрОвая, с четностью? Должна быть разумеется, на
> этих аппаратах другая может и не заработать.
> Видимо прошляпили, когда начали сыпаться "мягкие"
> (восстанавливаемые) ошибки. Поперли уже "жесткие", которые
> он определяет и понимает, что не может восстановить.
> Начать с чистки кнтактов модулей памяти и плат расширения.
> Погонять тесты с (если это возможно) отключенной проверкой
> четности.
> Или просто сразу память махнуть.

Память пробывали махать - не получилось, с другой похожей от Compaq сервер просто не стартует.
Встроенными компаковскими тестами память гоняли - сбоев небыло. Искать компоненты к нему материнку, процессорный блок etc .. - быстро не реально сейчас найти. Переодичность его такого поведения корреляции не поддается предпоследний раз - полтора года назад.

> Ну чего ему умирать (Новелю то). А регулярных сбоев надо
> недопускать, есть куча методов. Любить надо железо и тогда
> оно будет служить верой и правдой.

Под UPS стоит, в отдельно выделенном помещении без окон с кондиционером. Доступ имеют 4 человека
максимум сколько за один раз было шестеро. Любовью, имхо, эта железяка не обделена :)
Началось это все из-за сбоев по питанию, скачки напряжения такие, что UPS тихо дохнут, или вообще питание оключается часа на полтора. Скачки были всю последнюю неделю. С энергетиками уже устали ругаться.

> Это уже вскрытие покажет - может он пылью забит.
см. выше.

С суботы с обеда стоит работает без глюков.. может прошло, хотя копию ему на всякий случай сделаю на другом сервере. Этому уже 7 лет как. Может уже и пора естественным образом помереть.
Модули памяти, сколько их помню, все похожи, полоска текстолита с... 27.06.05 14:23  
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
Отредактировано 27.06.05 14:26  Количество правок: 5
<"чистая" ссылка>
> Память пробывали махать - не получилось, с другой похожей

Модули памяти, сколько их помню, все похожи, полоска текстолита с напаянными чипами.
Ставить нужно ту, с которой он должен работать.
Считаем количество больших микрух - возможны два варианта: (8 или 16) и (9 или 18). Скорее всего второй вариант. Затем ищем одну или две/три маленькие микрухи с парой-тройкой десятков ножек - может быть, может не быть. Можно еще прикинуть размеры модуля и вырезы со стороны контактов. Если по всем параметрам модули совпадают, то они могут быть взаимозаменяемыми.
Может стоит два модуля, тогда пробуем выдирать поочереди, если он с одним модулем работать будет (иногда их нужно парами ставить).

> от Compaq сервер просто не стартует.
> Встроенными компаковскими тестами память гоняли - сбоев

Коррекция ошибок должна быть выключена, чтоб ее тест показал, а не ОС.
Если тест не показывает ошибки, это еще не значит что их нет.
Полезно в сетапах (или где-нибудь еще) поискать лог софтовых ошибок памяти.

> небыло. Искать компоненты к нему материнку, процессорный
> блок etc .. - быстро не реально сейчас найти. Переодичность
> его такого поведения корреляции не поддается предпоследний
> раз - полтора года назад.

Как бы не начало учащаться.

> С суботы с обеда стоит работает без глюков.. может прошло,
> хотя копию ему на всякий случай сделаю на другом сервере.
> Этому уже 7 лет как. Может уже и пора естественным образом
> помереть.

Ему еще жить и жить. Аппарат то удачный.
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2024 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach