Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
[RC5] Теперь будем ждать, когда подкоманды, наконец, обновятся, чтоли? 29.11.05 09:05
Автор: ZhN Статус: Незарегистрированный пользователь
|
Не было печали, а теперь, когда вроде все заработало, так тяжело ждать статистики по подкомандам 8-). Типа как конфетку развернул, а сьесть не дают...
Музыка Тольятти
|
| |
Опять двадцать пять 30.11.05 09:16
Автор: DamNet <Denis Amelin> Статус: Elderman
|
:: 29-Nov-2005 10:21 CST (Tuesday) ::
UD seems to still be working the kinks out of their new data center. In the
meantime, stats and cvs are down...
вроде как все работает, но статистика в дауне...
http://n0cgi.distributed.net/cgi/dnet-finger.cgi?user=decibel
|
| | |
Well... when it rains...[another drive has failed.] 30.11.05 16:34
Автор: DamNet <Denis Amelin> Статус: Elderman
|
В общем статистика пока работает и считается (за 29 посчитали), но не советуют пока менять настройки комманд, вхолдить в комманды и т.д......
А диск рухнул, но уже другой, от чего все равно не легче.
:: 30-Nov-2005 00:21 CST (Wednesday) ::
Well... when it rains...
Nov 30 05:39:02 fritz kernel: twa0: INFO: (0x04: 0x000b): Rebuild started: unit=1
Nov 30 05:48:01 fritz kernel: twa0: ERROR: (0x04: 0x0026): Drive ECC error reported: port=5, unit=1
Nov 30 05:48:01 fritz kernel: twa0: ERROR: (0x04: 0x002d): Source drive error occurred: unit=1, port=5
Nov 30 05:48:01 fritz kernel: twa0: ERROR: (0x04: 0x0004): Rebuild failed: unit=1
Nov 30 05:48:01 fritz kernel: twa0: ERROR: (0x04: 0x0002): Degraded unit: unit=1, port=3
Nov 30 05:51:47 fritz kernel: twa0: INFO: (0x04: 0x000b): Rebuild started: unit=1
In plain english... another drive has failed. I've heard it's common for drives
from the same manufacturing run to all fail at the same time; I guess this is
proof.
I'm going to turn stats back on again, but I highly recommend you not make any
changes to team or participant information until this is all cleared up. It is
very possible that we will end up losing the entire array again, which right
now would mean reverting to a backup that could be days (or possibly even
weeks, depending on how long this takes).
We've already RMA'd 2 200G drives. Once those come back it shouldn't be much of
an issue for us to deal with drive failures, since we'll have some spares
on-hand. I'm also going to setup replication of critical data so that even if
we do lose the database again loss of user-modified data should be minimal.
Thanks for your patience.
http://n0cgi.distributed.net/cgi/dnet-finger.cgi?user=decibel
|
| | | |
Есть серьёзное подозрение, что у них БП шалит 30.11.05 23:47
Автор: Ustin <Ustin> Статус: Elderman Отредактировано 30.11.05 23:47 Количество правок: 1
|
> В общем статистика пока работает и считается (за 29 > посчитали), но не советуют пока менять настройки комманд, > вхолдить в комманды и т.д...... Весьма симптоматично, что весь этот колхоз у них начался с падения питания, а сейчас у них винты летят один за другим. Я бы у себя в таком случае БП бы заменил
|
| | | | |
[OFF] Наука или шаманство? 02.12.05 14:42
Автор: ZhN Статус: Незарегистрированный пользователь
|
> Я бы у себя в таком случае БП бы заменил
Это как чинить автомобиль по телефону... несерьезно. ребята там вроде как неглупые, найдут проблему и устранят.
Музыка Тольятти
|
|
|