[d-kernel] Re: ServerWorks CSB5 freezes on last kernels

Sergey Vlasov vsu at altlinux.ru
Mon Nov 17 12:24:59 MSK 2003


On Mon, Nov 17, 2003 at 10:58:27AM +0300, Vitaly Ostanin wrote:
> On Sun, 16 Nov 2003 18:58:41 +0300
> Sergey Vlasov <vsu at altlinux.ru> wrote:
> 
> > On Sat, Nov 15, 2003 at 06:12:12PM +0300, Vitaly Ostanin wrote:
> > > Hello, All!
> > > 
> > > Обнаружилось, что последние stp-smp ядра из Sisyphus виснут
> > > при использовании IDE-дисков на чипсете ServerWorks CSB5.
> > > 
> > > Точно так же, как описано в
> > > http://lkml.org/lkml/2003/6/7/68
> > > 
> > > Гарантированно замораживается с ядрами
> > > 2.4.22-std-smp-alt7
> > > 2.4.22-std-smp-alt8
> > > 
> > > noapic не помогает, при pci=noacpi не загружается модуль
> > > SCSI-контроллера dac960.
> > 
> > Ещё варианты:
> > 
> > acpi=off
> > acpi=off noapic
> > acpi=off noapic nolapic  (эта опция есть только в alt8)
> 
> Попробую, спасибо большое. Что означает последняя?

Это отключение ещё и local APIC.

Хотя для SMP использование noapic и тем более nolapic нежелательно - разве
что без них совсем никак.

> > > IDE-диски - это 2 seagate barracuda по 80Gb. DMA на них
> > > отключен давным-давно:
> > > /etc/sysconfig/harddisk/(hdc|hdd)
> > > USE_DMA=0
> > 
> > Но тем не менее сначала ядро всё-таки включает UDMA(33).  Не
> > меняется ли ситуация при указании ide=nodma?
> 
> Пока не пробовал. В субботу выключил монтирование разделов с
> ide-винтов. Всё-равно заморозился :( При этом при emergency sync
> устройства 16:01 и 16:02 уже не упоминаются, а вот 30:03
> по-прежнему sync не проходит. Отсюда подозрение уже на mylex scsi
> raid5, который сделан из 3-х scsi дисков
> Seagate ST336607LW (как было в поставке, это брендовый вариант).
> 
> Для эксперимента было поставлено ядро из updates к M2.2
> kernel24-smp-2.4.20-alt10
> ide-винты не монтировались. Заморозился.

Мда...

> > Кроме того, когда и по какому поводу отключали DMA?  
> 
> Сразу после установки туда ide-винтов, из-за проблем udma5. То
> есть сначала был включен udma2, а потом выключен для чистоты
> эксперимента (пару раз он всё-таки зависал). Примерно 2 месяца
> назад.

UDMA на OSB4 неживой вообще, на CSB5 вроде бы глюки только с UDMA5 были.
Хотя чёрт его знает...

[skip]
> > > Симптомы заморозки:
> > > сервер пингуется, ни один из сервисов на запросы не отвечает,
> > > при попытке локального логина с консоли принимается login, но
> > > приглашение для ввода пароля не выдаётся.
> > > 
> > > На alt+sysrq+S/U/B сервер реагирует, но при S в выводе
> > > синхронизированных устройств (по памяти):
> > > emergency syncing device 16:01... done
> > > emergency syncing device 16:02... done
> > > emergency syncing device 30:03...
> > > на этом вывод обрывается.
> > > 
> > > Отсюда подозрение именно на работу ядра с ide-дисками.
> > > Кстати, откуда берётся номер 30:03 ?
> > 
> > 0x16 = 22 (16:01 = /dev/hdc1, 16:02 = /dev/hdc2)
> > 0x30 = 48 (30:03 = /dev/rd/c0d0p3)
> 
> Всё-равно не понял :( Почему 22 - это именно hdc ?

/usr/share/doc/kernel*/Documentation/devices.txt

> > Т.е. получается, что для IDE как раз sync проходит, а вот на
> > dac960 виснет.  
> 
> Точно.
> 
> > Хотя вот уж тот драйвер точно никто не трогал - некому :(
> 
> Единственный оставшийся у меня вариант - аппаратные проблемы с
> дисками/контроллером. Есть средство диагностики для Mylex
> AcceleRaid 170 под linux ?

Не знаю - не сталкивался.

Хотя вот что обнаружил:

http://www.lsilogic.com/products/stor_prod/raid/software_kit_520.html
http://www.lsilogic.com/techlib/marketing_docs/storage_stand_prod/raid/gam/release_notes_swkit520.txt

| * Do not use Linux DAC drivers 2.2.11 or 2.4.11 with this or any
|   previous releases of GAM. GAM server 5.10-01 or below cannot 
|   find the DAC controllers if these drivers are compiled into 
|   the Linux kernel. Use DAC drivers 2.2.10 or 2.4.10  instead. 
|   DAC drivers 2.2.10 and 2.4.10 can be found at:
| 
|    http://www.dandelion.com/Linux/DAC960-2.2.10.tar.gz and
|    http://www.dandelion.com/Linux/DAC960-2.4.10.tar.gz respectively.

А в ядре, как и следовало ожидать, лежит именно 2.4.11...

Правда, оказалось, что этот драйвер всё-таки не совсем заброшен:

http://developer.osdl.org/dmo/DAC960/DAC960_V2.4/

И что из этого работает - загадка...
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 189 bytes
Desc: not available
Url : /pipermail/devel-kernel/attachments/20031117/a23deeda/attachment.bin


More information about the devel-kernel mailing list