[ug-czosug] problem se Sun Ultra 25: samovolné rebooty

Vita Batrla Vitezslav.Batrla na Sun.COM
Sobota Listopad 25 09:26:03 PST 2006


Dobry den,

Z toho, jak problem popisujete to vypada osklive, ale tezko rict v cem 
je problem. Bylo by dobre ziskat o nem vic informaci.

Pavel Lisý wrote:
> Ješte jednou zkouším řešit dlouhodobější problém:
> 
> Mám úplně novou stanici (cca 2 měsíce) Sun Ultra 25. Bohužel jsem ji
> ještě nemohl dát do rutinního provozu, protože vykazuje podivné chování.
> 
> Původní instalace Solaris 10 i následná Solaris Nevada build 46 (v
> defaultním stavu) se projevovaly tuhnutím a restarty v náhodných
> intervalech. Jednou jsem dokonce pracoval v desktopu (Gnome) a uprostřed
> editace se mi spustil reboot!
> 

Jak se projevuje restart/reboot? Ma softwarovy, nebo hardwarovy puvod, 
reso. je rizeny, nebo nerizeny? "Softwarovym"/rizenym puvodem myslim, 
napr. spusteni prikazu reboot, init 6, nebo uadmin nejakym jinym 
procesem. Prikazy reboot i init 6 ukoncuji bezici sluzby a teoreticky by 
mely byt logovany (/var/adm/messages). Prikaz uadmin je daleko 
nebezpecnejsi, je to primy interface do kernelu, ktery dokaze system 
bezprostredne ukoncit, podobne jako tlacitko reset na PC (uadmin 1 1), 
tim se situace trosku komplikuje.

Pokud se Vas system restartuje pravidelne a neni tezke problem 
reprodukovat, navrhuju vytvorit DTrace skript, ktery bude logovat 
spoustene prikazy s jejich parametry, vcetne parent procesu. (Viz. 
skript "execsnoop" z DTrace toolkitu).

Horsi je situace pokud je restart dusledek hw chyby. Zkousel jste 
hardware otestovat, napr. pamet pomoci memtest?

Jeste horsi je situace, pokud jde o havarii systemu. Jak vypada vas 
"crash dump" adresar /var/crash/<hostname>?

Jak se projevuje "tuhnuti", nereaguje GUI, odpovida system na ping, da 
se na nej prihlasit po siti?

> Zkusil jsem tedy nejnovější build SolarisExpressu (51) a zároveň jsem
> vypnul power management (doufám, že všude)
> 
> # cat /etc/power.conf
> ---
> device-dependency-property removable-media /dev/fb
> autopm                  disable
> statefile               //.CPR
> # Auto-Shutdown         Idle(min)       Start/Finish(hh:mm)     Behavior
> autoshutdown            30              9:00 9:00
> noshutdown
> ---
> 
> # svcs -a -v | grep power
> ---
> disabled       -             11._23        - svc:/system/power:default
> ---
> 
> V gnome jsem to vypnul taky, ale ani jsem do něj nebyl příhlášen a z
> logu jsem zjistil, že asi došlo k restartu. Počítač jsem sám restartoval
> v:
> Tue Nov 21 16:00
> a potom nechal běžet. Toto ale zjistím, když si vypíšu rebooty:
> 
> [root na judah ~]# last reboot
> reboot    system boot                   Thu Nov 23 00:41 
> reboot    system down                   Thu Nov 23 00:37 
> reboot    system boot                   Wed Nov 22 13:21 
> reboot    system down                   Wed Nov 22 11:13 
> reboot    system boot                   Tue Nov 21 16:02 
> reboot    system down                   Tue Nov 21 16:00 
> reboot    system boot                   Tue Nov 21 15:40 
> reboot    system down                   Tue Nov 21 15:39 
> reboot    system boot                   Tue Nov 21 15:21 
> reboot    system down                   Tue Nov 21 15:02 
> reboot    system boot                   Tue Nov 21 14:20 
> 

Co rika v osudny okamzik /var/adm/messages?

> wtmp begins Tue Nov 21 14:20 
> 
> 
> Nenapadá vás někoho, co se tam může dít? Je to na reklamaci HW, nebo se
> mám ještě pokoušet něco změnit v konfiguraci?
> 
> Koukal jsem, že se v power managementu něco změnilo v buildu 53
> (oddělení změny frekvence procesoru), ale ten asi nejsem schopen sám
> nainstalovat.
> 
> Jakákoliv zasvěcená rada bude velmi vítaná.
> 
> Pavel
> 
> 
> 
> ------------------------------------------------------------------------
> 
> _______________________________________________
> ug-czosug mailing list
> ug-czosug na opensolaris.org
> http://mail.opensolaris.org/mailman/listinfo/ug-czosug



Další informace o konferenci ug-czosug