[ug-czosug] problem se Sun Ultra 25: samovolné rebooty
Vita Batrla
Vitezslav.Batrla na Sun.COM
Sobota Listopad 25 09:26:03 PST 2006
Dobry den,
Z toho, jak problem popisujete to vypada osklive, ale tezko rict v cem
je problem. Bylo by dobre ziskat o nem vic informaci.
Pavel Lisý wrote:
> Ješte jednou zkouším řešit dlouhodobější problém:
>
> Mám úplně novou stanici (cca 2 měsíce) Sun Ultra 25. Bohužel jsem ji
> ještě nemohl dát do rutinního provozu, protože vykazuje podivné chování.
>
> Původní instalace Solaris 10 i následná Solaris Nevada build 46 (v
> defaultním stavu) se projevovaly tuhnutím a restarty v náhodných
> intervalech. Jednou jsem dokonce pracoval v desktopu (Gnome) a uprostřed
> editace se mi spustil reboot!
>
Jak se projevuje restart/reboot? Ma softwarovy, nebo hardwarovy puvod,
reso. je rizeny, nebo nerizeny? "Softwarovym"/rizenym puvodem myslim,
napr. spusteni prikazu reboot, init 6, nebo uadmin nejakym jinym
procesem. Prikazy reboot i init 6 ukoncuji bezici sluzby a teoreticky by
mely byt logovany (/var/adm/messages). Prikaz uadmin je daleko
nebezpecnejsi, je to primy interface do kernelu, ktery dokaze system
bezprostredne ukoncit, podobne jako tlacitko reset na PC (uadmin 1 1),
tim se situace trosku komplikuje.
Pokud se Vas system restartuje pravidelne a neni tezke problem
reprodukovat, navrhuju vytvorit DTrace skript, ktery bude logovat
spoustene prikazy s jejich parametry, vcetne parent procesu. (Viz.
skript "execsnoop" z DTrace toolkitu).
Horsi je situace pokud je restart dusledek hw chyby. Zkousel jste
hardware otestovat, napr. pamet pomoci memtest?
Jeste horsi je situace, pokud jde o havarii systemu. Jak vypada vas
"crash dump" adresar /var/crash/<hostname>?
Jak se projevuje "tuhnuti", nereaguje GUI, odpovida system na ping, da
se na nej prihlasit po siti?
> Zkusil jsem tedy nejnovější build SolarisExpressu (51) a zároveň jsem
> vypnul power management (doufám, že všude)
>
> # cat /etc/power.conf
> ---
> device-dependency-property removable-media /dev/fb
> autopm disable
> statefile //.CPR
> # Auto-Shutdown Idle(min) Start/Finish(hh:mm) Behavior
> autoshutdown 30 9:00 9:00
> noshutdown
> ---
>
> # svcs -a -v | grep power
> ---
> disabled - 11._23 - svc:/system/power:default
> ---
>
> V gnome jsem to vypnul taky, ale ani jsem do něj nebyl příhlášen a z
> logu jsem zjistil, že asi došlo k restartu. Počítač jsem sám restartoval
> v:
> Tue Nov 21 16:00
> a potom nechal běžet. Toto ale zjistím, když si vypíšu rebooty:
>
> [root na judah ~]# last reboot
> reboot system boot Thu Nov 23 00:41
> reboot system down Thu Nov 23 00:37
> reboot system boot Wed Nov 22 13:21
> reboot system down Wed Nov 22 11:13
> reboot system boot Tue Nov 21 16:02
> reboot system down Tue Nov 21 16:00
> reboot system boot Tue Nov 21 15:40
> reboot system down Tue Nov 21 15:39
> reboot system boot Tue Nov 21 15:21
> reboot system down Tue Nov 21 15:02
> reboot system boot Tue Nov 21 14:20
>
Co rika v osudny okamzik /var/adm/messages?
> wtmp begins Tue Nov 21 14:20
>
>
> Nenapadá vás někoho, co se tam může dít? Je to na reklamaci HW, nebo se
> mám ještě pokoušet něco změnit v konfiguraci?
>
> Koukal jsem, že se v power managementu něco změnilo v buildu 53
> (oddělení změny frekvence procesoru), ale ten asi nejsem schopen sám
> nainstalovat.
>
> Jakákoliv zasvěcená rada bude velmi vítaná.
>
> Pavel
>
>
>
> ------------------------------------------------------------------------
>
> _______________________________________________
> ug-czosug mailing list
> ug-czosug na opensolaris.org
> http://mail.opensolaris.org/mailman/listinfo/ug-czosug
Další informace o konferenci ug-czosug