unixforum.net - Der Treffpunkt für UNIX Fans Der Treffpunkt für UNIX Fans seit 2002
  Übersicht   Forum   Hilfe Suche Einloggen Registrieren   *
Suche
Google
Erweiterte Suche
Willkommen Gast. Bitte einloggen oder registrieren.
23. Mai 2012, 08:26:20

Einloggen mit Benutzername, Passwort und Sitzungslänge
Letzte 5 Shouts:
31. Dezember 2011, 22:28:22
Dann mal einen guten Rutsch!

Greez aus der Noris
25. September 2011, 08:05:05
Gute Besserung!
07. September 2011, 14:20:51
An diesem Tag hattest du also kein(en) Plan. Wink
04. September 2011, 19:04:39
ja, genau die. Bei mir war der Server wohl genau diesen Tag down. Alternative:
http://lsub.org/sys/src
01. September 2011, 20:10:10
Spenden
Berechtigungen

Anzeige
Anzeige
Seiten: [1]   Nach unten
  Drucken  
Autor Thema: IntelliStation 9114-275 zickt rum  (Gelesen 1995 mal)
meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« am: 22. Februar 2009, 19:55:38 »

Hi,

erst mal viele grüße an escimo, den ich besucht habe und madze und landy, die mich am Freitag abend besucht haben. War echt cool, euch zu treffen!!!!

Ich hab mir bei Zino zwei 275 mit 2Proc´s á 1,45GHz mit 4GB RAM und 73GB Platte geleistet.

Leider Zicken die beiden noch rum....

und zwar: nach jedem booten, leuchtet die Warnungs-LED und im Error-Log steht die Meldung:

Code:
A10-100 The following resource is unavailable due to an error.
System is Operating in degraded mode.
Error Log information:
Date: So 22 Feb 18:54:45 2009
Sequence Number: 9
Label: SCAN_ERROR_CHRP
FRU: 80P4323 U0.1-P1

In einer der Maschinen war noch die Meldung:
Code:
815-201 Processor has a Status of failed.
Proc0 FRU: 80P4323 U0.1-P1 Prozessor

Die war allerdings weg, als ich das BOS neu aufgespielt habe.

Die Kisten habe ich auf den Letzten Microcode 3F080425 (auch 70296C3F genannt) upgedated.

OS ist selbstverständlich AIX , um genau zu sein AIX 5.3 (32Bit Kernel) mit Mozilla und den Server-Paketen.

Komisch ist, dass ich ganz normal mit der Maschine Arbeiten kann, und ich auch mit diag keine Fehler finde.

Während das System läuft bekomme ich auch keine Fehlermeldungen, ich habe gestern noch ein System komplett zerlegt und wieder zusammengesetzt um eventuelle Kontaktprobleme auszuschließen.

Dabei sind mir zwei Teile aufgefallen, die defekte (leich aufgeblähte) Kondensatoren aufweisen, das zweite System werde ich darauf gleich nochmal untersuchen. (Die Teile haben die FRU 24P6893 und 53P5623- sind beides VRM-Module, könnten also auch für die Fehler verantwortlich sein...)

per lscfg -vp bekomme ich zwar alle Installierten Geräte angezeigt, aber das Terminal will mir nicht den Ganzen Output anzeigen... Muss mal schauen, wie ich den ganz angezeigt bekomme...

Falls jemand Teile für die WS hat, oder die Fehler schon kennt und mir einen Tip geben kann bitte Bescheid geben, ich möchte so schnell es geht die beiden Kisten Fehlerfrei am Laufen haben.. :-D


Viele Grüße,

meisterdausi

Gespeichert

unixforum.net - Der Treffpunkt für UNIX Fans
« am: 22. Februar 2009, 19:55:38 »

 Gespeichert
Ebbi
Global Moderator
Unix Guru
*****
Offline Offline

Beiträge: 2334


Ubergeek


Profil anzeigen
« Antworten #1 am: 22. Februar 2009, 20:28:05 »

Warst du mal per seriell auf dem Service Prozessor?

Wegen der Geräte kannst du auch prtconf nehmen:
http://publib.boulder.ibm.com/infocenter/systems/index.jsp?topic=/com.ibm.aix.cmds/doc/aixcmds4/prtconf.htm

Gespeichert

meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #2 am: 22. Februar 2009, 22:22:38 »

Hi,

nee, seriell war ich noch nicht drauf.. Huh das Naheliegendste fällt mir immer zu letzt ein...


Ich werd mich morgen Abend mal Intensiver darum kümmern, aber ich glaube fast dass bei beiden Maschinen jeweils einer der zwei Prozessoren einen Schaden hat...

 Cry Cry

Viele Grüße,

meisterdausi
Gespeichert

Ebbi
Global Moderator
Unix Guru
*****
Offline Offline

Beiträge: 2334


Ubergeek


Profil anzeigen
« Antworten #3 am: 22. Februar 2009, 23:06:17 »

Ich werd mich morgen Abend mal Intensiver darum kümmern, aber ich glaube fast dass bei beiden Maschinen jeweils einer der zwei Prozessoren einen Schaden hat...
Die Maschinen haben nur einen Prozessor, den 1,45er gibt es auch als Dualcore.
Gespeichert

M.K.
Unix Guru
*****
Offline Offline

Beiträge: 538


Profil anzeigen
« Antworten #4 am: 22. Februar 2009, 23:40:15 »

auf das errorlog würde ich bei vererbten Maschinen nicht allzuviel geben,
obwohl ich es seltsam fände, wenn der Reseller die Platten nicht genullt hätte.
Wenn es nach Neuinstallation sauber ist, ist das OK.
lscfg -vp sollte allerdings sauber durchlaufen
und bei einer echten Dualcore-Maschine auch proc0 und proc1 anzeigen.
Es gibt/gab auch preisreduzierte 275er mit Singlecore (oder abgeschaltetem
2. core), dann meldet sich eben nur einer.
Wenn Deine Maschine aber sauber bootet und läuft,
dann bist Du sowieso aus dem gröbsten raus.   
Gespeichert
unixforum.net - Der Treffpunkt für UNIX Fans
« Antworten #4 am: 22. Februar 2009, 23:40:15 »

 Gespeichert
meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #5 am: 24. Februar 2009, 09:11:10 »

Hi,

also: Im SP der Systeme stehen unterschiedliche Meldungen drin ...

Im Ersten System habe ich < Memory Failure > im SP drin stehen, unter AIX steht SCAN_CHRP_ERROR drin.

Im zweiten System hab ich leider noch nicht nachgesehen, aber mir kommt das seltsam vor...

@M.K. : Was Komisch ist, dass der Reseller die Platten nicht plattgemacht hat, es waren noch alle CAD-Anwendungen drauf.... :-D

Viele Grüße,

meisterdausi
« Letzte Änderung: 24. Februar 2009, 11:42:06 von meisterdausi » Gespeichert

meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #6 am: 26. Februar 2009, 13:59:14 »

So, ich hab mich jetzt mal mit dem ersten erät auseinandergesetzt.

Im Serviceprozessor steht dauernd Memory Failure drin, Als ich die Quads (hier muss man Arbeitsspeicher immer in Quads einbauen/tauschen) dann von vorne nach hinten getauscht hab, kamen keine Fehlermeldungen im SP, aber als das OS da war war plötzlich die Fehlermeldung wieder da.

Ich werde mir mal zwei neue Quads hole, und die dann mal testen. Wenns dann noch nicht funktioniert, hat das Board nen Schaden.... Cry

Aber ich denke ich werde mir heute Abend mal die andere Kiste genauer anschauen....

Viele Grüße,

meisterdausi
Gespeichert

meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #7 am: 26. Februar 2009, 20:54:38 »

Hi,

ich hab mir heute mal die andere der beiden Maschinen vorgenommen.

Hier steht im SP das selbe wie unter diag bzw. im Errorlog.

Hier steht:

Code:
815-201 Processor has a status of failed.
proc0 FRU:80P4323 U0.1-P1
Prozessor

Nachdem ich die LED ausgeschaltet hab, und unter diag - Advanced Diagnostics Routines - Problem Determination - proc0 und proc1 ausgewählt hab, erscheint nach den Tests die Meldung von oben, und die LED schaltet sich nach dem Test wieder ein.

Ich denke wirklich, dass beide Maschinen nen Schaden haben....

Hat noch jemand ein ähnliches Modell und könnte diese Tests mal verifizieren??

Ich denke nicht , dass sich hier durch auseinander- und wieder zusammenbauen irgendwas ändert....

Viele Grüße,

meisterdausi
Gespeichert

meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #8 am: 26. Februar 2009, 22:17:16 »

 Grin

Eins hab ich hinbekommen:

Die Maschine mit dem Prozessorfehler läuft jetzt. Grin

Ich hab die Kiste runtergefahren, und bin über den SP unter System Information Menu auf dem Punkt Processor Configuration/Deconfiguration in die Prozessorkonfig eingestiegen.

Dann habe ich beide Kerne des Prozessors Manuell auf enabled (bzw. Manually Configured) gesetzt.

Danach kommt keine Meldung, und es kommt auch bei dem Manuellen Test kein Fehler mehr.

Ich werde das System in der nächsten Zeit neu aufsetzen und danach nochmal den Status posten.

Die Prozedur hat bei dem anderen System nichts gebracht, aber dafür habe ich mir bereits einen neuen Memorykit geordert.  Roll Eyes Roll Eyes

Viele Grüße,

meisterdausi
Gespeichert

meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #9 am: 12. März 2009, 16:52:03 »

Hi,

mal ein kleiner Status zu der anderen Maschine...

Der Memorykit ist jetzt eingebaut, hat allerdings keinen Effekt gezeigt.

Nach der Installation des Memorykits kommt immernoch die Meldung beim Hochfahren, wenn ich alle Fehler lösche im System kommt nach ca. 2 Stunden die Meldung wieder.

Ich muss am Wochenende mal das System bis auf jede Schraube auseinandernehmen, mal schauen ob irgendein Kontakt nicht richtig fest sitzt. Wenn das nichts bringt, werde ich das System neu aufsetzen.

Eventuell kann ich den SP nochmal zurücksetzen, also Batterie raus und nach einiger Zeit wieder rein...

Viele Grüße,

meisterdausi
Gespeichert

meisterdausi
Unix Master
****
Offline Offline

Beiträge: 340



Profil anzeigen
« Antworten #10 am: 15. März 2009, 15:56:09 »

So,

nun läuft auch die zweite Maschine.  Grin Grin *freu*

Ich habe mich gestern mal etwas länger um das Problem mit dem SCAN_ERROR_CHRP gekümmert.

Nun leider die etwas längere Erklärung ...

Die beiden Maschinen bekam ich in einem SEHR verstaubten Zustand.

Nachdem ich die Maschinen mit Druckluft gereinigt habe sind, wie bereits gepostet, die beiden Fehler aufgetreten.

Die zweite Maschine habe ich gestern komplett demontiert um genauer nach dem Fehler forschen zu können.

Nachdem ich das Mainboard in den Händen hatte fiel mir auf, dass um den Prozessor herum die Verschmutzungen kaum mit Druckluft zu entfernen waren. Anscheinend war der Staub hier mit Öl versetzt.

Also habe ich den den Kühler vom Prozessor abgenommen, und zum Vorschein kam ein (in letzter Zeit) immer häufiger verwendeter Wärmeleitpad. Diese Wärmeleitpads (ungefähr 1mm stark) bestehen aus einer Silikonschaumschicht, die mit Silikonöl getränkt ist, und an den Kontaktflächen zu Prozessor bzw. Kühler aus einem Feinen Fasernetz (zur Stabilisierung des ganzen).

Das eben erwähnte Silikonöl trat aus, und verteilte sich in einem Feinen Film über alle Kondensatoren des Prozessors auf dem Mainboard.

Dadurch dass diese Maschinen häufig im Dauerlauf Ihren Dienst tun, und durch die Lüfter (die genau über dem Prozessor sitzen) jeden Tag etwas Staub in die Maschine befördert wird bindet sich der Staub an dem ausgetretenen Silikonöl.

Nun ist Staub Elektrisch leitend, und die Spannungen beim Prozessor sind sehr niedrig, wodurch der Entstehende Widerstand der Staubschicht die Signale, die zum Prozessor und vom Prozessor weg gehen signifikant beeinflussen.

Ich habe in meinem Fall den Bereich um den Prozessor mit Isopropanol (hochreiner Alkohol) und einer Zahnbürste grob gereinigt und habe den entstandenen Schmutz mit Druckluft entfernt.

Wenn Rückstände des Alkohols unter den Prozessor kommen macht das nichts, da der Alkohol sehr schnell verdampft und spätestens beim Einbau der Teile in das System verraucht ist.

Der Lötstopplack auf dem Mainboard wird durch den Alkohol auch nicht angegriffen, man sieht nach der Reinigung keine Rückstände auf dem Board.

(kleine Anmerkung: Auch Laptops, in die im Betrieb irgendwelche Flüssigkeiten gekommen sind lassen sich durch den Alkohol reparieren. Der Alkohol verdrängt die Flüssigkeit und wäscht sie aus dem System heraus. Allerdings können hierbei Kunststoffe des Gehäuses angegriffen werden, diese bekommen dann einen Weißen schleier. Das wiederum kann man mit einem feuchten Tuch, mit dem man nach der Alkohol-Aktion sofort nachreibt, verhindern.)

So, das war das Wort zum Sonntag.

Viele Grüße,

meisterdausi
« Letzte Änderung: 15. März 2009, 16:02:33 von meisterdausi » Gespeichert

Seiten: [1]   Nach oben
  Drucken  
 
Gehe zu:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.11 | SMF © 2006, Simple Machines LLC
TinyPortal v0.9.8 © Bloc
Prüfe XHTML 1.0 Prüfe CSS
sonnenblen.de, mood-indigo.org, unixforum.net und realcomputers.org sind Projekte der steinbruch.info GbR

Google war zuletzt hier Gestern um 10:13:00