Discussion:
linux fagy dual opteronnal
d***@vas.birosag.hu
2004-10-08 16:26:15 UTC
Permalink
A vas: MSI K8D Master alaplap, 2 db 246-os opteron, 1G RAM, adaptec 29320
scsi kontroller, 2 db 72GB hdd raid1-ben

A disztrib=FAci=F3 SuSE 9.1, de a kernelt lecser=E9lt=FCk 2.6.8.1-re, belef=
ord=EDtva
csak a legsz=FCks=E9gesebbek.

Erre az eszk=F6zre jelentkeznek be felhaszn=E1l=F3k (jelenleg kb 20) linuxo=
s
kliensekr=F5l kdm-en kereszt=FCl =E9s futtatj=E1k programjaikat, els=F5sorb=
an
OpenOffice.org-ot. Azonban naponta =E1tlag 2-3 alkalommal teljes fagy=E1s,
minden el=F5jel n=E9lk=FCl. K=E9t fagy=E1s k=F6z=F6tt eltelhet 6 =F3ra is, =
de negyed =F3ra
is. Nincs k=F6zvetlen =F6sszef=FCgg=E9sben a terhel=E9ssel, mert 30-40-es l=
oad-ot
(meghajtottuk egy picit) minden tov=E1bbi n=E9lk=FCl t=FAl=E9lt, azt=E1n eb=
=E9dsz=FCnetben
0.05-=F6s loadn=E1l meghalt. Igaz viszont, hogy a g=E9p kor=E1bbi teszt=FCz=
em idej=E9n
2-3 felhaszn=E1l=F3val t=F6bb hetes uptime-ot =E9rt meg.

Van egy m=E1sik ugyanilyen vas, arra f=F6ltett=FCk ugyanezt a rendszert, de=
raid
=E9s lvm n=E9lk=FCl. Az is fagyott. (Ezzel kiz=E1rtuk a raid =E9s az lvm hi=
b=E1t, =E9s
majdnem teljesen a hardverhib=E1kat.)

Hallottam, hogy van egy hiba az opteronokban, de nem tal=E1ltam nyom=E1t a
neten, hogy a kernelben ez k=FCl=F6n=F6sebb gondot okozna.

A logokban semmif=E9le t=E1mpont nincs, olyan hirtelen j=F6n a fagy=E1s, mi=
ntha
kih=FAzn=E1m a t=E1pot. Fagy=E1s eset=E9n nem =E9l a billenty=FBzet, nem v=
=E1laszol a g=E9p
a ping-re sem, =E9pp csak a ventil=E1torok mennek, meg a ledek vil=E1g=EDta=
nak.
Ebb=F5l (is) gyan=EDtom, hogy kernel probl=E9ma.

Hol keressem, hogyan hat=E1roljam be a hib=E1t?

--=20
Ervin
Horváth Ágoston János
2004-10-08 16:45:33 UTC
Permalink
Milyen videokártya van bennük?

Nekünk most volt egy pont ugyanilyen eset, igaz, azok dual athlonmp-k
voltak. Azoknál egy matrox g400 videokártya csinálta a bajt: teljesen
összevissza fagyások, terhelésfüggetlenül.
Hozzáteszem, semmi X, svgalib vagy svgatextmode, vagy egyéb szoftver
nem volt a gépen, a sima, bios által beállított 80x25-ben ment!
És egy ősrégi s3virge meg egy noname nvidia gf2mx is tökéletesen megy...
Duál rendszer nagyon más, mint a sima UP.
d***@vas.birosag.hu
2004-10-09 13:39:20 UTC
Permalink
Milyen videok=C3=A1rtya van benn=C3=BCk?
Alaplapra integr=E1lt ATI Rage XL

--=20
Ervin
PÁSZTOR György
2004-10-09 14:19:06 UTC
Permalink
Hali,
Milyen videokĂĄrtya van bennĂźk?
Alaplapra integrált ATI Rage XL
Hasonló hibajelenséget mi akkor tapasztaltunk, ha az ATA interfészen
keresztül próbáltunk CD-t írni.
(Persze lehet, hogy csak a fordításból hagytunk ki vmi-t, mert a gyári
debian kernellel ment. De abban meg herélt a tg3 driver, stb...)
Nem lehet vmi. locking bug? (Bár még nekem sem volt időm kipróbálni, mi van
ha UP módban indítom el...)

Üdv:Gyur!
-- -------[ Free Software ISOs - http://www.fsn.hu/?f=download ]------- --
PÁSZTOR György e-mail: ***@fsn.hu
Free Software Network (FSN.HU) cell.: +3620 512 3335
d***@vas.birosag.hu
2004-10-09 14:47:44 UTC
Permalink
Hali,
Post by d***@vas.birosag.hu
Milyen videok=C3=A1rtya van benn=C3=BCk?
Alaplapra integr=E1lt ATI Rage XL
Hasonl=F3 hibajelens=E9get mi akkor tapasztaltunk, ha az ATA interf=E9sze=
n
kereszt=FCl pr=F3b=E1ltunk CD-t =EDrni.
Ugyan van benne egy DVD olvas=F3, ami ATA interf=E9szen van, de nem
haszn=E1ljuk/haszn=E1ltuk, m=E9g az install is h=E1l=F3zaton kereszt=FCl t=
=F6rt=E9nt.
Nem lehet vmi. locking bug? (B=E1r m=E9g nekem sem volt id=F5m kipr=F3b=
=E1lni, mi van
ha UP m=F3dban ind=EDtom el...)
De lehet, b=E1rmi, csak hogyan tudom letesztelni, hogy t=E9nyleg az-e? Lock=
ing
bug -- felt=E9telez=E9sem szerint -- els=F5sorban sok konkurrens processz e=
set=E9n
kellene hasson, ennek viszont ellentmond, hogy k=F6zel 0 terhel=E9sn=E9l is=
volt
fagy=E1s. Gondoltunk valamilyen kumulat=EDv hat=E1sra is, pl. valamilyen
sz=E1ml=E1l=F3 t=FAlcsordul=E1s (m=E1s rendszern=E9l m=E1r volt ilyen...) d=
e ennek
ellentmond a gyors egym=E1s ut=E1ni elhal=E1s.

Sz=F3val tan=E1cstalanok vagyunk.

--=20
Ervin
Mátó Péter
2004-10-11 09:37:36 UTC
Permalink
De lehet, bármi, csak hogyan tudom letesztelni, hogy tényleg az-e? Locking
bug -- feltételezésem szerint -- elsősorban sok konkurrens processz esetén
kellene hasson, ennek viszont ellentmond, hogy közel 0 terhelésnél is volt
fagyás. Gondoltunk valamilyen kumulatív hatásra is, pl. valamilyen
számláló túlcsordulás (más rendszernél már volt ilyen...) de ennek
ellentmond a gyors egymás utáni elhalás.
Memtest egész éjszaka megvolt már? Vagy van olyan kernel, amivel nem
fagyogat?

üdv
Mátó Péter

--
##################################### FSF.hu Alapítvány - http://www.fsf.hu ####
d***@vas.birosag.hu
2004-10-11 10:14:24 UTC
Permalink
Memtest eg=E9sz =E9jszaka megvolt m=E1r? Vagy van olyan kernel, amivel ne=
m
fagyogat?
Bevallom, memtest nem volt, de mivel k=E9t g=E9p is produk=E1lta ugyanazt a
jelens=E9get, nem tartottuk indokoltnak. De mivel jobbat nem tudunk, ma
munkaid=F5 ut=E1nra be=FCtemezt=FCnk egyet. (A ram-ok el=E9g j=F3 fajt=E1k,
val=F3sz=EDn=FBtlen, hogy mindk=E9t k=E9szletben lenne hib=E1s. Persze nem
lehetetlen.)

A k=E9t g=E9p k=F6z=FCl az egyik egy=E9bk=E9nt m=E1r cs=FCt=F6rt=F6k =F3ta =
folyamatosan megy nfs
szerverk=E9nt, panasz n=E9lk=FCl.

Ami kernelt eddig kipr=F3b=E1ltunk, mind mutatta a jelens=E9get. Igaz, mind=
a
2.6-os sorozatb=F3l val=F3. =C9rdemes lenne 2.4-re visszamenni?


--=20
Ervin
Gabor Halasz
2004-10-11 10:44:04 UTC
Permalink
Ami kernelt eddig kipróbáltunk, mind mutatta a jelenséget. Igaz, mind a
2.6-os sorozatból való. Érdemes lenne 2.4-re visszamenni?
acpi-t kapcsold ki a kernelben
--
Gabor HALASZ <***@freemail.hu>
d***@vas.birosag.hu
2004-10-11 12:04:07 UTC
Permalink
Post by Gabor Halasz
acpi-t kapcsold ki a kernelben
Nincs benne, csak a legsz=FCks=E9geseb meghajt=F3k a t=E9nylegesen benne le=
v=F5
hardverhez (scsi kontroller, lan, vga, ide, chipset, stb.)

--=20
Ervin
Gabor Halasz
2004-10-12 09:29:39 UTC
Permalink
Post by Gabor Halasz
acpi-t kapcsold ki a kernelben
Nincs benne, csak a legszükségeseb meghajtók a ténylegesen benne levő
hardverhez (scsi kontroller, lan, vga, ide, chipset, stb.)
Bocs, hülyeséget beszéltem, az IO-APIC-ra gondoltam.
--
Gabor HALASZ <***@freemail.hu>
d***@vas.birosag.hu
2004-10-12 10:45:43 UTC
Permalink
Bocs, h=FClyes=E9get besz=E9ltem, az IO-APIC-ra gondoltam.
Ok. K=E9t perce m=E1r IO_APIC n=E9lk=FCli kernel fut...

--=20
Ervin
d***@vas.birosag.hu
2004-10-12 12:15:01 UTC
Permalink
Post by d***@vas.birosag.hu
Bocs, h=FClyes=E9get besz=E9ltem, az IO-APIC-ra gondoltam.
Ok. K=E9t perce m=E1r IO_APIC n=E9lk=FCli kernel fut...
Szinte percre pontosan k=E9t =F3r=E1t =E9lt.

Viszont m=E1sk=E9nt halt meg. Konzol input echo volt, ping megmaradt, de eg=
y=E9b
=E9letjel nem. Sajnos nem tudtunk sokat v=E1rni, hogy h=E1tha t=F6rt=E9nik =
valami,
mert a felhaszn=E1l=F3k t=FCrelme v=E9ges.

--=20
Ervin
Mihaly Zachar
2004-10-12 12:30:21 UTC
Permalink
Post by Gabor Halasz
Bocs, hülyeséget beszéltem, az IO-APIC-ra gondoltam.
Ok. Két perce már IO_APIC nélküli kernel fut...
Szinte percre pontosan két órát élt.
Viszont másként halt meg. Konzol input echo volt, ping megmaradt, de
egyéb életjel nem. Sajnos nem tudtunk sokat várni, hogy hátha történik
valami, mert a felhasználók türelme véges.
vegul probalkoztal mar 2.4-es kernellel, vagy csak en nem latom a
threadben??


Misi
Preisinger Aron
2004-10-12 12:39:57 UTC
Permalink
Post by Gabor Halasz
Bocs, hülyeséget beszéltem, az IO-APIC-ra gondoltam.
Ok. Két perce már IO_APIC nélküli kernel fut...
Szinte percre pontosan két órát élt.
Hello

Nekem hasonlo problemaim voltak egy AMD64 3200+ -os geppel. Nalam az
scsi vezerlo volt a ludas, jobban mondva a drivere. Kicsereltem a
kartyat es kb 4 honapja felrobbanthatatlanul szalad a gep.

A.
d***@vas.birosag.hu
2004-10-12 14:21:50 UTC
Permalink
Post by Preisinger Aron
Nekem hasonlo problemaim voltak egy AMD64 3200+ -os geppel. Nalam az
scsi vezerlo volt a ludas, jobban mondva a drivere. Kicsereltem a
kartyat es kb 4 honapja felrobbanthatatlanul szalad a gep.
Ha csak 1 felhaszn=E1l=F3 van a g=E9pen, nincs semmi baj, b=E1rmit is csin=
=E1l. Csak
akkor ha t=F6bb. R=E1ad=E1sul a t=F6bb felhaszn=E1l=F3 nem jelent nagyobb t=
erhel=E9st a
scsi kontrollernek, mert l=E9nyeg=E9ben csak swriter-t haszn=E1lnak, =E9s a=
z ha
m=E1r egyszer bent van a mem=F3ri=E1ban, m=E9gegyszer m=E1r nem kell t=F6lt=
eni. A
felhaszn=E1l=F3i k=F6nyvt=E1rak meg nfs-r=F5l j=F6nnek (nem akarjuk, hogy a=
gyakori
elsz=E1ll=E1s miatt adatveszt=E9s legyen).

Ett=F5l f=FCggetlen=FCl, ha m=E1r elfogyott az =F6sszes lib=E1nk, tesz=FCnk=
egy pr=F3b=E1t
IDE eszk=F6zzel is.

--=20
Ervin
d***@vas.birosag.hu
2004-10-12 13:22:15 UTC
Permalink
Post by Mihaly Zachar
vegul probalkoztal mar 2.4-es kernellel, vagy csak en nem latom a
threadben??
M=E1r k=E9sz a kernel, csak a munkaid=F5 v=E9g=E9t v=E1rom az ind=EDt=E1sho=
z.

--=20
Ervin
Gabor Halasz
2004-10-12 15:14:58 UTC
Permalink
Viszont másként halt meg. Konzol input echo volt, ping megmaradt, de egyéb
életjel nem. Sajnos nem tudtunk sokat várni, hogy hátha történik valami,
mert a felhasználók türelme véges.
Olyan marhaságok, mint preemptív kernel, hyperthread és hasonlók
nincsenek, ugye?
--
Gabor HALASZ <***@freemail.hu>
d***@vas.birosag.hu
2004-10-12 17:27:48 UTC
Permalink
Viszont m=E1sk=E9nt halt meg. Konzol input echo volt, ping megmaradt, d=
e egy=E9b
=E9letjel nem. Sajnos nem tudtunk sokat v=E1rni, hogy h=E1tha t=F6rt=E9=
nik valami,
mert a felhaszn=E1l=F3k t=FCrelme v=E9ges.
Olyan marhas=E1gok, mint preempt=EDv kernel, hyperthread =E9s hasonl=F3k
nincsenek, ugye?
J=E9zusom, dehogy vannak!!! :)

--=20
Ervin

d***@vas.birosag.hu
2004-10-12 05:35:53 UTC
Permalink
Memtest eg=E9sz =E9jszaka megvolt m=E1r? Vagy van olyan kernel, amivel ne=
m
fagyogat?
Memtest megvolt, semmi hib=E1t nem tal=E1lt.

K=F6zben a m=E1sik p=E9ld=E1nyon elind=EDtottam egy kernelford=EDt=E1st 'ma=
ke -j' -vel.
A g=E9p teljesen mag=E1ba fordult, az ssh kapcsolatokat kidobta, a konzolon
nem v=E1laszolt, egyetlen =E9letjel a ping-re adott v=E1lasza volt. Egy id=
=F5
m=FAlva mag=E1hoz t=E9rt, =E9s ism=E9t be lehetett jelentkezni. Ekkor a loa=
d 0.08
47.3 108.2 volt. A kernel nem fordult le, a logban a k=F6vetkez=F5 =FCzenet=
ek
voltak:

Oct 11 17:02:17 opteron2 kernel: Node 0 DMA per-cpu:
Oct 11 17:02:17 opteron2 kernel: cpu 0 hot: low 2, high 6, batch 1
Oct 11 17:02:17 opteron2 kernel: cpu 0 cold: low 0, high 2, batch 1
Oct 11 17:02:17 opteron2 kernel: cpu 1 hot: low 2, high 6, batch 1
Oct 11 17:02:17 opteron2 kernel: cpu 1 cold: low 0, high 2, batch 1
Oct 11 17:02:17 opteron2 kernel: Node 0 Normal per-cpu:
Oct 11 17:02:17 opteron2 kernel: cpu 0 hot: low 32, high 96, batch 16
Oct 11 17:02:17 opteron2 kernel: cpu 0 cold: low 0, high 32, batch 16
Oct 11 17:02:17 opteron2 kernel: cpu 1 hot: low 32, high 96, batch 16
Oct 11 17:02:17 opteron2 kernel: cpu 1 cold: low 0, high 32, batch 16
Oct 11 17:02:17 opteron2 kernel: Node 0 HighMem per-cpu: empty
Oct 11 17:02:17 opteron2 kernel:
Oct 11 17:02:18 opteron2 kernel: Free pages: 5704kB (0kB HighMem)
Oct 11 17:02:18 opteron2 kernel: Active:865 inactive:229116 dirty:0 writeba=
ck:164 unstable:0 free:1426 slab:6360 mapped:235859 pagetables:5595
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA free:2888kB min:20kB low:40kB h=
igh:60kB active:2796kB inactive:2076kB present:16384kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 10 722 722
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal free:2816kB min:1424kB low:2=
848kB high:4272kB active:664kB inactive:914260kB present:1032188kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 0 712 712
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem free:0kB min:128kB low:256k=
B high:384kB active:0kB inactive:0kB present:0kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 0 0 0
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA: 0*4kB 93*8kB 96*16kB 13*32kB 3=
*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB =3D 2888kB
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal: 2*4kB 103*8kB 28*16kB 0*32k=
B 0*64kB 0*128kB 2*256kB 0*512kB 1*1024kB 0*2048kB 0*4096kB =3D 2816kB
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem: empty
Oct 11 17:02:18 opteron2 kernel: Swap cache: add 2324365, delete 2324202, f=
ind 581121/787021, race 55+67
Oct 11 17:02:18 opteron2 kernel: Out of Memory: Killed process 2806 (lpd).
Oct 11 17:02:18 opteron2 kernel: oom-killer: gfp_mask=3D0x1d2
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA per-cpu:
Oct 11 17:02:18 opteron2 kernel: cpu 0 hot: low 2, high 6, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 0 cold: low 0, high 2, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 1 hot: low 2, high 6, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 1 cold: low 0, high 2, batch 1
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal per-cpu:
Oct 11 17:02:18 opteron2 kernel: cpu 0 hot: low 32, high 96, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 0 cold: low 0, high 32, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 1 hot: low 32, high 96, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 1 cold: low 0, high 32, batch 16
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem per-cpu: empty
Oct 11 17:02:18 opteron2 kernel:
Oct 11 17:02:18 opteron2 kernel: Free pages: 5720kB (0kB HighMem)
Oct 11 17:02:18 opteron2 kernel: Active:29360 inactive:201407 dirty:0 write=
back:86 unstable:0 free:1430 slab:6277 mapped:235827 pagetables:5577
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA free:2904kB min:20kB low:40kB h=
igh:60kB active:1660kB inactive:1932kB present:16384kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 10 722 722
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal free:2816kB min:1424kB low:2=
848kB high:4272kB active:115652kB inactive:803696kB present:1032188kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 0 712 712
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem free:0kB min:128kB low:256k=
B high:384kB active:0kB inactive:0kB present:0kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 0 0 0
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA: 4*4kB 93*8kB 96*16kB 13*32kB 3=
*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB =3D 2904kB
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal: 2*4kB 103*8kB 28*16kB 0*32k=
B 0*64kB 0*128kB 2*256kB 0*512kB 1*1024kB 0*2048kB 0*4096kB =3D 2816kB
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem: empty
Oct 11 17:02:18 opteron2 kernel: Swap cache: add 2324697, delete 2324607, f=
ind 581125/787056, race 55+67
Oct 11 17:02:18 opteron2 kernel: Out of Memory: Killed process 28762 (sshd)=
=2E
Oct 11 17:02:18 opteron2 kernel: oom-killer: gfp_mask=3D0x1d2
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA per-cpu:
Oct 11 17:02:18 opteron2 kernel: cpu 0 hot: low 2, high 6, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 0 cold: low 0, high 2, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 1 hot: low 2, high 6, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 1 cold: low 0, high 2, batch 1
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal per-cpu:
Oct 11 17:02:18 opteron2 kernel: cpu 0 hot: low 32, high 96, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 0 cold: low 0, high 32, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 1 hot: low 32, high 96, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 1 cold: low 0, high 32, batch 16
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem per-cpu: empty
Oct 11 17:02:18 opteron2 kernel:
Oct 11 17:02:18 opteron2 kernel: Free pages: 5704kB (0kB HighMem)
Oct 11 17:02:18 opteron2 kernel: Active:161038 inactive:68572 dirty:0 write=
back:97 unstable:0 free:1426 slab:6235 mapped:235719 pagetables:5552
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA free:2888kB min:20kB low:40kB h=
igh:60kB active:1804kB inactive:1392kB present:16384kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 10 722 722
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal free:2816kB min:1424kB low:2=
848kB high:4272kB active:642476kB inactive:272896kB present:1032188kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 0 712 712
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem free:0kB min:128kB low:256k=
B high:384kB active:0kB inactive:0kB present:0kB
Oct 11 17:02:18 opteron2 kernel: protections[]: 0 0 0
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA: 0*4kB 93*8kB 96*16kB 13*32kB 3=
*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB =3D 2888kB
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal: 0*4kB 104*8kB 28*16kB 0*32k=
B 0*64kB 0*128kB 2*256kB 0*512kB 1*1024kB 0*2048kB 0*4096kB =3D 2816kB
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem: empty
Oct 11 17:02:18 opteron2 kernel: Swap cache: add 2325150, delete 2325051, f=
ind 581129/787102, race 55+67
Oct 11 17:02:18 opteron2 kernel: Out of Memory: Killed process 31563 (sshd)=
=2E
Oct 11 17:02:18 opteron2 kernel: oom-killer: gfp_mask=3D0x1d2
Oct 11 17:02:18 opteron2 kernel: Node 0 DMA per-cpu:
Oct 11 17:02:18 opteron2 kernel: cpu 0 hot: low 2, high 6, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 0 cold: low 0, high 2, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 1 hot: low 2, high 6, batch 1
Oct 11 17:02:18 opteron2 kernel: cpu 1 cold: low 0, high 2, batch 1
Oct 11 17:02:18 opteron2 kernel: Node 0 Normal per-cpu:
Oct 11 17:02:18 opteron2 kernel: cpu 0 hot: low 32, high 96, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 0 cold: low 0, high 32, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 1 hot: low 32, high 96, batch 16
Oct 11 17:02:18 opteron2 kernel: cpu 1 cold: low 0, high 32, batch 16
Oct 11 17:02:18 opteron2 kernel: Node 0 HighMem per-cpu: empty

stb. stb. stb.

Nem vagyok kernelszak=E9rt=F5, annyit l=E1tok, hogy kifogyott a mem=F3ri=E1=
b=F3l =E9s
sorra kil=F6v=F6ld=F6zte a processzeket. =C9s v=E9g=FCl is meg tudta mag=E1=
t v=E9deni.


Egyre er=F5sebb a gyan=FAm, hogy felhaszn=E1l=F3i program okozza a galib=E1=
t. Tal=E1n
a kde-ben van valami, ami nem szereti, ha sok p=E9ld=E1nyban fut?

--=20
Ervin
Papp Tamas
2004-10-12 07:51:55 UTC
Permalink
Nem vagyok kernelszakértő, annyit látok, hogy kifogyott a memóriából és
sorra kilövöldözte a processzeket. És végül is meg tudta magát védeni.
Egyre erősebb a gyanúm, hogy felhasználói program okozza a galibát. Talán
a kde-ben van valami, ami nem szereti, ha sok példányban fut?
Nem a sok peldanyon van a lenyeg, hanem hogy vmi elszabadul
egyszercsak es megzabalja a memoriat -> monitorozd, mi mennyit eszik.
Persze ennek csak akkor van ertelme, ha egyebkent is szokott irni
ilyet a logokba, mint most.

De ha jol vagom az elozmenyeket, a korabbi halodasok mas jelleguek
voltak, nem eledt fel a gep, pingre sem valaszolt, kis terhelesnel
is..stb.

tompos
dr. Imre Bartfai
2004-10-12 09:56:37 UTC
Permalink
Hi,

a

CPU HOT nem azt jelenti, hogy felforrt a proci =E9s emiatt le=E1ll=EDtotta?
Imre
Post by Papp Tamas
Nem vagyok kernelszak=E9rt=F5, annyit l=E1tok, hogy kifogyott a mem=F3r=
i=E1b=F3l =E9s
Post by Papp Tamas
sorra kil=F6v=F6ld=F6zte a processzeket. =C9s v=E9g=FCl is meg tudta ma=
g=E1t v=E9deni.
Post by Papp Tamas
Egyre er=F5sebb a gyan=FAm, hogy felhaszn=E1l=F3i program okozza a gali=
b=E1t. Tal=E1n
Post by Papp Tamas
a kde-ben van valami, ami nem szereti, ha sok p=E9ld=E1nyban fut?
Nem a sok peldanyon van a lenyeg, hanem hogy vmi elszabadul
egyszercsak es megzabalja a memoriat -> monitorozd, mi mennyit eszik.
Persze ennek csak akkor van ertelme, ha egyebkent is szokott irni
ilyet a logokba, mint most.
De ha jol vagom az elozmenyeket, a korabbi halodasok mas jelleguek
voltak, nem eledt fel a gep, pingre sem valaszolt, kis terhelesnel
is..stb.
tompos
_______________________________________________
linux++ mailing list
http://mlf.linux.rulez.org/mailman/listinfo/linux++
d***@vas.birosag.hu
2004-10-12 10:08:38 UTC
Permalink
Post by Papp Tamas
Nem vagyok kernelszak=E9rt=F5, annyit l=E1tok, hogy kifogyott a mem=F3r=
i=E1b=F3l =E9s
Post by Papp Tamas
sorra kil=F6v=F6ld=F6zte a processzeket. =C9s v=E9g=FCl is meg tudta ma=
g=E1t v=E9deni.
Post by Papp Tamas
Egyre er=F5sebb a gyan=FAm, hogy felhaszn=E1l=F3i program okozza a gali=
b=E1t. Tal=E1n
Post by Papp Tamas
a kde-ben van valami, ami nem szereti, ha sok p=E9ld=E1nyban fut?
Nem a sok peldanyon van a lenyeg, hanem hogy vmi elszabadul
egyszercsak es megzabalja a memoriat -> monitorozd, mi mennyit eszik.
Persze ennek csak akkor van ertelme, ha egyebkent is szokott irni
ilyet a logokba, mint most.
De ha jol vagom az elozmenyeket, a korabbi halodasok mas jelleguek
voltak, nem eledt fel a gep, pingre sem valaszolt, kis terhelesnel
is..stb.
A kernelforditas eppen arra pelda, hogy a memoriazabalast, a sok processzt
jol lekezeli a gep, ez nem lehet oka a meghalasnak. A logba maskor nem
kerul semmi olyasmi amit ideztem, ez csak a rendkivuli terhelesnek a
kovetkezmenye. Amit pedig kibirt. A feltetelezesem az, hogy van egy vagy
tobb olyan, user altal inditott program, ami utkozni fog, ha futasanak
bizonyos fazisaban onmaga masik peldanyaval talalkozik. Tehat amig csak
egy felhasznalo futtatja, semmi gond, viszont ha egyre tobb felhasznalo
elinditja, az utkozes valoszinusege is egyre nagyobb lesz. De ez egyelore
csupan feltetelezes.

--=20
Ervin
Loading...