Discussion:
md idoutazas
Gabor HALASZ
2010-03-18 10:32:31 UTC
Permalink
Hali!

Ma reggelre odalett az raid1 egyik fele a gepemben, a kernelt is magaval
rantotta, de az igazi meglepetes a reboot utan jott, kicsit nem ugy
nezett ki a gep, mint ahogy emlekeztem tegnaprol, nem keves ez-az
hianyzott is. Belenezek a logokba, es mit latok:

Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] 390721968 512-byte
hardware sectors (200050 MB)
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Write Protect is off
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Write cache: enabled,
read cache: enabled, doesn't support DPO or FUA
Mar 18 11:04:02 sk8n kernel: klogd 1.4.1#18, log source = /proc/kmsg
started.
Mar 18 11:04:02 sk8n kernel: like an initrd
Mar 18 11:04:02 sk8n kernel: Freeing initrd memory: 32768k freed
Mar 18 11:04:02 sk8n kernel: Block layer SCSI generic (bsg) driver
version 0.4 loaded (major 254)

A raidnek latszolag semmi baja, csak fellabu lett:

sk8n:~# cat /proc/mdstat
Personalities : [raid1]
md7 : active raid1 sda9[0]
159308416 blocks [2/1] [U_]

md6 : active raid1 sda8[0]
4008064 blocks [2/1] [U_]

md5 : active raid1 sda7[0]
4008064 blocks [2/1] [U_]

md4 : active raid1 sda6[0]
8008256 blocks [2/1] [U_]

md3 : active raid1 sda5[0]
16008640 blocks [2/1] [U_]

md2 : active raid1 sda3[1]
1003968 blocks [2/1] [_U]

md1 : active raid1 sda2[0]
1003968 blocks [2/1] [U_]

md0 : active raid1 sda1[0]
2008000 blocks [2/1] [U_]


Na de hol az elmult fel ev? Nyilvan a masik diszken, de ezzel nem vagyok
kisegitve, de van meg jopar md-s gepem....Valami otlet?
--
Gabor HALASZ <***@freemail.hu>
Papp Tamás
2010-03-18 10:37:42 UTC
Permalink
Post by Gabor HALASZ
Hali!
Ma reggelre odalett az raid1 egyik fele a gepemben, a kernelt is magaval
rantotta, de az igazi meglepetes a reboot utan jott, kicsit nem ugy
nezett ki a gep, mint ahogy emlekeztem tegnaprol, nem keves ez-az
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] 390721968 512-byte
hardware sectors (200050 MB)
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Write Protect is off
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Write cache: enabled,
read cache: enabled, doesn't support DPO or FUA
Mar 18 11:04:02 sk8n kernel: klogd 1.4.1#18, log source = /proc/kmsg
started.
Mar 18 11:04:02 sk8n kernel: like an initrd
Mar 18 11:04:02 sk8n kernel: Freeing initrd memory: 32768k freed
Mar 18 11:04:02 sk8n kernel: Block layer SCSI generic (bsg) driver
version 0.4 loaded (major 254)
sk8n:~# cat /proc/mdstat
Personalities : [raid1]
md7 : active raid1 sda9[0]
159308416 blocks [2/1] [U_]
md6 : active raid1 sda8[0]
4008064 blocks [2/1] [U_]
md5 : active raid1 sda7[0]
4008064 blocks [2/1] [U_]
md4 : active raid1 sda6[0]
8008256 blocks [2/1] [U_]
md3 : active raid1 sda5[0]
16008640 blocks [2/1] [U_]
md2 : active raid1 sda3[1]
1003968 blocks [2/1] [_U]
md1 : active raid1 sda2[0]
1003968 blocks [2/1] [U_]
md0 : active raid1 sda1[0]
2008000 blocks [2/1] [U_]
Na de hol az elmult fel ev? Nyilvan a masik diszken, de ezzel nem vagyok
kisegitve, de van meg jopar md-s gepem....Valami otlet?
Biztos vagy benne, h az md raid okozta?
En inkabb arra tippelnek, hogy az alaplap megfekudt, es tobbet kozott
elszurta az otat is.

tompos
Gabor HALASZ
2010-03-18 10:51:46 UTC
Permalink
Post by Papp Tamás
Biztos vagy benne, h az md raid okozta?
Mi mas?
Post by Papp Tamás
En inkabb arra tippelnek, hogy az alaplap megfekudt, es tobbet kozott
elszurta az otat is.
Ez sok okbol sem lehetseges, pl kerberos auth van, ntp, de mint irtam,
feltunoen hianyoznak dolgaim, komplett virtualis gep, egy halom bookmark, a
mailer ezrevel tolti le a headereket az imap szerverrol, stb...
--
Gabor HALASZ <***@freemail.hu>
Papp Tamás
2010-03-18 10:56:33 UTC
Permalink
Post by Gabor HALASZ
Post by Papp Tamás
Biztos vagy benne, h az md raid okozta?
Mi mas?
Mint irtam, HW.
Megcsak hasonlot sem lattam, pedig nekem is van sok raid1-es gepem:)
Post by Gabor HALASZ
Post by Papp Tamás
En inkabb arra tippelnek, hogy az alaplap megfekudt, es tobbet kozott
elszurta az otat is.
Ez sok okbol sem lehetseges, pl kerberos auth van, ntp, de mint irtam,
feltunoen hianyoznak dolgaim, komplett virtualis gep, egy halom bookmark, a
mailer ezrevel tolti le a headereket az imap szerverrol, stb...
Ez konnyen kideritheto. Mountold fel a raid masik labat, es kiderul, hol
vannak. Ha ott, akkor tenyleg elkepzelheto, h a raid kuszalta ossze. Ha
ott nem, akkor csak elfikazott az FS. Milyen FS?

De ha a masikon meg meg is van, akkor sem tartom egyertelmuen a raid
hibajanak, bar gyanus, h miert nem ezt szedte ki a tombbol. Nem jol
gondolom?

tompos
Gabor HALASZ
2010-03-18 11:16:49 UTC
Permalink
Post by Papp Tamás
Post by Gabor HALASZ
Post by Papp Tamás
Biztos vagy benne, h az md raid okozta?
Mi mas?
Mint irtam, HW.
Megcsak hasonlot sem lattam, pedig nekem is van sok raid1-es gepem:)
Es melyik hw?
Post by Papp Tamás
Ez konnyen kideritheto. Mountold fel a raid masik labat, es kiderul, hol
vannak.
Mondom, meghalt az egyik diszk.
--
Gabor HALASZ <***@freemail.hu>
KORN Andras
2010-03-18 10:49:20 UTC
Permalink
Post by Papp Tamás
Post by Gabor HALASZ
Na de hol az elmult fel ev? Nyilvan a masik diszken, de ezzel nem vagyok
kisegitve, de van meg jopar md-s gepem....Valami otlet?
Biztos vagy benne, h az md raid okozta?
En inkabb arra tippelnek, hogy az alaplap megfekudt, es tobbet kozott
elszurta az otat is.
Azt irta (csak kicsit kodosen fogalmazott :), hogy a file-ok fel evvel
korabbi allapotat latja a diszken.

En arra tippelnek, hogy mar sokkal korabban szetesett a RAID, es az a diszk,
amelyik most mukodik, az elmult fel evben nem mukodott.

Guy
--
Andras Korn <korn at elan.rulez.org> - <http://chardonnay.math.bme.hu/~korn/>
Si hoc signum legere potes, operis boni in rebus
Latinus alacribus et fructuosis potiri potes!
Papp Tamás
2010-03-18 10:57:44 UTC
Permalink
Post by KORN Andras
Azt irta (csak kicsit kodosen fogalmazott :), hogy a file-ok fel evvel
korabbi allapotat latja a diszken.
OK, igy mar ertem:)
Post by KORN Andras
En arra tippelnek, hogy mar sokkal korabban szetesett a RAID, es az a diszk,
amelyik most mukodik, az elmult fel evben nem mukodott.
Igen, ez meg logikus is:)

tompos
Gabor HALASZ
2010-03-18 11:22:35 UTC
Permalink
On Thu, 18 Mar 2010 11:49:20 +0100, KORN Andras
Post by KORN Andras
En arra tippelnek, hogy mar sokkal korabban szetesett a RAID, es az a
diszk, amelyik most mukodik, az elmult fel evben nem mukodott.
Hagyjuk az ilyesmit. Termeszetesen tegnap meg megvolt mindket fele, amugy
sincs udev es hasonlok, igy eleg statikus a konfiguracio.
Amugy volt mar ilyen tunetet okozo bitmap bug, de az csak eleg nyakatekert
szituacioban jott elo.
--
Gabor HALASZ <***@freemail.hu>
Gabor HALASZ
2010-03-18 12:28:47 UTC
Permalink
Post by KORN Andras
En arra tippelnek, hogy mar sokkal korabban szetesett a RAID, es az a
diszk, amelyik most mukodik, az elmult fel evben nem mukodott.
Tortem a fejem, es nekem a migracio modja a gyanus, mert siman hozzaadtam
anno az md drivehoz egy 3. diszket, stb...Es erosen remlik, hogy mar akkor
latszott az mdstatsban, hogy tul bonyolultat kertem tole (nemelyik md drive
3 elemu lett, a maradek csak ketto, es kidobta az egyik eredetit), de a
vegen ugy nezett ki, minden renden van.
--
Gabor HALASZ <***@freemail.hu>
Gabor Gombas
2010-03-22 06:36:29 UTC
Permalink
Post by Gabor HALASZ
Tortem a fejem, es nekem a migracio modja a gyanus, mert siman hozzaadtam
anno az md drivehoz egy 3. diszket, stb...Es erosen remlik, hogy mar akkor
latszott az mdstatsban, hogy tul bonyolultat kertem tole (nemelyik md drive
3 elemu lett, a maradek csak ketto, es kidobta az egyik eredetit), de a
vegen ugy nezett ki, minden renden van.
Hogyan adtad hozza a 3. diszket? A RAID tombokrol letrehozaskor meg kell
mondani, hogy hany diszk van bennuk, es ezen csak a tomb novelesevel
(mdadm --grow) lehet valtoztatni. Ez relative uj feature, mind a kernel,
mind az mdadm "latest and greatest" kell, hogy legyen hozza.

Gabor
Gabor HALASZ
2010-03-22 14:17:14 UTC
Permalink
Post by Gabor Gombas
Post by Gabor HALASZ
Tortem a fejem, es nekem a migracio modja a gyanus, mert siman hozzaadtam
anno az md drivehoz egy 3. diszket, stb...Es erosen remlik, hogy mar akkor
latszott az mdstatsban, hogy tul bonyolultat kertem tole (nemelyik md drive
3 elemu lett, a maradek csak ketto, es kidobta az egyik eredetit), de a
vegen ugy nezett ki, minden renden van.
Hogyan adtad hozza a 3. diszket?
mdadm --add
Post by Gabor Gombas
A RAID tombokrol letrehozaskor meg kell
mondani, hogy hany diszk van bennuk, es ezen csak a tomb novelesevel
(mdadm --grow) lehet valtoztatni. Ez relative uj feature, mind a kernel,
mind az mdadm "latest and greatest" kell, hogy legyen hozza.
Atmigraltam pata-rol sata-ra, igy nem is akartam novelni a diszkek
szamat. Akkor jonak tunt, egeszen mostanaig (kozben utananeztem,
szokasos linux nyug, az osszeganyolt md kod ahelyett, hogy kirakta volna
az egyertelmuen doglott diszket a tombbol, elkezdte tovabb gyilkolaszni,
mert attol majd megjavul, az elso read-ig teljesen jonak tunik a diszk).
--
Gabor HALASZ <***@freemail.hu>
Mihaly Zachar
2010-03-19 00:29:05 UTC
Permalink
Post by Gabor HALASZ
Hali!
Ma reggelre odalett az raid1 egyik fele a gepemben, a kernelt is magaval
rantotta, de az igazi meglepetes a reboot utan jott, kicsit nem ugy
nezett ki a gep, mint ahogy emlekeztem tegnaprol, nem keves ez-az
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] 390721968 512-byte
hardware sectors (200050 MB)
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Write Protect is off
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
Jul 28 16:53:46 sk8n kernel: sd 1:0:0:0: [sdb] Write cache: enabled,
read cache: enabled, doesn't support DPO or FUA
Mar 18 11:04:02 sk8n kernel: klogd 1.4.1#18, log source = /proc/kmsg
started.
Mar 18 11:04:02 sk8n kernel: like an initrd
Mar 18 11:04:02 sk8n kernel: Freeing initrd memory: 32768k freed
Mar 18 11:04:02 sk8n kernel: Block layer SCSI generic (bsg) driver
version 0.4 loaded (major 254)
sk8n:~# cat /proc/mdstat
Personalities : [raid1]
md7 : active raid1 sda9[0]
159308416 blocks [2/1] [U_]
md6 : active raid1 sda8[0]
4008064 blocks [2/1] [U_]
md5 : active raid1 sda7[0]
4008064 blocks [2/1] [U_]
md4 : active raid1 sda6[0]
8008256 blocks [2/1] [U_]
md3 : active raid1 sda5[0]
16008640 blocks [2/1] [U_]
md2 : active raid1 sda3[1]
1003968 blocks [2/1] [_U]
md1 : active raid1 sda2[0]
1003968 blocks [2/1] [U_]
md0 : active raid1 sda1[0]
2008000 blocks [2/1] [U_]
Na de hol az elmult fel ev? Nyilvan a masik diszken, de ezzel nem vagyok
kisegitve, de van meg jopar md-s gepem....Valami otlet?
Udv!

Bar erdemben nemtudok hozzaszolni, viszont en is jartam mar hasonlokepp.
(hozzateszem, hogy egy parszor mar sikeresen vegrehajtottam a kovetkezoket:)

Volt A es B diszkbol allo RAID1 tombom, ahonnan A kihullott, C disk-re
csereltem es osszeszinkronizaltam B-vel.

Kb fel ev mulva kiesett B disk is, es akkor szomoruan konstataltam, hogy
C disk nem mozdult el a szinkronizacios allapot utan, magyarul fel eves
adatok voltak rajta.

A raid tomb mindvegig egeszsegesnek mutatkozott, villogott mindket diszk
az IO-nal, mdstat "UU" allapotot jelzett, semmi fura a logban (eleg
strict logcheck-em volt)

Pislogtam egy darabig, majd betudtam annak, hogy valamit elrontottam,
ilyet nem csinalhat az md kod.

Ezekszerint sajnos ez nem igy van, es ez azert eleg szomoru. :(

Hozzateszem, hogy ~2006 kornyeken tortent egyetlen egyszer, se elotte,
se utanna nem volt hasonlo tapasztalatom.


Misi
KORN Andras
2010-03-19 01:00:02 UTC
Permalink
Post by Mihaly Zachar
Bar erdemben nemtudok hozzaszolni, viszont en is jartam mar hasonlokepp.
(hozzateszem, hogy egy parszor mar sikeresen vegrehajtottam a kovetkezoket:)
Volt A es B diszkbol allo RAID1 tombom, ahonnan A kihullott, C disk-re
csereltem es osszeszinkronizaltam B-vel.
Kb fel ev mulva kiesett B disk is, es akkor szomoruan konstataltam, hogy
C disk nem mozdult el a szinkronizacios allapot utan, magyarul fel eves
adatok voltak rajta.
FWIW, en sokszor csinaltam ilyet (epp most a napokban halmozottan), es sosem
tapasztaltam hasonlo problemat.

Guy
--
Andras Korn <korn at elan.rulez.org> - <http://chardonnay.math.bme.hu/~korn/>
Growing Old is Mandatory, Growing Up is Strictly Optional.
Hirling Endre
2010-03-19 07:56:58 UTC
Permalink
Post by KORN Andras
Post by Mihaly Zachar
Kb fel ev mulva kiesett B disk is, es akkor szomoruan konstataltam, hogy
C disk nem mozdult el a szinkronizacios allapot utan, magyarul fel eves
adatok voltak rajta.
FWIW, en sokszor csinaltam ilyet (epp most a napokban halmozottan), es sosem
tapasztaltam hasonlo problemat.
Egyszer, jópár éve volt egy v. két kernelverzió, ami produkált hasonlót, de kb
egy hetes időtartamon belül kellett telepíteni a gépet, mert hamar kijavították.

-m-
Gabor HALASZ
2010-03-19 10:09:30 UTC
Permalink
Post by Hirling Endre
Egyszer, jópár éve volt egy v. két kernelverzió, ami produkált hasonlót,
de
Post by Hirling Endre
kb
egy hetes időtartamon belül kellett telepíteni a gépet, mert hamar kijavították.
2.6.16 es 2.6.24 van rajta, tobbnyire az utobbi ment
--
Gabor HALASZ <***@freemail.hu>
Loading...