Discussion:
HDD error
Fagyal Csongor
2005-04-05 11:41:11 UTC
Permalink
Hi,

A kovetkezo problemam lenne: van egy FC3-am, RAID-1, 2db. 36G SCSI
(U160, IBM), 29160-as vezerlo.

Minden oke volt, de mostansag az egyik RAID particio idonkent (kb.
naponta) levalik. Ezt kapom az mdadm-tol:
"A Fail event had been detected on md device /dev/md1."

Ekozben a logban:
Apr 5 12:00:57 ns1 kernel: SCSI error : <0 0 1 0> return code = 0x8000002
Apr 5 12:00:57 ns1 kernel: Info fld=0x258a218, Current sda: sense key
Medium Error
Apr 5 12:00:57 ns1 kernel: Additional sense: Unrecovered read error
Apr 5 12:00:57 ns1 kernel: end_request: I/O error, dev sda, sector 39363072
Apr 5 12:00:58 ns1 kernel: SCSI error : <0 0 1 0> return code = 0x8000002
Apr 5 12:00:58 ns1 kernel: Info fld=0x258a218, Current sda: sense key
Medium Error
Apr 5 12:00:58 ns1 kernel: Additional sense: Unrecovered read error
Apr 5 12:00:58 ns1 kernel: end_request: I/O error, dev sda, sector 39363080
Apr 5 12:00:59 ns1 kernel: SCSI error : <0 0 1 0> return code = 0x8000002
Apr 5 12:00:59 ns1 kernel: Info fld=0x258a218, Current sda: sense key
Medium Error
Apr 5 12:00:59 ns1 kernel: Additional sense: Unrecovered read error
Apr 5 12:00:59 ns1 kernel: end_request: I/O error, dev sda, sector 39363088
Apr 5 12:01:00 ns1 kernel: SCSI error : <0 0 1 0> return code = 0x8000002
Apr 5 12:01:01 ns1 kernel: Info fld=0x258a218, Current sda: sense key
Medium Error
Apr 5 12:01:01 ns1 kernel: Additional sense: Unrecovered read error
Apr 5 12:01:01 ns1 kernel: end_request: I/O error, dev sda, sector 39363096
Apr 5 12:01:01 ns1 kernel: raid1: Disk failure on sda3, disabling device.
Apr 5 12:01:01 ns1 kernel: Operation continuing on 1 devices
Apr 5 12:01:01 ns1 kernel: raid1: sda3: rescheduling sector 37049688
Apr 5 12:01:01 ns1 kernel: raid1: sdb3: redirecting sector 37049688 to
another mirror
Apr 5 12:01:01 ns1 kernel: RAID1 conf printout:
Apr 5 12:01:01 ns1 kernel: --- wd:1 rd:2
Apr 5 12:01:01 ns1 kernel: disk 0, wo:1, o:0, dev:sda3
Apr 5 12:01:01 ns1 kernel: disk 1, wo:0, o:1, dev:sdb3
Apr 5 12:01:01 ns1 kernel: RAID1 conf printout:
Apr 5 12:01:01 ns1 kernel: --- wd:1 rd:2
Apr 5 12:01:01 ns1 kernel: disk 1, wo:0, o:1, dev:sdb3

A SMART pedig ezt mondja

smartctl -a /dev/sda:
Errors Corrected by Total Correction
Gigabytes Total
EEC rereads/ errors algorithm
processed uncorrected
fast | delayed rewrites corrected invocations [10^9
bytes] errors
read: 0 2 0 0 18
10810.612 18
write: 0 2021 0 26402 26584
615.439 182
verify: 0 0 0 0 0
36.840 0

smartctl -a /dev/sdb:
Errors Corrected by Total Correction
Gigabytes Total
EEC rereads/ errors algorithm
processed uncorrected
fast | delayed rewrites corrected invocations [10^9
bytes] errors
read: 0 0 0 0 0
13766.903 0
write: 0 176 0 1981 1985
1043.505 4
verify: 0 0 0 0 0
50.132 0


Jol erzem, hogy hibas a vinyo (sda), vagy lehet valami masrol is szo?

Koszi,
- Cs.
Zs
2005-04-05 11:56:08 UTC
Permalink
Hi!
Post by Fagyal Csongor
Apr 5 12:00:58 ns1 kernel: SCSI error : <0 0 1 0> return code = 0x8000002
Apr 5 12:00:58 ns1 kernel: Info fld=0x258a218, Current sda: sense key
Medium Error
Apr 5 12:00:58 ns1 kernel: Additional sense: Unrecovered read error
Apr 5 12:00:58 ns1 kernel: end_request: I/O error, dev sda, sector 39363080
A SMART pedig ezt mondja
Errors Corrected by Total Correction
Gigabytes Total
EEC rereads/ errors algorithm
processed uncorrected
fast | delayed rewrites corrected invocations [10^9
bytes] errors
read: 0 2 0 0 18
10810.612 18
write: 0 2021 0 26402 26584
615.439 182
verify: 0 0 0 0 0
36.840 0
Errors Corrected by Total Correction
Gigabytes Total
EEC rereads/ errors algorithm
processed uncorrected
fast | delayed rewrites corrected invocations [10^9
bytes] errors
read: 0 0 0 0 0
13766.903 0
write: 0 176 0 1981 1985
1043.505 4
verify: 0 0 0 0 0
50.132 0
Jol erzem, hogy hibas a vinyo (sda), vagy lehet valami masrol is szo?
Egy SCSI hiba több mindentől lehet - de amikor a SMART programmal
már magától a winyó elektronikától kérdezed meg hogy mi újság és
aszerint is szemmel láthatóan lényegesen nagyobb hiba számot kapsz...
Nos akkor szerintem a tipp jogos, a winyó kezd elköszönni.

Zsolt
Valkai Jozsef
2005-04-05 12:03:18 UTC
Permalink
Szerintem meg SCSI cuccosnal ne beszeljunk SMART-rol, mert ott olyan
nincs, vagy tevedek? :)
--
Valkai Jozsef
+36 70 36 28 147
Post by Zs
Egy SCSI hiba több mindentől lehet - de amikor a SMART programmal
már magától a winyó elektronikától kérdezed meg hogy mi újság és
aszerint is szemmel láthatóan lényegesen nagyobb hiba számot kapsz...
Nos akkor szerintem a tipp jogos, a winyó kezd elköszönni.
Kosa Attila
2005-04-05 12:09:17 UTC
Permalink
Post by Valkai Jozsef
Szerintem meg SCSI cuccosnal ne beszeljunk SMART-rol, mert ott olyan
nincs, vagy tevedek? :)
Device: SEAGATE ST336607LW Version: 0007
Serial number: 3JAA3BZD00007529BY8C
Device type: disk
Transport protocol: Parallel SCSI (SPI-4)
Local Time is: Tue Apr 5 14:09:06 2005 CEST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK

Ez eleg cafolatnak?
--
Udvozlettel
Zsiga
Valkai Jozsef
2005-04-05 12:19:39 UTC
Permalink
Post by Kosa Attila
Device: SEAGATE ST336607LW Version: 0007
Serial number: 3JAA3BZD00007529BY8C
Device type: disk
Transport protocol: Parallel SCSI (SPI-4)
Local Time is: Tue Apr 5 14:09:06 2005 CEST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Ez eleg cafolatnak?
Termeszetesen elegendo... :)
--
Valkai Jozsef
+36 70 36 28 147
***@externet.hu
SZOKOVACS Robert
2005-04-05 12:42:01 UTC
Permalink
Post by Kosa Attila
Post by Valkai Jozsef
Szerintem meg SCSI cuccosnal ne beszeljunk SMART-rol, mert ott olyan
nincs, vagy tevedek? :)
Device: SEAGATE ST336607LW Version: 0007
Serial number: 3JAA3BZD00007529BY8C
Device type: disk
Transport protocol: Parallel SCSI (SPI-4)
Local Time is: Tue Apr 5 14:09:06 2005 CEST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Ez eleg cafolatnak?
ez ugye igazi scsi? A SATAval mi a helyzet?

Szo
--
I guess it wasn't the dove...
Fagyal Csongor
2005-04-05 12:42:36 UTC
Permalink
Post by SZOKOVACS Robert
Post by Kosa Attila
Post by Valkai Jozsef
Szerintem meg SCSI cuccosnal ne beszeljunk SMART-rol, mert ott olyan
nincs, vagy tevedek? :)
Device: SEAGATE ST336607LW Version: 0007
Serial number: 3JAA3BZD00007529BY8C
Device type: disk
Transport protocol: Parallel SCSI (SPI-4)
Local Time is: Tue Apr 5 14:09:06 2005 CEST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Ez eleg cafolatnak?
ez ugye igazi scsi? A SATAval mi a helyzet?
A SATA vinyok tudjak, de a libsata (vagy hogy hivjak...) meg nem.

Juteszembe vinyok. Engem izgat ez a soros SCSI nagyon... mikor lesz?
Latott mar valaki ilyen kartyat? Ocsem, mekkora otlet, ugyanazokat a
kabeleket hasznalni, mint a SATA-nal... sot, egy vezerlovel SATA-II/SCSI...

- Cs.
Kosa Attila
2005-04-05 13:01:30 UTC
Permalink
Post by SZOKOVACS Robert
Post by Kosa Attila
Device: SEAGATE ST336607LW Version: 0007
ez ugye igazi scsi? A SATAval mi a helyzet?
Igen, Seagate Cheetah U320, 10krpm. A pontos specifikaciot a
www.seagate.com keresojevel megtalalod a tipusszam alapjan.
--
Udvozlettel
Zsiga
Fagyal Csongor
2005-04-05 12:07:05 UTC
Permalink
Post by Valkai Jozsef
Szerintem meg SCSI cuccosnal ne beszeljunk SMART-rol, mert ott olyan
nincs, vagy tevedek? :)
Igen, tevedsz :-)

- Cs.

" In 1992, IBM began shipping 3.5-inch hard disk drives that could
actually predict their own failure - an industry first. These drives
were equipped with Predictive Failure Analysis (PFA), an IBM-developed
technology that periodically measures selected drive attributes - things
like head-to-disk flying height - and sends a warning message when a
predefined threshold is exceeded. Industry acceptance of PFA technology
eventually led to SMART (Self-Monitoring, Analysis and Reporting
Technology) becoming the industry-standard reliability prediction
indicator for both IDE/ATA and SCSI hard disk drives. "
Gabor HALASZ
2005-04-06 09:44:31 UTC
Permalink
Post by Fagyal Csongor
Hi,
A kovetkezo problemam lenne: van egy FC3-am, RAID-1, 2db. 36G SCSI
(U160, IBM), 29160-as vezerlo.
Minden oke volt, de mostansag az egyik RAID particio idonkent (kb.
"A Fail event had been detected on md device /dev/md1."
Apr 5 12:00:57 ns1 kernel: SCSI error : <0 0 1 0> return code = 0x8000002
Apr 5 12:00:57 ns1 kernel: Info fld=0x258a218, Current sda: sense key
Medium Error
Jol erzem, hogy hibas a vinyo (sda), vagy lehet valami masrol is szo?
Jól érted, elfogyott a relokációs terület. A másik is haldoklik.
--
Gabor HALASZ <***@freemail.hu>
Sickboy
2005-04-06 22:36:58 UTC
Permalink
Post by Gabor HALASZ
Jól érted, elfogyott a relokációs terület. A másik is haldoklik.
Ez a relokacio nem csak IDE vinyoknal volt automatikusan?
Vagy az regen volt? Vagy igaz se volt?
--
.SiCk of IT.
Gabor SZOLLOSI
2005-04-06 22:52:38 UTC
Permalink
Post by Sickboy
Post by Gabor HALASZ
Jól érted, elfogyott a relokációs terület. A másik is haldoklik.
Ez a relokacio nem csak IDE vinyoknal volt automatikusan?
Vagy az regen volt? Vagy igaz se volt?
Szerintem IDE HDD-knel nem volt. SCSI-nal ugyebar sajat biosabol badsector/
verify tesztet meghivva (ha meg van hely) tudja relokalni a hibas szektort.
Ezen kivul, hogy ezt tudja-e automatikusan, rendes hasznalat kozben, az
engem is erdekelne.
--
szögi
v***@mithrandir.hu
2005-04-07 06:59:45 UTC
Permalink
Post by Sickboy
Post by Gabor HALASZ
Jól érted, elfogyott a relokációs terület. A másik is haldoklik.
Ez a relokacio nem csak IDE vinyoknal volt automatikusan?
Vagy az regen volt? Vagy igaz se volt?
Tudtommal ezt csak a SCSI tudta, vagy tévedek ?
--
[Varadi Gabor]
PÁSZTOR György
2005-04-07 08:31:02 UTC
Permalink
Hali!
Post by v***@mithrandir.hu
Post by Sickboy
Post by Gabor HALASZ
Jól érted, elfogyott a relokációs terület. A másik is haldoklik.
Ez a relokacio nem csak IDE vinyoknal volt automatikusan?
Vagy az regen volt? Vagy igaz se volt?
Tudtommal ezt csak a SCSI tudta, vagy tévedek ?
Fogalmazzunk úgy, hogy a SCSI előbb tudta. Abban már ~10 éve is voltak
ilyenek, ha jól emlékszem.
De egy ismerősöm egyszer egy érdekes összefüggésre hívta fel a figyelmem:
Ugyanattól a gyártótól, ugyanabból a geometriájú (és belül feltételezhetően
hasonló szerkezetű) vinyóból az IDE miért 40 GB-s, az SCSI miért 36, ill. az
ide miért 80 GB-s, és az SCSI miért 72 GB-s, sít. (Akinek nem esne le
magától a tantusz: feltételezhetően az SCSI-n helyből jóval nagyobb
relokációs terület van)

Üdv:Gyur!
-- -------[ Free Software ISOs - http://www.fsn.hu/?f=download ]------- --
PÁSZTOR György e-mail: ***@fsn.hu
Free Software Network (FSN.HU) cell.: +3620 512 3335
Fisher
2005-04-07 08:44:45 UTC
Permalink
Post by PÁSZTOR György
ide miért 80 GB-s, és az SCSI miért 72 GB-s, sít. (Akinek nem esne le
magától a tantusz: feltételezhetõen az SCSI-n helybõl jóval nagyobb
relokációs terület van)
Ez is lehet, nem jártam utána, de az is biztos, hogy az scsi diskek
viccesen vannak ám formázva. Lehet, hogy a modern ide diskek is, teljes
a tudatlanságom e téren, de scsi disket már formáztam újra úgy, hogy nem
is hajazott az eredeti méretére :))

Loading...