Emask 0x9 media error

винт умирает? Сейчас при сильной нагрузке (linuxdcpp сканил кучу файлов, при этом я тоже чем-то занимался) начались странности ) далее комп завис, перезагрузился, в логе обнаружил записи вида: Device: /dev/sda, is SMART capable. Adding to «monitor» list. Monitoring 1 ATA and 0 SCSI devices Device: /dev/sda, 1 Currently unreadable (pending) sectors далее опять запустил […]

Содержание

  1. винт умирает?
  2. Re: винт умирает?
  3. Re: винт умирает?
  4. Re: винт умирает?
  5. Re: винт умирает?
  6. Re: винт умирает?
  7. Re: винт умирает?
  8. Re: винт умирает?
  9. Re: винт умирает?
  10. Re: винт умирает?
  11. Re: винт умирает?
  12. Emask 0x9 media error

винт умирает?

Сейчас при сильной нагрузке (linuxdcpp сканил кучу файлов, при этом я тоже чем-то занимался) начались странности )
далее комп завис, перезагрузился, в логе обнаружил записи вида:

Device: /dev/sda, is SMART capable. Adding to «monitor» list.
Monitoring 1 ATA and 0 SCSI devices
Device: /dev/sda, 1 Currently unreadable (pending) sectors

далее опять запустил linuxdcpp и в логе от kernel:

ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x65
ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in
res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)
ata1.01: configured for UDMA/100
ata1: EH complete
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x65
ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in
res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)
ata1.01: configured for UDMA/100
ata1: EH complete

думал проверить читаемость всех файлов из каталога и ниже, который подсовываю — как это сделать?
Чтото-типа cp ./dir -Recurce /dev/null

ос сусе103
винт wd320гб, куплен

полгода назад, не носил, не кидал

Re: винт умирает?

в догонку: только сейчас вылезло в лог:

Nov 20 21:25:35 smartd[3941]: Device: /dev/sda, 1 Currently unreadable (pending) sectors
Nov 20 21:25:35 smartd[3941]: Device: /dev/sda, ATA error count increased from 0 to 24
Nov 20 21:25:35 smartd[3941]: Sending warning via /usr/lib/smartmontools/smart-notify to root@localhost .
Nov 20 21:25:35 smartd[3941]: Warning via /usr/lib/smartmontools/smart-notify to root@localhost produced unexpected output (53 bytes)
Nov 20 21:25:35 smartd[3941]: Warning via /usr/lib/smartmontools/smart-notify to root@localhost: successful

Re: винт умирает?

Последние WD, вообще-то, довольно неплохи были.. У самого такой же в качестве одного из внешних для домашнего использования.. никаких проблем..

Можно было бы попробовать ещё с libata поиграться.. Если не поможет, значит, всё-таки, проблемы с диском..

Re: винт умирает?

Прогони mhdd его. Только ман сначала почитай. Было аналогичное сообщение смарта недавно, логический бэд был на одном секторе. Симптомы — при чтении сектора щелкает головками и вешает систему нафиг. Вылечилось scan’ом с самой-нижней-функцией включенной, не помню как называется, Erase ЧЕГОТОТАМ.

Re: винт умирает?

smartctl —all /dev/sda что показывает?

Хотя, с винтами такое бывает 🙁

Re: винт умирает?

> Последние WD, вообще-то, довольно неплохи были..

Тихие и быстрые — да. А вот по поводу надежности, как раз сейчас пошла волна по форумам «сдох WD-*AAKS, купленный полгода -год назад».

Re: винт умирает?

> Вылечилось scan’ом с самой-нижней-функцией включенной, не помню как называется, Erase ЧЕГОТОТАМ.

Remap называется, советчик хренов 🙂

Re: винт умирает?

> Тихие и быстрые — да. А вот по поводу надежности, как раз сейчас пошла волна по форумам «сдох WD-*AAKS, купленный полгода -год назад».

Дык правильно, это ж вендузятнеги пишут. А какой вендузятнег будет заморачиваться обеспечением надлежащих условий для работы винтов? Вот и получается что в корпусе с температурой >50 от потоков раскалённого парой-тройкой «тридэускорителей» воздуха винты подыхают валом.

Re: винт умирает?

Не, нифига не ремап. С ремапом наоборот, доходил до этого сектора и вешался нафиг. ERASE WAITs оно называлось: http://onehalf.pisem.net/stat/mhdd.html

Re: винт умирает?

Вот пришел домой, включил, опять ошибки в логе:
smartd[3941]: Device: /dev/sda, ATA error count increased from 24 to 60

Небольшой вопрос — винт у меня IDE, почему он идет как sda?

Вывод smartctl —all /dev/sda:

smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar SE family
Device Model: WDC WD3200JB-00KFA0
Serial Number: WD-WCAMR3227228
Firmware Version: 08.05J08
User Capacity: 320 072 933 376 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Wed Nov 21 20:07:39 2007 MSK
SMART support is: Available — device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x84) Offline data collection activity
was suspended by an interrupting command from host.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (9600) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 116) minutes.
Conveyance self-test routine
recommended polling time: ( 6) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always — 0
3 Spin_Up_Time 0x0003 218 183 021 Pre-fail Always — 4075
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always — 609
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always — 0
7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always — 0
9 Power_On_Hours 0x0032 098 098 000 Old_age Always — 1770
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always — 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always — 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always — 596
194 Temperature_Celsius 0x0022 128 098 000 Old_age Always — 22
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always — 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always — 1
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always — 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline — 0

SMART Error Log Version: 1
ATA Error Count: 60 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It «wraps» after 49.710 days.

Re: винт умирает?

——————————————————————————- —————-
Error 60 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:20.635 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:20.630 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:20.625 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:20.615 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:20.615 READ NATIVE MAX ADDRESS EXT

Error 59 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:18.115 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:18.115 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:18.105 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:18.095 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:18.095 READ NATIVE MAX ADDRESS EXT

Error 58 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:16.070 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:16.070 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:16.060 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:16.055 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:16.055 READ NATIVE MAX ADDRESS EXT

Error 57 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:14.025 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:14.025 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:14.015 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:14.010 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:14.010 READ NATIVE MAX ADDRESS EXT

Error 56 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:11.995 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:11.995 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:11.985 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:11.985 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:11.985 READ NATIVE MAX ADDRESS EXT

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Источник

Различные проблемы в уже поднятых темах:
проблемы с HDD (самопроизвольное отключение)
«Хрустит» HDD
Стук HDD
Обломилась ножка в разъёме HDD
HDD и шлейфы
Проги, помогающие в тестировании:
MHDD
В презентации не нуждается
http://hddguru.com/content/ru/software/2005.10.02-MHDD/?lang=ru
Help
http://wiki.oszone.net/images/1/13/MHDD-_справка.rar

Всего записей: 4655 | Зарегистр. 04-06-2002 |

Отправлено:

12:15 23-08-2011 | Исправлено: Engaged Clown, 13:24 28-03-2013

panda2019

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Приветствию всех и прошу о помощи и консультации.
Поставил себе на старый нетбук дебиан(первой опыт общения с линуксом). в процессе настройки системы под себе столкнулся с проблемой что когда запускаю какой-либо поиск иногда при обращении к некоторым файлам система зависает. посмотрел что происходит в системе, а там повторяется
[3016.414156] ata1.00: status
[3016.41xxxx] ata1.00: error
[3016.41xxxx] ata1.00: exception emask 0x0 Sact 0x0 SErr 0x0 action 0x0
[3016.41xxxx] ata1.00: BMDMA stat 0x5
[3016.41xxxx] ata1.00: failed command: READ DMA
[3016.41xxxx] ata1.00: cmd c8/00:xx:xx:xx:xx:xx/00:00:00:00:00/e0 tag 0 dma 4096 in
[3016.41xxxx] res 51/40:xx:xx:xx:xx:xx/00:00:00:00:00/e0 Emask (media error)
[3016.41xxxx] end_request: I/0 error, dev sda sector 6925008

меняются только числа в квадратных скобках. проблема с хардом, вотолько вопрос в чем именно. я так понял проблема чтения из конкретных секторов? то есть они битые? если возможность что ошибка в чем то другом? если проблема в секторах, есть ли возможность проверить какие именно сектора битые и сделать так что бы к ним не обращалась система?

Добавлено:
если мне подскажут как на этом форуме выкладывать спойлеры то я весь лог скину

Всего записей: 8 | Зарегистр. 24-05-2008 | Отправлено: 16:58 26-07-2013
igor_me

Gold Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата:

Да, похоже есть бэды на диске. Модель диска и скрриншот SMART покажите хотя бы

Цитата:

есть ли возможность проверить какие именно сектора битые

Цитата:

end_request: I/0 error, dev sda sector 6925008

А вообще — если есть бэды — их надо заремапить. Если винту есть куда ремапить Это будет видно из SMART.

Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 20:01 26-07-2013
panda2019

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Код:

Jul 26 21:00:36 debian kernel: [ 1474.205280] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:00:36 debian kernel: [ 1474.208516] ata1.00: BMDMA stat 0x5
Jul 26 21:00:36 debian kernel: [ 1474.211560] ata1.00: failed command: READ DMA
Jul 26 21:00:36 debian kernel: [ 1474.214508] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:00:36 debian kernel: [ 1474.214513] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:00:36 debian kernel: [ 1474.220971] ata1.00: status: < DRDY ERR >
Jul 26 21:00:36 debian kernel: [ 1474.224166] ata1.00: error: < UNC >
Jul 26 21:00:36 debian kernel: [ 1474.248605] ata1.00: configured for UDMA/133
Jul 26 21:00:36 debian kernel: [ 1474.248649] ata1: EH complete
Jul 26 21:00:40 debian kernel: [ 1478.316729] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:00:40 debian kernel: [ 1478.320441] ata1.00: BMDMA stat 0x5
Jul 26 21:00:40 debian kernel: [ 1478.324340] ata1.00: failed command: READ DMA
Jul 26 21:00:40 debian kernel: [ 1478.327837] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:00:40 debian kernel: [ 1478.327843] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:00:40 debian kernel: [ 1478.335665] ata1.00: status: < DRDY ERR >
Jul 26 21:00:40 debian kernel: [ 1478.340557] ata1.00: error: < UNC >
Jul 26 21:00:40 debian kernel: [ 1478.368733] ata1.00: configured for UDMA/133
Jul 26 21:00:40 debian kernel: [ 1478.368775] ata1: EH complete
Jul 26 21:00:44 debian kernel: [ 1482.417078] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:00:44 debian kernel: [ 1482.420793] ata1.00: BMDMA stat 0x5
Jul 26 21:00:44 debian kernel: [ 1482.424878] ata1.00: failed command: READ DMA
Jul 26 21:00:44 debian kernel: [ 1482.428473] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:00:44 debian kernel: [ 1482.428479] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:00:44 debian kernel: [ 1482.435817] ata1.00: status: < DRDY ERR >
Jul 26 21:00:44 debian kernel: [ 1482.440661] ata1.00: error: < UNC >
Jul 26 21:00:44 debian kernel: [ 1482.470569] ata1.00: configured for UDMA/133
Jul 26 21:00:44 debian kernel: [ 1482.470609] ata1: EH complete
Jul 26 21:00:48 debian kernel: [ 1486.539639] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:00:48 debian kernel: [ 1486.542798] ata1.00: BMDMA stat 0x5
Jul 26 21:00:48 debian kernel: [ 1486.545888] ata1.00: failed command: READ DMA
Jul 26 21:00:48 debian kernel: [ 1486.548968] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:00:48 debian kernel: [ 1486.548973] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:00:48 debian kernel: [ 1486.554977] ata1.00: status: < DRDY ERR >
Jul 26 21:00:48 debian kernel: [ 1486.558246] ata1.00: error: < UNC >
Jul 26 21:00:48 debian kernel: [ 1486.584698] ata1.00: configured for UDMA/133
Jul 26 21:00:48 debian kernel: [ 1486.584744] ata1: EH complete
Jul 26 21:00:52 debian kernel: [ 1490.662200] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:00:52 debian kernel: [ 1490.665347] ata1.00: BMDMA stat 0x5
Jul 26 21:00:52 debian kernel: [ 1490.668430] ata1.00: failed command: READ DMA
Jul 26 21:00:52 debian kernel: [ 1490.671344] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:00:52 debian kernel: [ 1490.671349] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:00:52 debian kernel: [ 1490.677477] ata1.00: status: < DRDY ERR >
Jul 26 21:00:52 debian kernel: [ 1490.680763] ata1.00: error: < UNC >
Jul 26 21:00:52 debian kernel: [ 1490.704694] ata1.00: configured for UDMA/133
Jul 26 21:00:52 debian kernel: [ 1490.704739] ata1: EH complete
Jul 26 21:00:56 debian kernel: [ 1494.762550] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:00:56 debian kernel: [ 1494.766467] ata1.00: BMDMA stat 0x5
Jul 26 21:00:56 debian kernel: [ 1494.770435] ata1.00: failed command: READ DMA
Jul 26 21:00:56 debian kernel: [ 1494.774474] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:00:56 debian kernel: [ 1494.774479] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:00:56 debian kernel: [ 1494.781713] ata1.00: status: < DRDY ERR >
Jul 26 21:00:56 debian kernel: [ 1494.784665] ata1.00: error: < UNC >
Jul 26 21:00:56 debian kernel: [ 1494.808690] ata1.00: configured for UDMA/133
Jul 26 21:00:56 debian kernel: [ 1494.808741] sd 0:0:0:0: [sda] Unhandled sense code
Jul 26 21:00:56 debian kernel: [ 1494.808753] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jul 26 21:00:56 debian kernel: [ 1494.808769] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Jul 26 21:00:56 debian kernel: [ 1494.808788] Descriptor sense data with sense descriptors (in hex):
Jul 26 21:00:56 debian kernel: [ 1494.808799] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Jul 26 21:00:56 debian kernel: [ 1494.808842] 00 69 aa d0
Jul 26 21:00:56 debian kernel: [ 1494.808861] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error — auto reallocate failed
Jul 26 21:00:56 debian kernel: [ 1494.808883] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 00 69 aa d0 00 00 08 00
Jul 26 21:00:56 debian kernel: [ 1494.808921] end_request: I/O error, dev sda, sector 6925008
Jul 26 21:00:56 debian kernel: [ 1494.811987] ata1: EH complete
Jul 26 21:01:59 debian kernel: [ 1556.956590] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:01:59 debian kernel: [ 1556.956843] ata1.00: BMDMA stat 0x5
Jul 26 21:01:59 debian kernel: [ 1556.956920] ata1.00: failed command: READ DMA
Jul 26 21:01:59 debian kernel: [ 1556.957019] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:01:59 debian kernel: [ 1556.957022] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:01:59 debian kernel: [ 1556.957310] ata1.00: status: < DRDY ERR >
Jul 26 21:01:59 debian kernel: [ 1556.957393] ata1.00: error: < UNC >
Jul 26 21:01:59 debian kernel: [ 1556.980671] ata1.00: configured for UDMA/133
Jul 26 21:01:59 debian kernel: [ 1556.980713] ata1: EH complete
Jul 26 21:02:03 debian kernel: [ 1561.034706] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:02:03 debian kernel: [ 1561.034894] ata1.00: BMDMA stat 0x5
Jul 26 21:02:03 debian kernel: [ 1561.035000] ata1.00: failed command: READ DMA
Jul 26 21:02:03 debian kernel: [ 1561.035132] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:02:03 debian kernel: [ 1561.035137] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:02:03 debian kernel: [ 1561.035551] ata1.00: status: < DRDY ERR >
Jul 26 21:02:03 debian kernel: [ 1561.035665] ata1.00: error: < UNC >
Jul 26 21:02:03 debian kernel: [ 1561.057199] ata1.00: configured for UDMA/133
Jul 26 21:02:03 debian kernel: [ 1561.057257] ata1: EH complete
Jul 26 21:02:07 debian kernel: [ 1565.123933] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:02:07 debian kernel: [ 1565.124231] ata1.00: BMDMA stat 0x5
Jul 26 21:02:07 debian kernel: [ 1565.124336] ata1.00: failed command: READ DMA
Jul 26 21:02:07 debian kernel: [ 1565.124476] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:02:07 debian kernel: [ 1565.124481] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:02:07 debian kernel: [ 1565.124782] ata1.00: status: < DRDY ERR >
Jul 26 21:02:07 debian kernel: [ 1565.124865] ata1.00: error: < UNC >
Jul 26 21:02:07 debian kernel: [ 1565.148682] ata1.00: configured for UDMA/133
Jul 26 21:02:07 debian kernel: [ 1565.148728] ata1: EH complete
Jul 26 21:02:11 debian kernel: [ 1569.224249] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:02:11 debian kernel: [ 1569.227249] ata1.00: BMDMA stat 0x5
Jul 26 21:02:11 debian kernel: [ 1569.230220] ata1.00: failed command: READ DMA
Jul 26 21:02:11 debian kernel: [ 1569.233271] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:02:11 debian kernel: [ 1569.233276] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:02:11 debian kernel: [ 1569.239541] ata1.00: status: < DRDY ERR >
Jul 26 21:02:11 debian kernel: [ 1569.243068] ata1.00: error: < UNC >
Jul 26 21:02:11 debian kernel: [ 1569.268714] ata1.00: configured for UDMA/133
Jul 26 21:02:11 debian kernel: [ 1569.268760] ata1: EH complete
Jul 26 21:02:15 debian kernel: [ 1573.346842] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:02:15 debian kernel: [ 1573.350034] ata1.00: BMDMA stat 0x5
Jul 26 21:02:15 debian kernel: [ 1573.353049] ata1.00: failed command: READ DMA
Jul 26 21:02:15 debian kernel: [ 1573.356006] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:02:15 debian kernel: [ 1573.356011] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:02:15 debian kernel: [ 1573.362379] ata1.00: status: < DRDY ERR >
Jul 26 21:02:15 debian kernel: [ 1573.365360] ata1.00: error: < UNC >
Jul 26 21:02:15 debian kernel: [ 1573.392675] ata1.00: configured for UDMA/133
Jul 26 21:02:15 debian kernel: [ 1573.392714] ata1: EH complete
Jul 26 21:02:19 debian kernel: [ 1577.480535] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 26 21:02:19 debian kernel: [ 1577.483651] ata1.00: BMDMA stat 0x5
Jul 26 21:02:19 debian kernel: [ 1577.486551] ata1.00: failed command: READ DMA
Jul 26 21:02:19 debian kernel: [ 1577.489590] ata1.00: cmd c8/00:08:d0:aa:69/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul 26 21:02:19 debian kernel: [ 1577.489595] res 51/40:08:d0:aa:69/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 26 21:02:19 debian kernel: [ 1577.495438] ata1.00: status: < DRDY ERR >
Jul 26 21:02:19 debian kernel: [ 1577.498390] ata1.00: error: < UNC >
Jul 26 21:02:19 debian kernel: [ 1577.524670] ata1.00: configured for UDMA/133
Jul 26 21:02:19 debian kernel: [ 1577.524719] sd 0:0:0:0: [sda] Unhandled sense code
Jul 26 21:02:19 debian kernel: [ 1577.524731] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jul 26 21:02:19 debian kernel: [ 1577.524748] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Jul 26 21:02:19 debian kernel: [ 1577.524767] Descriptor sense data with sense descriptors (in hex):
Jul 26 21:02:19 debian kernel: [ 1577.524777] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Jul 26 21:02:19 debian kernel: [ 1577.524820] 00 69 aa d0
Jul 26 21:02:19 debian kernel: [ 1577.524839] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error — auto reallocate failed
Jul 26 21:02:19 debian kernel: [ 1577.524861] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 00 69 aa d0 00 00 08 00
Jul 26 21:02:19 debian kernel: [ 1577.524900] end_request: I/O error, dev sda, sector 6925008
Jul 26 21:02:19 debian kernel: [ 1577.527948] ata1: EH complete

Цитата:

Модель диска и скрриншот SMART покажите

ata hitachi hts543212l9a300
а вот со смартом проблема.
результатом aptitude install smartmontools
как только появляется построение дерева зависимостей сразу новая пачка ошибок. и вконце ошибка шины. так что скрин будет после того как сделаю загрузачную флешку

Всего записей: 8 | Зарегистр. 24-05-2008 | Отправлено: 22:24 26-07-2013
Lonely_Knight

Full Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Ребята, я всё пытаюсь найти сгоревший стабилитрон на 5 Вольт. Прозвонкой ставил один щуп на 5вольтовый контакт питания, вторым прозванивал все крупные элементы, на всех пищит (то есть замыкание), кроме вот этих двух:

Причём именно верхние их контакты не пищат. Может быть один из них стабилитроном? (стрелками пометил 1 и 2).
Не могу в интернете ничего найти на тему поиска сгоревших стабилитронов с помощью тестера, может я как-то неправильно ищу. Подскажите кто знает, только на вас надежда!
Спасибо.

———-
Чем больше мы узнаём, тем меньше мы знаем.

Всего записей: 508 | Зарегистр. 26-10-2006 | Отправлено: 12:27 28-07-2013
igor_me

Gold Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Тут какое дело: тяжеловато нам помоч вам, когда плата у вас в руках.
Для начала неплохо бы её открутить от банки.
Далее:
Цитата:

Может быть один из них стабилитроном?

НЕТ, это конденсаторы, маркировка Сххх.
Поконкретнее, какие из больших элементов звонились?
Микросхема-восьминожка в верхнем правом углу платы: какая маркировка и как звонится, случаем не все ноги «пищат»? (звонить ОТНОСИТЕЛЬНО ЗЕМЛИ, а не +5В).
Далее http://zalil.ru/34648789
На всякий случай проверьте ноги транзистора (отмечен синим).
Подозрительно выглядит резистор R519 (вроде), отмеченный зелёным. Он часом не обуглен? Или он просто синего цвета (по фото не видно)? Какая маркировка на самом элементе (если видно), и как звонится? («на проход», т. е. щупы на оба контакта элемента. Если не «звенит», то сколько Ом показывает, соответствует маркировке?)

ЗЫ tomset, не только «с Мишаней ходите парой»

Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 15:21 28-07-2013 | Исправлено: igor_me, 15:29 28-07-2013
tomset

BANNED

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Lonely_Knight
На этой модификации Calypco нет Защитных Диодов (а не стабилитронов!)
Транзистор Q501 проверте.
Если и после его отпайки КЗ останется, то там все вынесло.
Проще всю плату будет поменять.
И главное, коммутатор в гермоблоке по +5V и -5V прозвоните, инача и новая плата сгорит.
Всего записей: 6906 | Зарегистр. 02-12-2002 | Отправлено: 15:22 28-07-2013 | Исправлено: tomset, 15:27 28-07-2013
panda2019

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата:

скрриншот SMART покажите хотя бы

smartctl 5.43 2012-06-30 r3573 [i686-linux-3.8.2] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family: Hitachi Travelstar 5K320
Device Model: Hitachi HTS543212L9A300
Serial Number: 080710FB0B00LGC1VZ7A
LU WWN Device Id: 5 000cca 569c0d9a2
Firmware Version: FBBOC40C
User Capacity: 120 034 123 776 bytes [120 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 3f
Local Time is: Mon Jul 29 16:35:50 2013 GMT
SMART support is: Available — device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 645) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 52) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 090 090 062 Pre-fail Always — 3932160
2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline — 0
3 Spin_Up_Time 0x0007 253 253 033 Pre-fail Always — 0
4 Start_Stop_Count 0x0012 099 099 000 Old_age Always — 3021
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always — 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always — 0
8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline — 0
9 Power_On_Hours 0x0012 092 092 000 Old_age Always — 3504
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always — 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always — 2889
191 G-Sense_Error_Rate 0x000a 099 099 000 Old_age Always — 2
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always — 111
193 Load_Cycle_Count 0x0012 093 093 000 Old_age Always — 70006
194 Temperature_Celsius 0x0002 166 166 000 Old_age Always — 33 (Min/Max 8/52)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always — 233
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always — 9
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always — 0
223 Load_Retry_Count 0x000a 100 100 000 Old_age Always — 0

SMART Error Log Version: 1
ATA Error Count: 559 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It «wraps» after 49.710 days.

Error 559 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5f 32 6a e0 Error: UNC 1 sectors at LBA = 0x006a325f = 6959711

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
c8 00 08 58 32 6a e0 08 04:31:29.100 READ DMA
27 00 00 00 00 00 e0 08 04:31:29.100 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 04:31:29.100 IDENTIFY DEVICE
ef 03 46 00 00 00 a0 08 04:31:29.100 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 04:31:29.100 READ NATIVE MAX ADDRESS EXT

Error 558 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5f 32 6a e0 Error: UNC 1 sectors at LBA = 0x006a325f = 6959711

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
c8 00 08 58 32 6a e0 08 04:31:25.000 READ DMA
27 00 00 00 00 00 e0 08 04:31:25.000 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 04:31:25.000 IDENTIFY DEVICE
ef 03 46 00 00 00 a0 08 04:31:25.000 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 04:31:25.000 READ NATIVE MAX ADDRESS EXT

Error 557 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5f 32 6a e0 Error: UNC 1 sectors at LBA = 0x006a325f = 6959711

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
c8 00 08 58 32 6a e0 08 04:31:20.900 READ DMA
27 00 00 00 00 00 e0 08 04:31:20.900 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 04:31:20.900 IDENTIFY DEVICE
ef 03 46 00 00 00 a0 08 04:31:20.900 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 04:31:20.900 READ NATIVE MAX ADDRESS EXT

Error 556 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5f 32 6a e0 Error: UNC 1 sectors at LBA = 0x006a325f = 6959711

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
c8 00 08 58 32 6a e0 08 04:31:16.800 READ DMA
27 00 00 00 00 00 e0 08 04:31:16.800 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 04:31:16.800 IDENTIFY DEVICE
ef 03 46 00 00 00 a0 08 04:31:16.700 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 04:31:16.700 READ NATIVE MAX ADDRESS EXT

Error 555 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5f 32 6a e0 Error: UNC 1 sectors at LBA = 0x006a325f = 6959711

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
c8 00 08 58 32 6a e0 08 04:31:12.600 READ DMA
27 00 00 00 00 00 e0 08 04:31:12.600 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 04:31:12.600 IDENTIFY DEVICE
ef 03 46 00 00 00 a0 08 04:31:12.600 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 04:31:12.600 READ NATIVE MAX ADDRESS EXT

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Вот полнй отчет

Всего записей: 8 | Зарегистр. 24-05-2008 | Отправлено: 17:53 29-07-2013
ToppeaDop

Full Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Здравствуйте!
В один не прекрасный день перестал работать внешний диск Transcend, по факту — Seagate Momentus 5400.6 (500 GB) с SATA-разъемом. WWN: 5000C50022D3B204, Date: 10453.

Не определяется ни через USB-мосты, ни при подключении к SATA-выводам компьютера.

при подаче питания неритмично хрустит, как будто идет многочисленное чтение чего-то с разных мест диска в хаотичном порядке.

Как это обычно бывает, на диске — фотографии, документы, которые просто так из инета не найдешь, не скачаешь. Семейный архив, все такое, общий объем важного, по прикидкам — гигов 200-250.

Что можно попытаться сделать, куда бежать, чтобы восстановить информацию по максимуму? Может, посоветуете хороших хдд-ведов в СПб, которым можно доверить диск на восстановление инфы, чтобы сработали на совесть, а не испортили то, что еще не испортилось само?

Всего записей: 453 | Зарегистр. 24-08-2003 | Отправлено: 16:05 30-07-2013
s1yder

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Помогите разобраться, пожалуйста. Есть пациент WD Blue WD10EZEX. Симптомы: не определяется, не крутится. Цель — вытащить инфу. Вышел из строя видимо из-за замыкания. Есть еще один такой же хард, пробовали перекинуть плату, хард закрутился но тут же останавливается и так повторяется. Куда копать и что делать. Но фото пометил зону, где наблюдается повышенный нагрев, прям раскаляется. Вроде как это квадратный чип WDHC. и белая деталь где написано SK1


Всего записей: 11 | Зарегистр. 08-04-2011 | Отправлено: 14:32 03-08-2013 | Исправлено: s1yder, 14:36 03-08-2013
Michael99

Silver Member

Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Цитата:

при подаче питания неритмично хрустит

Проблема с БМГ винта (очень распространённая).

Цитата:

Что можно попытаться сделать, куда бежать, чтобы восстановить информацию по максимуму?

Только через замену БМГ. Это сложно и дорого.

———-
Восстановление информации. Ремонт HDD

Всего записей: 4711 | Зарегистр. 14-12-2005 | Отправлено: 14:53 03-08-2013
igor_me

Gold Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору s1yder
Если вторая плата действительно такая же (ревизия совпадает и т. п.), первое, что пробовать — перерпаять микруху ПЗУ с умершей платы на донорскую.
Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 15:33 03-08-2013
s1yder

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору igor_me
Вторая плата не совсем такая. На ней другая флешка, U2 на плате, стоит (на умершей — hynix, на доноре — winbond), да и на ПЗУ написано winbond, а на доноре просто цифры. Стоит пробовать перепаивать?
Всего записей: 11 | Зарегистр. 08-04-2011 | Отправлено: 16:41 03-08-2013
Vic422

Advanced Member

Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору s1yder
На плате вытравлено 2060-771824-000?
А на второй?
Всего записей: 945 | Зарегистр. 19-07-2006 | Отправлено: 16:53 03-08-2013 | Исправлено: Vic422, 16:53 03-08-2013
s1yder

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Vic422
На убитой плате Rev A 2060-771824-006
На второй всё тоже самое!
Всего записей: 11 | Зарегистр. 08-04-2011 | Отправлено: 17:01 03-08-2013
igor_me

Gold Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору s1yder

Цитата:

Маркировки обоих флешек напишите. Ну одну вижу по фото: Winbond 25W20.
Вторая?

Цитата:

Чего-то не понял, если там только цифры, как вы тогда определили, что
Цитата:

.

Добавлено:
Ааааа, вы подумали, что флешка — это U2? Неа, это U12 . Вам об этом Michael99 в теме по ремонту WD написал же. Не заглядывали туда?

Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 18:31 03-08-2013 | Исправлено: igor_me, 18:38 03-08-2013
s1yder

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору В общем сфоткал и пациента и доктора

Слева убитый, справа исправный.

Исправный:

Источник

Adblock
detector

Итак, суть этой печальной истории в том, что ВНЕЗАПНО мой жесткий диск начал издеваться надо мной, когда я хотел поставить LibreOffice. После того, как система дважды перемонтировала партицию в readonly, я начал подозревать неладное. Глянул dmesg, а там! Мать моя женщина!

Особо впечатлительным лучше не смотреть!

[  858.617479] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[  858.617489] ata1.00: irq_stat 0x40000008
[  858.617497] ata1.00: failed command: READ FPDMA QUEUED
[  858.617512] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[  858.617514]          res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[  858.617521] ata1.00: status: { DRDY ERR }
[  858.617526] ata1.00: error: { UNC }
[  858.621932] ata1.00: configured for UDMA/133
[  858.621952] ata1: EH complete
[  861.617427] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[  861.617438] ata1.00: irq_stat 0x40000008
[  861.617446] ata1.00: failed command: READ FPDMA QUEUED
[  861.617461] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[  861.617464]          res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[  861.617471] ata1.00: status: { DRDY ERR }
[  861.617476] ata1.00: error: { UNC }
[  861.621883] ata1.00: configured for UDMA/133
[  861.621902] ata1: EH complete
[  864.276812] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[  864.276819] ata1.00: irq_stat 0x40000008
[  864.276826] ata1.00: failed command: READ FPDMA QUEUED
[  864.276840] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[  864.276843]          res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[  864.276849] ata1.00: status: { DRDY ERR }
[  864.276854] ata1.00: error: { UNC }
[  864.280789] ata1.00: configured for UDMA/133
[  864.280801] ata1: EH complete
[  866.967174] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[  866.967185] ata1.00: irq_stat 0x40000008
[  866.967193] ata1.00: failed command: READ FPDMA QUEUED
[  866.967208] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[  866.967211]          res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[  866.967217] ata1.00: status: { DRDY ERR }
[  866.967222] ata1.00: error: { UNC }
[  866.971168] ata1.00: configured for UDMA/133
[  866.971186] ata1: EH complete
[  870.317106] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[  870.317116] ata1.00: irq_stat 0x40000008
[  870.317124] ata1.00: failed command: READ FPDMA QUEUED
[  870.317139] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[  870.317142]          res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[  870.317149] ata1.00: status: { DRDY ERR }
[  870.317154] ata1.00: error: { UNC }
[  870.320871] ata1.00: configured for UDMA/133
[  870.320889] ata1: EH complete
[  873.325328] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[  873.325337] ata1.00: irq_stat 0x40000008
[  873.325346] ata1.00: failed command: READ FPDMA QUEUED
[  873.325361] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[  873.325364]          res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[  873.325371] ata1.00: status: { DRDY ERR }
[  873.325376] ata1.00: error: { UNC }
[  873.328743] ata1.00: configured for UDMA/133
[  873.328799] sd 0:0:0:0: [sda] Unhandled sense code
[  873.328805] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[  873.328814] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
[  873.328825] Descriptor sense data with sense descriptors (in hex):
[  873.328831]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[  873.328851]         2a 78 e9 89
[  873.328860] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
[  873.328872] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 2a 78 e9 30 00 02 00 00
[  873.328891] end_request: I/O error, dev sda, sector 712567177
[  873.328901] Buffer I/O error on device sda, logical block 89070897
[  873.328909] Buffer I/O error on device sda, logical block 89070898
[  873.328917] Buffer I/O error on device sda, logical block 89070899
[  873.328924] Buffer I/O error on device sda, logical block 89070900
[  873.328932] Buffer I/O error on device sda, logical block 89070901
[  873.328940] Buffer I/O error on device sda, logical block 89070902
[  873.328947] Buffer I/O error on device sda, logical block 89070903
[  873.328955] Buffer I/O error on device sda, logical block 89070904
[  873.328963] Buffer I/O error on device sda, logical block 89070905
[  873.328970] Buffer I/O error on device sda, logical block 89070906
[  873.329075] ata1: EH complete

Ну общую суть вы, думаю поняли — покупай новый жесткий диск@копируй разделы со старого.
Но! Проблема еще была в том, что некоторые разделы УЖЕ не монтировались, по причине

смерти

коррупции файловой системы. /me подумал-подумал и решил, а не попробовать ли как-то это дело замять, тем более, новый жесткий пока не входит в планы первоочерёдных покупок.
Гуугле мне подсказал парочку хороших решений, чем я незамедлительно и воспользовался.

Bad block HOWTO for smartmontools

Удивительная статья, которая мне очень сильно помогла. Для тех, кто не в ладах с языком международного общения, могу адаптировать статью, хотите — отпишитесь в комментариях.
Итак, разбор полётов, или что я сделал.
К счастью, у меня завалялась таблица разделов диска, сделанная fdisk -ul На самом деле, у меня было 10 разделов, но те три, которых здесь нет не были столь важны, как sda3+sda4(Зарезервированы под FreeBSDDragonFlyBSD, sda1(загрузочный же, ёпта!) sda7+sda5(линуксовые разделы), ну и sda6(онимэ, музыка, прочий хлам)
Первым делом, был проведён тест, на то, какие партиции умерли, а какие еще живы. К моей радости, sda1 и sda6 остались живы, но о них попозже. все остальные монтироваться НЕ ЖЕЛАЛИ, а fsck завершался с ошибкой.
я запустил smartctl -t long /dev/sda и ушел на два часа. Через пару часов, возвратившись, я увидел сию картину smartctl -l selftest /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%      8962         712567177
# 2  Short offline       Completed without error       00%      5188         -
# 3  Extended offline    Aborted by host               90%      5188         -


Как видите, первая ошибка проявилась в блоке 712567177
Запускаем badblocks: badblocks -s -v -b 512 /dev/sda  712567277 712567077#-s показывает прогресс, -v увеличивает информативность, -b 512 - указывается размер блока, в данном случае - 512 байт, дальше указываем КОНЕЧНЫЙ и потом уже НАЧАЛЬНЫЙ блок, которые я выбрал из окружения в +-100 блоков к ошибочному.
И правда, выскакивают номера бэдблоков. Провел щадящий read-write тест (опция -n) — бэдблоки тоже продолжают появдяться. Далее я сделал то, что НЕ РЕКОММЕНДУЮ делать другим без полного понимания того, ЧТО они делают. badblocks -s -w -v -b 512 /dev/sda  712567277 712567077#-w - write-mode, заполнение определенными паттернами, МОЖЕТ ПОВРЕДИТЬ ДАННЫЕ. Что удивительно, после этого бэдблоки исчезли. Проведя еще несколько тестов smartctl, теперь уже с опцией -t short, я вычислил остальные бэдблоки и провел аналогичные операции. Теперь
smartctl -l selftest -d ata /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      8972         -
# 2  Extended offline    Completed: read failure       90%      8962         712567177
# 3  Short offline       Completed without error       00%      5188         -
# 4  Extended offline    Aborted by host               90%      5188         -


Как видим, ошибок больше нет, но раз уже они появились — жди новых//уже откладываю деньги на новый хард.

Теперь о минусах такого способа. После всех манипуляций, fdisk -ul /dev/sda показал мне ПОЛНОСТЬЮ голый диск. Запускаем testdisk, находим разделы. К сожалению, sda6 не был найден. Ну ладно, мы не боимся этого. fdisk -u /dev/sda, дальше жмём n/*новый раздел*/ дальше вводим какой тип раздела, logical или primary, потом вводим начало и конец сектора/*ну недаром же у меня была таблица разделов?*/, записываем таблицу разделов — w и выходим из fdisk -q.
пишем partprobe, чтобы ядро узнало о новом разделе, вуаля — раздел появился и он полностью жив.
Итак, любые вопросы, предложения и замечания буду рад прочитать в комментариях.

  • Печать

Страницы: [1] 2  Все   Вниз

Тема: Жесткий диск Кирдык?  (Прочитано 3150 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн
Nesmit

/var/log# tail kern.log
May 26 15:30:28 mal-inet kernel: [65174.780425] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:28 mal-inet kernel: [65174.780465] ata1.01: BMDMA stat 0x44
May 26 15:30:28 mal-inet kernel: [65174.780493] ata1.01: cmd c8/00:08:df:f2:3d/00:00:00:00:00/f3 tag 0 dma 4096 in
May 26 15:30:28 mal-inet kernel: [65174.780495]          res 51/40:00:e6:f2:3d/00:00:00:00:00/f3 Emask 0x9 (media error)
May 26 15:30:28 mal-inet kernel: [65174.780538] ata1.01: status: { DRDY ERR }
May 26 15:30:28 mal-inet kernel: [65174.780562] ata1.01: error: { UNC }
May 26 15:30:28 mal-inet kernel: [65174.840200] ata1.01: configured for UDMA/133
May 26 15:30:28 mal-inet kernel: [65174.840217] ata1: EH complete
May 26 15:30:29 mal-inet kernel: [65176.159991] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:29 mal-inet kernel: [65176.160031] ata1.01: BMDMA stat 0x44


Оффлайн
ArcFi

Я так понимаю, про

sudo fdisk -lспрашивать бессмысленно.


Оффлайн
Nesmit

Disk /dev/sda: 81.9 GB, 81964302336 bytes
255 heads, 63 sectors/track, 9964 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x0cd60cd5

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1        9872    79296808+  83  Linux
/dev/sda2            9873        9964      738990    5  Extended
/dev/sda5            9873        9964      738958+  82  Linux swap / Solaris


Оффлайн
Protopopulus

Диск живой. Вот только размер настораживает…

Если ты владеешь знаниями, то и знания владеют тобой. (с) Protopopulus


Оффлайн
Nesmit

как заставить исправить и все это удаленно через ssh?


Оффлайн
ArcFi

/dev/sda — это он (ata1.01)?
Если да, то бэкап данных и прогон тестов с live-cd/usb.

ps
Просто у меня, например, /dev/sda на ata1.00.


Оффлайн
Nesmit

Без проблем, но комп стоит в 150км от меня на шкафу и дома никого нет. :(


Пользователь решил продолжить мысль 26 Мая 2009, 17:15:36:


Ubuntu же проверяет жесткий автоматически, после скольких перезагузок.

« Последнее редактирование: 26 Мая 2009, 17:15:36 от Nesmit »


Оффлайн
-sanches-

/var/log# tail kern.log
May 26 15:30:28 mal-inet kernel: [65174.780425] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:28 mal-inet kernel: [65174.780465] ata1.01: BMDMA stat 0x44
May 26 15:30:28 mal-inet kernel: [65174.780493] ata1.01: cmd c8/00:08:df:f2:3d/00:00:00:00:00/f3 tag 0 dma 4096 in
May 26 15:30:28 mal-inet kernel: [65174.780495]          res 51/40:00:e6:f2:3d/00:00:00:00:00/f3 Emask 0x9 (media error)
May 26 15:30:28 mal-inet kernel: [65174.780538] ata1.01: status: { DRDY ERR }
May 26 15:30:28 mal-inet kernel: [65174.780562] ata1.01: error: { UNC }
May 26 15:30:28 mal-inet kernel: [65174.840200] ata1.01: configured for UDMA/133
May 26 15:30:28 mal-inet kernel: [65174.840217] ata1: EH complete
May 26 15:30:29 mal-inet kernel: [65176.159991] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:29 mal-inet kernel: [65176.160031] ata1.01: BMDMA stat 0x44

Нет, это какой-то косяк со связкой старый sata диск + драйвер котроллера либо шлейф. У меня такое часто проявлялось на 3 винтах сата: 80гб, 250гб (самсунг), 250 гб (wd).  Одну проблему удалось вылечить заменой шлейфа, второй диск пока на полке лежит, 3й на внешнем контроллере пока работает под debian 5. Вобщем, это довольно мутная ситуация.


Оффлайн
Nesmit

это случилось после падения напряжения.
а теперь восстанавливаю систему :(


Оффлайн
-sanches-

а теперь восстанавливаю систему :(

Ага, сам тоже проделывал такое.


Оффлайн
Nesmit

Я в легком шоке от того так быстро упал раздел. А восстановление, нереальное шаманство.
Но, винт лежит на столе, как руки дойдут начну получать опыт восстановления данных .)


Оффлайн
Frank

не мешало бы sudo smartctl -A /dev/sda


Оффлайн
Dreammaker

exception Emask
по этой ошибке на форуме топик в несколько страниц есть, правда, кажись ни к чему так и не пришли.


Оффлайн
Nesmit

Вообщем поставил новый винт, залил линь все супер. Шлейф остался старый.
Вспомнилось, что комп как то странно работал. ssh  постоянно рвал. А squid работал как то с паузами.
Вывод, скорее всего контроллер. А тут врят ли что поможет.
Данные всетаки попробую восстановить, хотя уже ценности не представляют.


Оффлайн
zilog82

 ata1.01: status: { DRDY ERR }
 ata1.01: error: { UNC }

DRive_reaDY ERRor — ошибка готовности винта. Возникает вследствие капризности AHCI или эмуляции IDE, чаще всего из-за ошибки доступа к данным не только поверхности, но и смарта и служебки. Если смена винта помогла, старый можно попробовать оживить помучавшись со смартом и/или поверхностью.В другом случае стоит пересмотреть настройки биоса/рэйда (на самом деле это надо сделать в первую очередь).  Сам не раз сталкивался, шаманство в этом направлении обычно помогает.

UNC — ошибка регистра контроллера ata (отсутствие данных или ошибочные данные) . Возникает из-за всякой бяки, в том числе DRDY ERR.


  • Печать

Страницы: [1] 2  Все   Вверх


0

0

Сейчас при сильной нагрузке (linuxdcpp сканил кучу файлов, при этом я тоже чем-то занимался) начались странности )

далее комп завис, перезагрузился, в логе обнаружил записи вида:

Device: /dev/sda, is SMART capable. Adding to «monitor» list.

Monitoring 1 ATA and 0 SCSI devices

Device: /dev/sda, 1 Currently unreadable (pending) sectors

далее опять запустил linuxdcpp и в логе от kernel:

ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0

ata1.01: BMDMA stat 0x65

ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in

res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)

ata1.01: configured for UDMA/100

ata1: EH complete

ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0

ata1.01: BMDMA stat 0x65

ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in

res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)

ata1.01: configured for UDMA/100

ata1: EH complete

думал проверить читаемость всех файлов из каталога и ниже, который подсовываю — как это сделать?

Чтото-типа cp ./dir -Recurce /dev/null

ос сусе103

винт wd320гб, куплен ~полгода назад, не носил, не кидал

В последнее время с компьютером появилась проблема: после непродолжительной работы начала слетать файловая система (ext4).Несколько раз ее восстанавливал при помощи fsck, потом на диске обнаружились bad-блоки и я его поменял по гарантии. На новый диск поставил тут же систему (fedora 12 i386), посмотрел кино и обнаружил после этого жуткие глюки: не запускались ни nautilus, ни chromium. Я перезагрузил компьютер, после чего вместо загружающейся системы увидел повторяющиеся подряд раз 50 сообщения об ошибке:

Код: Выделить всё

 ata3.00: exception Emask 0x0 S Act 0xo SErr 0x0 action 0x0
          ata3.00: BDMA stat 0x24
          ata3.00: failed command: READ DMA EXT
          ata3.00: cmd 25/00:00:97:c7:79/00:01:17:00:00/e0 tag 0 dma 131072 in
                       res 51/40:00:7e:c8:79/40:00:17:00:00/e0 Emask 0x9 (media error)
          ata3.00: status: { DRDY ERR }
          ata3.00: error: { UNC }
          ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
          ata3.00: BDMA stat 0x24
          ata3.00: failed command: READ DMA EXT
          ata3.00: md 25/00:00:97:c7:79/00:01:17:00:00/e0 tag 0 dma 131072 in
                       res 51/40:00:7e:c8:79/40:00:17:00:00/e0 Emask 0x9 (media error)
end_request: I/O error, /dev/sda, sector 393857150
JBD: failed to read block at ofset 27911
EXT4-fs (sda3): error loading journal
mount: wrong fs type, bad option, bad superblock on /dev/sda3,
                     missing codepage or helper program, or other error
                     In some cases useful info is found in syslog - try
                     dmesg | tail or so

и все заканчивается следующим сообщением:

Код: Выделить всё

 mount: wrong fs type, bad option, bad superblock on /dev/sda3,
                     missing codepage or helper program, or other error
                     In some cases useful info is found in syslog - try
                     dmesg | tail or so

Can't mount root filesystem
[drm:drm_mode_rmfb] *ERROR* tried to remove a fb that we didn't own

Boot has failed, sleeping forewer.

Конфигурация компьютера: Pentium Dual-core 2.00Ghz, видеокарта интегрированная, 2 винчетера: 250 и 500 Гб (система на 250-м), оба WD, блок питания 400W.

Кроме того, обнаружил непонятную мне пока вещь: в биосе в разделе hardware monitoring напряжение на V12.0 он показывает только 11.07V.

А теперь вопросы:
1. Что это такое происходит и по какой причине (дохнет блок питания, бракованный винчестер или что-то другое)?
2. Как спасти ситуацию?

Desktop: PentiumD 2.0Ghz, 2GbRAM, video — intel, Fedora 14 x86_64, Gnome
Laptop 1: Toshiba Satellite M100, WinXP HE SP3
Laptop2: IBM Thinkpad R30, Debian 4.0 etch, Gnome
и целый зоопарк в VirtualBox…

hi,

could you post the outputs from:
* df
* mount

when did this start happening? did you do anything before?

you should also check journalctl and /var/log/syslog, there might be hints there pointing to the root cause of the issue

outputs from: df, mount

root@proxmox:~# df
Filesystem 1K-blocks Used Available Use% Mounted on
udev 16357924 0 16357924 0% /dev
tmpfs 3277196 329076 2948120 11% /run
/dev/mapper/pve-root 98559220 72662212 20847460 78% /
tmpfs 16385964 21840 16364124 1% /dev/shm
tmpfs 5120 0 5120 0% /run/lock
tmpfs 16385964 0 16385964 0% /sys/fs/cgroup
/dev/sdb2 523248 312 522936 1% /boot/efi
/dev/fuse 30720 20 30700 1% /etc/pve
tmpfs 3277192 0 3277192 0% /run/user/0

root@proxmox:~# mount
sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime)
proc on /proc type proc (rw,relatime)
udev on /dev type devtmpfs (rw,nosuid,relatime,size=16357924k,nr_inodes=4089481,mode=755)
devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
tmpfs on /run type tmpfs (rw,nosuid,noexec,relatime,size=3277196k,mode=755)
/dev/mapper/pve-root on / type ext4 (ro,relatime,errors=remount-ro)
securityfs on /sys/kernel/security type securityfs (rw,nosuid,nodev,noexec,relatime)
tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev)
tmpfs on /run/lock type tmpfs (rw,nosuid,nodev,noexec,relatime,size=5120k)
tmpfs on /sys/fs/cgroup type tmpfs (ro,nosuid,nodev,noexec,mode=755)
cgroup2 on /sys/fs/cgroup/unified type cgroup2 (rw,nosuid,nodev,noexec,relatime)
cgroup on /sys/fs/cgroup/systemd type cgroup (rw,nosuid,nodev,noexec,relatime,xattr,name=systemd)
pstore on /sys/fs/pstore type pstore (rw,nosuid,nodev,noexec,relatime)
efivarfs on /sys/firmware/efi/efivars type efivarfs (rw,nosuid,nodev,noexec,relatime)
none on /sys/fs/bpf type bpf (rw,nosuid,nodev,noexec,relatime,mode=700)
cgroup on /sys/fs/cgroup/cpu,cpuacct type cgroup (rw,nosuid,nodev,noexec,relatime,cpu,cpuacct)
cgroup on /sys/fs/cgroup/perf_event type cgroup (rw,nosuid,nodev,noexec,relatime,perf_event)
cgroup on /sys/fs/cgroup/hugetlb type cgroup (rw,nosuid,nodev,noexec,relatime,hugetlb)
cgroup on /sys/fs/cgroup/rdma type cgroup (rw,nosuid,nodev,noexec,relatime,rdma)
cgroup on /sys/fs/cgroup/blkio type cgroup (rw,nosuid,nodev,noexec,relatime,blkio)
cgroup on /sys/fs/cgroup/cpuset type cgroup (rw,nosuid,nodev,noexec,relatime,cpuset)
cgroup on /sys/fs/cgroup/devices type cgroup (rw,nosuid,nodev,noexec,relatime,devices)
cgroup on /sys/fs/cgroup/pids type cgroup (rw,nosuid,nodev,noexec,relatime,pids)
cgroup on /sys/fs/cgroup/memory type cgroup (rw,nosuid,nodev,noexec,relatime,memory)
cgroup on /sys/fs/cgroup/net_cls,net_prio type cgroup (rw,nosuid,nodev,noexec,relatime,net_cls,net_prio)
cgroup on /sys/fs/cgroup/freezer type cgroup (rw,nosuid,nodev,noexec,relatime,freezer)
systemd-1 on /proc/sys/fs/binfmt_misc type autofs (rw,relatime,fd=25,pgrp=1,timeout=0,minproto=5,maxproto=5,direct,pipe_ino=22009)
hugetlbfs on /dev/hugepages type hugetlbfs (rw,relatime,pagesize=2M)
debugfs on /sys/kernel/debug type debugfs (rw,relatime)
mqueue on /dev/mqueue type mqueue (rw,relatime)
sunrpc on /run/rpc_pipefs type rpc_pipefs (rw,relatime)
fusectl on /sys/fs/fuse/connections type fusectl (rw,relatime)
configfs on /sys/kernel/config type configfs (rw,relatime)
/dev/sdb2 on /boot/efi type vfat (rw,relatime,fmask=0022,dmask=0022,codepage=437,iocharset=iso8859-1,shortname=mixed,errors=remount-ro)
lxcfs on /var/lib/lxcfs type fuse.lxcfs (rw,nosuid,nodev,relatime,user_id=0,group_id=0,allow_other)
/dev/fuse on /etc/pve type fuse (rw,nosuid,nodev,relatime,user_id=0,group_id=0,default_permissions,allow_other)
tmpfs on /run/user/0 type tmpfs (rw,nosuid,nodev,relatime,size=3277192k,mode=700)

Проблема с запуском CentOS 5.11

4
Посты

4
Пользователи

0
Likes

6,857
Просмотры

Iskandar

(@iskandar)

New Member

Присоединился: 6 лет назад

Доброе времени суток.

Возникла проблема и никак не могу найти решение. Сервер не запускается и выдает такую ошибку:

ata1.01: status: { DRDY ERR }

ata1.01: error: { UNC } 

ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0

ata1.01: BMDMA stat 0x64

ata1.01: cmd 25/00:08:d5:d0:57/00:00:58:00:00/f0 tag 0 dma 4096 in

               res 51/40:08:d9:d0:57/40:00:58:00:00/10 Emask 0x9 (media error)

Как решить данную проблему? и что это за ошибка?

Заранее спасибо.

fix

(@fix)

Eminent Member

Присоединился: 6 лет назад

Сталкивались с чем-то подобным на предыдущей работе, не помню как решилось, нужно спросить товарища.

utter

(@utter)

Eminent Member

Присоединился: 5 лет назад

Zerox

(@zerox)

Prominent Member

Присоединился: 9 лет назад

Тут ошибка с диском налицо. Правда не понятно, как это сервер не запускается, если это ошибка из системного лога. Он как минимум запустился.

Я использую Xubuntu на MacBook Pro с Fluxbox в качестве моего оконного менеджера. Вчера, когда я попытался запустить Firefox, я получил ошибку шины, и приложение не запустилось. Я исправил проблему, удалив и переустановив firefox. Сегодня та же проблема происходит с Emacs. Я не пробовал удалять и переустанавливать emacs, поэтому я не уверен, что это сработает, но поскольку проблема возникла более чем в одном приложении, я предполагаю, что это указывает на более серьезную проблему. Я провел некоторое исследование ошибок шины, но не ясно, почему эта проблема проявляется в разных приложениях таким образом.

После неудачного запуска dmesg сообщает об этом, что выглядит актуально:

[10227.675775] ata3.01: BMDMA stat 0x5
[10227.675782] ata3.01: failed command: READ DMA
[10227.675796] ata3.01: cmd c8/00:08:f8:2e:9f/00:00:00:00:00/fa tag 0 dma 4096 in
[10227.675799]          res 51/40:00:fc:2e:9f/00:00:00:00:00/fa Emask 0x9 (media error)
[10227.675806] ata3.01: status: { DRDY ERR }
[10227.675811] ata3.01: error: { UNC }
[10227.712803] ata3.01: configured for UDMA/133
[10227.712830] ata3: EH complete
[10230.070892] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[10230.070901] ata3.01: BMDMA stat 0x5
[10230.070908] ata3.01: failed command: READ DMA
[10230.070922] ata3.01: cmd c8/00:08:f8:2e:9f/00:00:00:00:00/fa tag 0 dma 4096 in
[10230.070925]          res 51/40:00:fc:2e:9f/00:00:00:00:00/fa Emask 0x9 (media error)
[10230.070932] ata3.01: status: { DRDY ERR }
[10230.070937] ata3.01: error: { UNC }
[10230.092783] ata3.01: configured for UDMA/133
[10230.092809] ata3: EH complete
[10232.466015] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[10232.466025] ata3.01: BMDMA stat 0x5
[10232.466032] ata3.01: failed command: READ DMA
[10232.466046] ata3.01: cmd c8/00:08:f8:2e:9f/00:00:00:00:00/fa tag 0 dma 4096 in
[10232.466049]          res 51/40:00:fc:2e:9f/00:00:00:00:00/fa Emask 0x9 (media error)
[10232.466056] ata3.01: status: { DRDY ERR }  
[10232.466061] ata3.01: error: { UNC }
[10232.488693] ata3.01: configured for UDMA/133
[10232.488721] sd 2:0:1:0: [sda] Unhandled sense code
[10232.488726] sd 2:0:1:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[10232.488734] sd 2:0:1:0: [sda] Sense Key : Medium Error [current] [descriptor]
[10232.488745] Descriptor sense data with sense descriptors (in hex):
[10232.488750]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
[10232.488773]         0a 9f 2e fc 
[10232.488783] sd 2:0:1:0: [sda] Add. Sense: Unrecovered read error - auto reallocate  failed
[10232.488794] sd 2:0:1:0: [sda] CDB: Read(10): 28 00 0a 9f 2e f8 00 00 08 00
[10232.488815] end_request: I/O error, dev sda, sector 178204412
[10232.488852] ata3: EH complete

Любые предложения относительно того, что может быть в корне проблемы?

I have one server with WDC WD3202ABYS … There are 100 virtual hosts. Server is working about 5 years and in this time period I have change 4 disks. All with same reason: sata error. The last one:

ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x5
ata2.00: cmd 35/00:60:57:7b:b6/00:01:06:00:00/e0 tag 0 dma 180224 out
         res 51/10:60:57:7b:b6/10:01:06:00:00/e0 Emask 0x81 (invalid argument)
ata2.00: status: { DRDY ERR }
ata2.00: error: { IDNF }
ata2.00: configured for UDMA/133
sd 1:0:0:0: SCSI error: return code = 0x08000002
sdb: Current [descriptor]: sense key: Aborted Command
    Add. Sense: Recorded entity not found

Descriptor sense data with sense descriptors (in hex):
        72 0b 14 00 00 00 00 0c 00 0a 80 00 00 00 00 00 
        06 b6 7b 57 
end_request: I/O error, dev sdb, sector 112622423
Buffer I/O error on device dm-8, logical block 14077747
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077748
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077749
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077750
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077751
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077756
lost page write due to I/O error on dm-8
ata2: EH complete
SCSI device sdb: 625142448 512-byte hdwr sectors (320073 MB)
sdb: Write Protect is off
sdb: Mode Sense: 00 3a 00 00
SCSI device sdb: drive cache: write back
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x5
ata2.00: cmd 35/00:90:17:30:b7/00:02:08:00:00/e0 tag 0 dma 335872 out
         res 51/10:90:17:30:b7/10:02:08:00:00/e0 Emask 0x81 (invalid argument)
ata2.00: status: { DRDY ERR }
ata2.00: error: { IDNF }
ata2.00: configured for UDMA/133
sd 1:0:0:0: SCSI error: return code = 0x08000002
sdb: Current [descriptor]: sense key: Aborted Command
    Add. Sense: Recorded entity not found

Descriptor sense data with sense descriptors (in hex):
        72 0b 14 00 00 00 00 0c 00 0a 80 00 00 00 00 00 
        08 b7 30 17 
end_request: I/O error, dev sdb, sector 146223127
printk: 34 messages suppressed.
Buffer I/O error on device dm-8, logical block 18277835

Looks like some software error…

but in short time after that (maybe when I started fsck) following error:

EXT3-fs error (device dm-8): ext3_put_super: Couldn't clean up the journal
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/01:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x1 (device error)
ata2.00: status: { DRDY ERR }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)

Is it possible that this errors are also «software» … I mean this HDD is only 9000 hours old … where are no extra load on HDD… temperature is 29 Celsius… Do I need to replace hdd? or check disk is enough?

EXT3-fs error (device dm-8): ext3_put_super: Couldn't clean up the journal
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/01:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x1 (device error)
ata2.00: status: { DRDY ERR }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
         res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)

How to find out reason?


Here are errors from smart:

Error 36 occurred at disk power-on lifetime: 9160 hours (381 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 22 09 80 e3  Error: UNC at LBA = 0x03800922 = 58722594

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 1f 09 80 03 0a  47d+13:38:13.534  READ DMA
  ec 00 00 00 00 00 00 0a  47d+13:38:13.530  IDENTIFY DEVICE
  ef 03 46 00 00 00 00 0a  47d+13:38:13.528  SET FEATURES [Set transfer mode]

Ok. Is it possible the following scenario:
1. Disk was on 9000 without fsck.
2. There are some errors
3. In dmesg there started errors like:

ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x5
ata2.00: cmd 35/00:60:57:7b:b6/00:01:06:00:00/e0 tag 0 dma 180224 out
         res 51/10:60:57:7b:b6/10:01:06:00:00/e0 Emask 0x81 (invalid argument)
ata2.00: status: { DRDY ERR }
ata2.00: error: { IDNF }
ata2.00: configured for UDMA/133
sd 1:0:0:0: SCSI error: return code = 0x08000002
sdb: Current [descriptor]: sense key: Aborted Command
    Add. Sense: Recorded entity not found
  1. And errors like inode error and so on…
  2. I tried to umount this parition, and error come from hdd like it cannot find such inode and so on… ?

If so.. I do not understand. Do I need to change disk every year? Just to prevent this error? Does some one have same problem? Not only with one disk…

Понравилась статья? Поделить с друзьями:

Читайте также:

  • Emask 0x409 media error
  • Emask 0x10 ata bus error
  • Email validation error
  • Email invalid geometry dash как исправить
  • Email format error

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии