Содержание
- винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Re: винт умирает?
- Emask 0x9 media error
винт умирает?
Сейчас при сильной нагрузке (linuxdcpp сканил кучу файлов, при этом я тоже чем-то занимался) начались странности )
далее комп завис, перезагрузился, в логе обнаружил записи вида:
Device: /dev/sda, is SMART capable. Adding to «monitor» list.
Monitoring 1 ATA and 0 SCSI devices
Device: /dev/sda, 1 Currently unreadable (pending) sectors
далее опять запустил linuxdcpp и в логе от kernel:
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x65
ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in
res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)
ata1.01: configured for UDMA/100
ata1: EH complete
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x65
ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in
res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)
ata1.01: configured for UDMA/100
ata1: EH complete
думал проверить читаемость всех файлов из каталога и ниже, который подсовываю — как это сделать?
Чтото-типа cp ./dir -Recurce /dev/null
ос сусе103
винт wd320гб, куплен
полгода назад, не носил, не кидал
Re: винт умирает?
в догонку: только сейчас вылезло в лог:
Nov 20 21:25:35 smartd[3941]: Device: /dev/sda, 1 Currently unreadable (pending) sectors
Nov 20 21:25:35 smartd[3941]: Device: /dev/sda, ATA error count increased from 0 to 24
Nov 20 21:25:35 smartd[3941]: Sending warning via /usr/lib/smartmontools/smart-notify to root@localhost .
Nov 20 21:25:35 smartd[3941]: Warning via /usr/lib/smartmontools/smart-notify to root@localhost produced unexpected output (53 bytes)
Nov 20 21:25:35 smartd[3941]: Warning via /usr/lib/smartmontools/smart-notify to root@localhost: successful
Re: винт умирает?
Последние WD, вообще-то, довольно неплохи были.. У самого такой же в качестве одного из внешних для домашнего использования.. никаких проблем..
Можно было бы попробовать ещё с libata поиграться.. Если не поможет, значит, всё-таки, проблемы с диском..
Re: винт умирает?
Прогони mhdd его. Только ман сначала почитай. Было аналогичное сообщение смарта недавно, логический бэд был на одном секторе. Симптомы — при чтении сектора щелкает головками и вешает систему нафиг. Вылечилось scan’ом с самой-нижней-функцией включенной, не помню как называется, Erase ЧЕГОТОТАМ.
Re: винт умирает?
smartctl —all /dev/sda что показывает?
Хотя, с винтами такое бывает 🙁
Re: винт умирает?
> Последние WD, вообще-то, довольно неплохи были..
Тихие и быстрые — да. А вот по поводу надежности, как раз сейчас пошла волна по форумам «сдох WD-*AAKS, купленный полгода -год назад».
Re: винт умирает?
> Вылечилось scan’ом с самой-нижней-функцией включенной, не помню как называется, Erase ЧЕГОТОТАМ.
Remap называется, советчик хренов 🙂
Re: винт умирает?
> Тихие и быстрые — да. А вот по поводу надежности, как раз сейчас пошла волна по форумам «сдох WD-*AAKS, купленный полгода -год назад».
Дык правильно, это ж вендузятнеги пишут. А какой вендузятнег будет заморачиваться обеспечением надлежащих условий для работы винтов? Вот и получается что в корпусе с температурой >50 от потоков раскалённого парой-тройкой «тридэускорителей» воздуха винты подыхают валом.
Re: винт умирает?
Не, нифига не ремап. С ремапом наоборот, доходил до этого сектора и вешался нафиг. ERASE WAITs оно называлось: http://onehalf.pisem.net/stat/mhdd.html
Re: винт умирает?
Вот пришел домой, включил, опять ошибки в логе:
smartd[3941]: Device: /dev/sda, ATA error count increased from 24 to 60
Небольшой вопрос — винт у меня IDE, почему он идет как sda?
Вывод smartctl —all /dev/sda:
smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar SE family
Device Model: WDC WD3200JB-00KFA0
Serial Number: WD-WCAMR3227228
Firmware Version: 08.05J08
User Capacity: 320 072 933 376 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Wed Nov 21 20:07:39 2007 MSK
SMART support is: Available — device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x84) Offline data collection activity
was suspended by an interrupting command from host.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (9600) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 116) minutes.
Conveyance self-test routine
recommended polling time: ( 6) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always — 0
3 Spin_Up_Time 0x0003 218 183 021 Pre-fail Always — 4075
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always — 609
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always — 0
7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always — 0
9 Power_On_Hours 0x0032 098 098 000 Old_age Always — 1770
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always — 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always — 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always — 596
194 Temperature_Celsius 0x0022 128 098 000 Old_age Always — 22
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always — 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always — 1
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always — 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline — 0
SMART Error Log Version: 1
ATA Error Count: 60 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It «wraps» after 49.710 days.
Re: винт умирает?
——————————————————————————- —————-
Error 60 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:20.635 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:20.630 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:20.625 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:20.615 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:20.615 READ NATIVE MAX ADDRESS EXT
Error 59 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:18.115 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:18.115 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:18.105 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:18.095 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:18.095 READ NATIVE MAX ADDRESS EXT
Error 58 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:16.070 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:16.070 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:16.060 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:16.055 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:16.055 READ NATIVE MAX ADDRESS EXT
Error 57 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:14.025 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:14.025 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:14.015 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:14.010 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:14.010 READ NATIVE MAX ADDRESS EXT
Error 56 occurred at disk power-on lifetime: 1769 hours (73 days + 17 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
— — — — — — —
40 51 01 5c 50 5a f0 Error: UNC 1 sectors at LBA = 0x005a505c = 5918812
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
— — — — — — — — —————- ———————
25 00 08 55 50 5a 11 59 01:41:11.995 READ DMA EXT
27 00 00 00 00 00 00 59 01:41:11.995 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 59 01:41:11.985 IDENTIFY DEVICE
ef 03 45 00 00 00 00 59 01:41:11.985 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 59 01:41:11.985 READ NATIVE MAX ADDRESS EXT
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Источник
Различные проблемы в уже поднятых темах:
проблемы с HDD (самопроизвольное отключение)
«Хрустит» HDD
Стук HDD
Обломилась ножка в разъёме HDD
HDD и шлейфы
Проги, помогающие в тестировании:
MHDD
В презентации не нуждается 
http://hddguru.com/content/ru/software/2005.10.02-MHDD/?lang=ru
Help
http://wiki.oszone.net/images/1/13/MHDD-_справка.rar
Всего записей: 4655 | Зарегистр. 04-06-2002 |
Отправлено:
12:15 23-08-2011 | Исправлено: Engaged Clown, 13:24 28-03-2013
| panda2019
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Приветствию всех и прошу о помощи и консультации. Поставил себе на старый нетбук дебиан(первой опыт общения с линуксом). в процессе настройки системы под себе столкнулся с проблемой что когда запускаю какой-либо поиск иногда при обращении к некоторым файлам система зависает. посмотрел что происходит в системе, а там повторяется [3016.414156] ata1.00: status [3016.41xxxx] ata1.00: error [3016.41xxxx] ata1.00: exception emask 0x0 Sact 0x0 SErr 0x0 action 0x0 [3016.41xxxx] ata1.00: BMDMA stat 0x5 [3016.41xxxx] ata1.00: failed command: READ DMA [3016.41xxxx] ata1.00: cmd c8/00:xx:xx:xx:xx:xx/00:00:00:00:00/e0 tag 0 dma 4096 in [3016.41xxxx] res 51/40:xx:xx:xx:xx:xx/00:00:00:00:00/e0 Emask (media error) [3016.41xxxx] end_request: I/0 error, dev sda sector 6925008 меняются только числа в квадратных скобках. проблема с хардом, вотолько вопрос в чем именно. я так понял проблема чтения из конкретных секторов? то есть они битые? если возможность что ошибка в чем то другом? если проблема в секторах, есть ли возможность проверить какие именно сектора битые и сделать так что бы к ним не обращалась система? Добавлено: |
| Всего записей: 8 | Зарегистр. 24-05-2008 | Отправлено: 16:58 26-07-2013 |
| igor_me
Gold Member |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Цитата: Да, похоже есть бэды на диске. Модель диска и скрриншот SMART покажите хотя бы Цитата: есть ли возможность проверить какие именно сектора битые Цитата: end_request: I/0 error, dev sda sector 6925008 А вообще — если есть бэды — их надо заремапить. Если винту есть куда ремапить |
| Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 20:01 26-07-2013 |
| panda2019
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Код: Jul 26 21:00:36 debian kernel: [ 1474.205280] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Цитата: Модель диска и скрриншот SMART покажите ata hitachi hts543212l9a300 |
| Всего записей: 8 | Зарегистр. 24-05-2008 | Отправлено: 22:24 26-07-2013 |
| Lonely_Knight
Full Member |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Ребята, я всё пытаюсь найти сгоревший стабилитрон на 5 Вольт. Прозвонкой ставил один щуп на 5вольтовый контакт питания, вторым прозванивал все крупные элементы, на всех пищит (то есть замыкание), кроме вот этих двух: Причём именно верхние их контакты не пищат. Может быть один из них стабилитроном? (стрелками пометил 1 и 2). Не могу в интернете ничего найти на тему поиска сгоревших стабилитронов с помощью тестера, может я как-то неправильно ищу. Подскажите кто знает, только на вас надежда! Спасибо. ———- |
| Всего записей: 508 | Зарегистр. 26-10-2006 | Отправлено: 12:27 28-07-2013 |
| igor_me
Gold Member |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Тут какое дело: тяжеловато нам помоч вам, когда плата у вас в руках. Для начала неплохо бы её открутить от банки. Далее: Цитата: Может быть один из них стабилитроном? НЕТ, это конденсаторы, маркировка Сххх. ЗЫ tomset, не только «с Мишаней ходите парой» |
| Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 15:21 28-07-2013 | Исправлено: igor_me, 15:29 28-07-2013 |
| tomset
BANNED |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Lonely_Knight На этой модификации Calypco нет Защитных Диодов (а не стабилитронов!) Транзистор Q501 проверте. Если и после его отпайки КЗ останется, то там все вынесло. Проще всю плату будет поменять. И главное, коммутатор в гермоблоке по +5V и -5V прозвоните, инача и новая плата сгорит. |
| Всего записей: 6906 | Зарегистр. 02-12-2002 | Отправлено: 15:22 28-07-2013 | Исправлено: tomset, 15:27 28-07-2013 |
| panda2019
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Цитата: скрриншот SMART покажите хотя бы smartctl 5.43 2012-06-30 r3573 [i686-linux-3.8.2] (local build) === START OF INFORMATION SECTION === === START OF READ SMART DATA SECTION === General SMART Values: SMART Attributes Data Structure revision number: 16 SMART Error Log Version: 1 Error 559 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours) After command completion occurred, registers were: Commands leading to the command that caused the error were: Error 558 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours) After command completion occurred, registers were: Commands leading to the command that caused the error were: Error 557 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours) After command completion occurred, registers were: Commands leading to the command that caused the error were: Error 556 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours) After command completion occurred, registers were: Commands leading to the command that caused the error were: Error 555 occurred at disk power-on lifetime: 3500 hours (145 days + 20 hours) After command completion occurred, registers were: Commands leading to the command that caused the error were: SMART Self-test log structure revision number 1 SMART Selective self-test log data structure revision number 1 Вот полнй отчет |
| Всего записей: 8 | Зарегистр. 24-05-2008 | Отправлено: 17:53 29-07-2013 |
| ToppeaDop
Full Member |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Здравствуйте! В один не прекрасный день перестал работать внешний диск Transcend, по факту — Seagate Momentus 5400.6 (500 GB) с SATA-разъемом. WWN: 5000C50022D3B204, Date: 10453. Не определяется ни через USB-мосты, ни при подключении к SATA-выводам компьютера. при подаче питания неритмично хрустит, как будто идет многочисленное чтение чего-то с разных мест диска в хаотичном порядке. Как это обычно бывает, на диске — фотографии, документы, которые просто так из инета не найдешь, не скачаешь. Семейный архив, все такое, общий объем важного, по прикидкам — гигов 200-250. Что можно попытаться сделать, куда бежать, чтобы восстановить информацию по максимуму? Может, посоветуете хороших хдд-ведов в СПб, которым можно доверить диск на восстановление инфы, чтобы сработали на совесть, а не испортили то, что еще не испортилось само? |
| Всего записей: 453 | Зарегистр. 24-08-2003 | Отправлено: 16:05 30-07-2013 |
| s1yder
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Помогите разобраться, пожалуйста. Есть пациент WD Blue WD10EZEX. Симптомы: не определяется, не крутится. Цель — вытащить инфу. Вышел из строя видимо из-за замыкания. Есть еще один такой же хард, пробовали перекинуть плату, хард закрутился но тут же останавливается и так повторяется. Куда копать и что делать. Но фото пометил зону, где наблюдается повышенный нагрев, прям раскаляется. Вроде как это квадратный чип WDHC. и белая деталь где написано SK1
|
| Всего записей: 11 | Зарегистр. 08-04-2011 | Отправлено: 14:32 03-08-2013 | Исправлено: s1yder, 14:36 03-08-2013 |
| Michael99
Silver Member |
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору Цитата: при подаче питания неритмично хрустит Проблема с БМГ винта (очень распространённая). Цитата: Что можно попытаться сделать, куда бежать, чтобы восстановить информацию по максимуму? Только через замену БМГ. Это сложно и дорого. ———- |
| Всего записей: 4711 | Зарегистр. 14-12-2005 | Отправлено: 14:53 03-08-2013 |
| igor_me
Gold Member |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору s1yder Если вторая плата действительно такая же (ревизия совпадает и т. п.), первое, что пробовать — перерпаять микруху ПЗУ с умершей платы на донорскую. |
| Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 15:33 03-08-2013 |
| s1yder
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору igor_me Вторая плата не совсем такая. На ней другая флешка, U2 на плате, стоит (на умершей — hynix, на доноре — winbond), да и на ПЗУ написано winbond, а на доноре просто цифры. Стоит пробовать перепаивать? |
| Всего записей: 11 | Зарегистр. 08-04-2011 | Отправлено: 16:41 03-08-2013 |
| Vic422
Advanced Member |
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору s1yder На плате вытравлено 2060-771824-000? А на второй? |
| Всего записей: 945 | Зарегистр. 19-07-2006 | Отправлено: 16:53 03-08-2013 | Исправлено: Vic422, 16:53 03-08-2013 |
| s1yder
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Vic422 На убитой плате Rev A 2060-771824-006 На второй всё тоже самое! |
| Всего записей: 11 | Зарегистр. 08-04-2011 | Отправлено: 17:01 03-08-2013 |
| igor_me
Gold Member |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору s1yder
Цитата: Маркировки обоих флешек напишите. Ну одну вижу по фото: Winbond 25W20. Цитата: Чего-то не понял, если там только цифры, как вы тогда определили, что . Добавлено: |
| Всего записей: 5716 | Зарегистр. 27-12-2011 | Отправлено: 18:31 03-08-2013 | Исправлено: igor_me, 18:38 03-08-2013 |
| s1yder
Newbie |
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору В общем сфоткал и пациента и доктора
Слева убитый, справа исправный. Исправный: Источник Adblock |
Итак, суть этой печальной истории в том, что ВНЕЗАПНО мой жесткий диск начал издеваться надо мной, когда я хотел поставить LibreOffice. После того, как система дважды перемонтировала партицию в readonly, я начал подозревать неладное. Глянул dmesg, а там! Мать моя женщина!
[ 858.617479] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[ 858.617489] ata1.00: irq_stat 0x40000008
[ 858.617497] ata1.00: failed command: READ FPDMA QUEUED
[ 858.617512] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[ 858.617514] res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[ 858.617521] ata1.00: status: { DRDY ERR }
[ 858.617526] ata1.00: error: { UNC }
[ 858.621932] ata1.00: configured for UDMA/133
[ 858.621952] ata1: EH complete
[ 861.617427] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[ 861.617438] ata1.00: irq_stat 0x40000008
[ 861.617446] ata1.00: failed command: READ FPDMA QUEUED
[ 861.617461] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[ 861.617464] res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[ 861.617471] ata1.00: status: { DRDY ERR }
[ 861.617476] ata1.00: error: { UNC }
[ 861.621883] ata1.00: configured for UDMA/133
[ 861.621902] ata1: EH complete
[ 864.276812] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[ 864.276819] ata1.00: irq_stat 0x40000008
[ 864.276826] ata1.00: failed command: READ FPDMA QUEUED
[ 864.276840] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[ 864.276843] res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[ 864.276849] ata1.00: status: { DRDY ERR }
[ 864.276854] ata1.00: error: { UNC }
[ 864.280789] ata1.00: configured for UDMA/133
[ 864.280801] ata1: EH complete
[ 866.967174] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[ 866.967185] ata1.00: irq_stat 0x40000008
[ 866.967193] ata1.00: failed command: READ FPDMA QUEUED
[ 866.967208] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[ 866.967211] res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[ 866.967217] ata1.00: status: { DRDY ERR }
[ 866.967222] ata1.00: error: { UNC }
[ 866.971168] ata1.00: configured for UDMA/133
[ 866.971186] ata1: EH complete
[ 870.317106] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[ 870.317116] ata1.00: irq_stat 0x40000008
[ 870.317124] ata1.00: failed command: READ FPDMA QUEUED
[ 870.317139] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[ 870.317142] res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[ 870.317149] ata1.00: status: { DRDY ERR }
[ 870.317154] ata1.00: error: { UNC }
[ 870.320871] ata1.00: configured for UDMA/133
[ 870.320889] ata1: EH complete
[ 873.325328] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[ 873.325337] ata1.00: irq_stat 0x40000008
[ 873.325346] ata1.00: failed command: READ FPDMA QUEUED
[ 873.325361] ata1.00: cmd 60/00:00:30:e9:78/02:00:2a:00:00/40 tag 0 ncq 262144 in
[ 873.325364] res 41/40:00:89:e9:78/b1:00:2a:00:00/40 Emask 0x409 (media error) <F>
[ 873.325371] ata1.00: status: { DRDY ERR }
[ 873.325376] ata1.00: error: { UNC }
[ 873.328743] ata1.00: configured for UDMA/133
[ 873.328799] sd 0:0:0:0: [sda] Unhandled sense code
[ 873.328805] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 873.328814] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
[ 873.328825] Descriptor sense data with sense descriptors (in hex):
[ 873.328831] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[ 873.328851] 2a 78 e9 89
[ 873.328860] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
[ 873.328872] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 2a 78 e9 30 00 02 00 00
[ 873.328891] end_request: I/O error, dev sda, sector 712567177
[ 873.328901] Buffer I/O error on device sda, logical block 89070897
[ 873.328909] Buffer I/O error on device sda, logical block 89070898
[ 873.328917] Buffer I/O error on device sda, logical block 89070899
[ 873.328924] Buffer I/O error on device sda, logical block 89070900
[ 873.328932] Buffer I/O error on device sda, logical block 89070901
[ 873.328940] Buffer I/O error on device sda, logical block 89070902
[ 873.328947] Buffer I/O error on device sda, logical block 89070903
[ 873.328955] Buffer I/O error on device sda, logical block 89070904
[ 873.328963] Buffer I/O error on device sda, logical block 89070905
[ 873.328970] Buffer I/O error on device sda, logical block 89070906
[ 873.329075] ata1: EH complete
Ну общую суть вы, думаю поняли — покупай новый жесткий диск@копируй разделы со старого.
Но! Проблема еще была в том, что некоторые разделы УЖЕ не монтировались, по причине
смерти
коррупции файловой системы. /me подумал-подумал и решил, а не попробовать ли как-то это дело замять, тем более, новый жесткий пока не входит в планы первоочерёдных покупок.
Гуугле мне подсказал парочку хороших решений, чем я незамедлительно и воспользовался.
Bad block HOWTO for smartmontools
Удивительная статья, которая мне очень сильно помогла. Для тех, кто не в ладах с языком международного общения, могу адаптировать статью, хотите — отпишитесь в комментариях.
Итак, разбор полётов, или что я сделал.
К счастью, у меня завалялась таблица разделов диска, сделанная fdisk -ul На самом деле, у меня было 10 разделов, но те три, которых здесь нет не были столь важны, как sda3+sda4(Зарезервированы под FreeBSDDragonFlyBSD, sda1(загрузочный же, ёпта!) sda7+sda5(линуксовые разделы), ну и sda6(онимэ, музыка, прочий хлам)
Первым делом, был проведён тест, на то, какие партиции умерли, а какие еще живы. К моей радости, sda1 и sda6 остались живы, но о них попозже. все остальные монтироваться НЕ ЖЕЛАЛИ, а fsck завершался с ошибкой.
я запустил smartctl -t long /dev/sda и ушел на два часа. Через пару часов, возвратившись, я увидел сию картину smartctl -l selftest /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 8962 712567177
# 2 Short offline Completed without error 00% 5188 -
# 3 Extended offline Aborted by host 90% 5188 -
Как видите, первая ошибка проявилась в блоке 712567177
Запускаем badblocks: badblocks -s -v -b 512 /dev/sda 712567277 712567077#-s показывает прогресс, -v увеличивает информативность, -b 512 - указывается размер блока, в данном случае - 512 байт, дальше указываем КОНЕЧНЫЙ и потом уже НАЧАЛЬНЫЙ блок, которые я выбрал из окружения в +-100 блоков к ошибочному.
И правда, выскакивают номера бэдблоков. Провел щадящий read-write тест (опция -n) — бэдблоки тоже продолжают появдяться. Далее я сделал то, что НЕ РЕКОММЕНДУЮ делать другим без полного понимания того, ЧТО они делают. badblocks -s -w -v -b 512 /dev/sda 712567277 712567077#-w - write-mode, заполнение определенными паттернами, МОЖЕТ ПОВРЕДИТЬ ДАННЫЕ. Что удивительно, после этого бэдблоки исчезли. Проведя еще несколько тестов smartctl, теперь уже с опцией -t short, я вычислил остальные бэдблоки и провел аналогичные операции. Теперь
smartctl -l selftest -d ata /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 8972 -
# 2 Extended offline Completed: read failure 90% 8962 712567177
# 3 Short offline Completed without error 00% 5188 -
# 4 Extended offline Aborted by host 90% 5188 -
Как видим, ошибок больше нет, но раз уже они появились — жди новых//уже откладываю деньги на новый хард.
Теперь о минусах такого способа. После всех манипуляций, fdisk -ul /dev/sda показал мне ПОЛНОСТЬЮ голый диск. Запускаем testdisk, находим разделы. К сожалению, sda6 не был найден. Ну ладно, мы не боимся этого. fdisk -u /dev/sda, дальше жмём n/*новый раздел*/ дальше вводим какой тип раздела, logical или primary, потом вводим начало и конец сектора/*ну недаром же у меня была таблица разделов?*/, записываем таблицу разделов — w и выходим из fdisk -q.
пишем partprobe, чтобы ядро узнало о новом разделе, вуаля — раздел появился и он полностью жив.
Итак, любые вопросы, предложения и замечания буду рад прочитать в комментариях.
- Печать
Страницы: [1] 2 Все Вниз
Тема: Жесткий диск Кирдык? (Прочитано 3150 раз)
0 Пользователей и 1 Гость просматривают эту тему.

Nesmit
/var/log# tail kern.log
May 26 15:30:28 mal-inet kernel: [65174.780425] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:28 mal-inet kernel: [65174.780465] ata1.01: BMDMA stat 0x44
May 26 15:30:28 mal-inet kernel: [65174.780493] ata1.01: cmd c8/00:08:df:f2:3d/00:00:00:00:00/f3 tag 0 dma 4096 in
May 26 15:30:28 mal-inet kernel: [65174.780495] res 51/40:00:e6:f2:3d/00:00:00:00:00/f3 Emask 0x9 (media error)
May 26 15:30:28 mal-inet kernel: [65174.780538] ata1.01: status: { DRDY ERR }
May 26 15:30:28 mal-inet kernel: [65174.780562] ata1.01: error: { UNC }
May 26 15:30:28 mal-inet kernel: [65174.840200] ata1.01: configured for UDMA/133
May 26 15:30:28 mal-inet kernel: [65174.840217] ata1: EH complete
May 26 15:30:29 mal-inet kernel: [65176.159991] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:29 mal-inet kernel: [65176.160031] ata1.01: BMDMA stat 0x44

ArcFi
Я так понимаю, про
sudo fdisk -lспрашивать бессмысленно.

Nesmit
Disk /dev/sda: 81.9 GB, 81964302336 bytes
255 heads, 63 sectors/track, 9964 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x0cd60cd5
Device Boot Start End Blocks Id System
/dev/sda1 * 1 9872 79296808+ 83 Linux
/dev/sda2 9873 9964 738990 5 Extended
/dev/sda5 9873 9964 738958+ 82 Linux swap / Solaris

Protopopulus
Диск живой. Вот только размер настораживает…
Если ты владеешь знаниями, то и знания владеют тобой. (с) Protopopulus

Nesmit
как заставить исправить и все это удаленно через ssh?

ArcFi
/dev/sda — это он (ata1.01)?
Если да, то бэкап данных и прогон тестов с live-cd/usb.
ps
Просто у меня, например, /dev/sda на ata1.00.

Nesmit
Без проблем, но комп стоит в 150км от меня на шкафу и дома никого нет.
Пользователь решил продолжить мысль 26 Мая 2009, 17:15:36:
Ubuntu же проверяет жесткий автоматически, после скольких перезагузок.
« Последнее редактирование: 26 Мая 2009, 17:15:36 от Nesmit »

-sanches-
/var/log# tail kern.log
May 26 15:30:28 mal-inet kernel: [65174.780425] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:28 mal-inet kernel: [65174.780465] ata1.01: BMDMA stat 0x44
May 26 15:30:28 mal-inet kernel: [65174.780493] ata1.01: cmd c8/00:08:df:f2:3d/00:00:00:00:00/f3 tag 0 dma 4096 in
May 26 15:30:28 mal-inet kernel: [65174.780495] res 51/40:00:e6:f2:3d/00:00:00:00:00/f3 Emask 0x9 (media error)
May 26 15:30:28 mal-inet kernel: [65174.780538] ata1.01: status: { DRDY ERR }
May 26 15:30:28 mal-inet kernel: [65174.780562] ata1.01: error: { UNC }
May 26 15:30:28 mal-inet kernel: [65174.840200] ata1.01: configured for UDMA/133
May 26 15:30:28 mal-inet kernel: [65174.840217] ata1: EH complete
May 26 15:30:29 mal-inet kernel: [65176.159991] ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
May 26 15:30:29 mal-inet kernel: [65176.160031] ata1.01: BMDMA stat 0x44
Нет, это какой-то косяк со связкой старый sata диск + драйвер котроллера либо шлейф. У меня такое часто проявлялось на 3 винтах сата: 80гб, 250гб (самсунг), 250 гб (wd). Одну проблему удалось вылечить заменой шлейфа, второй диск пока на полке лежит, 3й на внешнем контроллере пока работает под debian 5. Вобщем, это довольно мутная ситуация.

Nesmit
это случилось после падения напряжения.
а теперь восстанавливаю систему

-sanches-
а теперь восстанавливаю систему
Ага, сам тоже проделывал такое.

Nesmit
Я в легком шоке от того так быстро упал раздел. А восстановление, нереальное шаманство.
Но, винт лежит на столе, как руки дойдут начну получать опыт восстановления данных .)

Frank
не мешало бы sudo smartctl -A /dev/sda

Dreammaker
exception Emask
по этой ошибке на форуме топик в несколько страниц есть, правда, кажись ни к чему так и не пришли.

Nesmit
Вообщем поставил новый винт, залил линь все супер. Шлейф остался старый.
Вспомнилось, что комп как то странно работал. ssh постоянно рвал. А squid работал как то с паузами.
Вывод, скорее всего контроллер. А тут врят ли что поможет.
Данные всетаки попробую восстановить, хотя уже ценности не представляют.

zilog82
ata1.01: status: { DRDY ERR }
ata1.01: error: { UNC }
DRive_reaDY ERRor — ошибка готовности винта. Возникает вследствие капризности AHCI или эмуляции IDE, чаще всего из-за ошибки доступа к данным не только поверхности, но и смарта и служебки. Если смена винта помогла, старый можно попробовать оживить помучавшись со смартом и/или поверхностью.В другом случае стоит пересмотреть настройки биоса/рэйда (на самом деле это надо сделать в первую очередь). Сам не раз сталкивался, шаманство в этом направлении обычно помогает.
UNC — ошибка регистра контроллера ata (отсутствие данных или ошибочные данные) . Возникает из-за всякой бяки, в том числе DRDY ERR.
- Печать
Страницы: [1] 2 Все Вверх
0
0
Сейчас при сильной нагрузке (linuxdcpp сканил кучу файлов, при этом я тоже чем-то занимался) начались странности )
далее комп завис, перезагрузился, в логе обнаружил записи вида:
Device: /dev/sda, is SMART capable. Adding to «monitor» list.
Monitoring 1 ATA and 0 SCSI devices
Device: /dev/sda, 1 Currently unreadable (pending) sectors
далее опять запустил linuxdcpp и в логе от kernel:
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x65
ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in
res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)
ata1.01: configured for UDMA/100
ata1: EH complete
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x65
ata1.01: cmd 25/00:08:55:50:5a/00:00:11:00:00/f0 tag 0 cdb 0x0 data 4096 in
res 51/40:01:5c:50:5a/40:00:11:00:00/f0 Emask 0x9 (media error)
ata1.01: configured for UDMA/100
ata1: EH complete
думал проверить читаемость всех файлов из каталога и ниже, который подсовываю — как это сделать?
Чтото-типа cp ./dir -Recurce /dev/null
ос сусе103
винт wd320гб, куплен ~полгода назад, не носил, не кидал
В последнее время с компьютером появилась проблема: после непродолжительной работы начала слетать файловая система (ext4).Несколько раз ее восстанавливал при помощи fsck, потом на диске обнаружились bad-блоки и я его поменял по гарантии. На новый диск поставил тут же систему (fedora 12 i386), посмотрел кино и обнаружил после этого жуткие глюки: не запускались ни nautilus, ни chromium. Я перезагрузил компьютер, после чего вместо загружающейся системы увидел повторяющиеся подряд раз 50 сообщения об ошибке:
Код: Выделить всё
ata3.00: exception Emask 0x0 S Act 0xo SErr 0x0 action 0x0
ata3.00: BDMA stat 0x24
ata3.00: failed command: READ DMA EXT
ata3.00: cmd 25/00:00:97:c7:79/00:01:17:00:00/e0 tag 0 dma 131072 in
res 51/40:00:7e:c8:79/40:00:17:00:00/e0 Emask 0x9 (media error)
ata3.00: status: { DRDY ERR }
ata3.00: error: { UNC }
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata3.00: BDMA stat 0x24
ata3.00: failed command: READ DMA EXT
ata3.00: md 25/00:00:97:c7:79/00:01:17:00:00/e0 tag 0 dma 131072 in
res 51/40:00:7e:c8:79/40:00:17:00:00/e0 Emask 0x9 (media error)
end_request: I/O error, /dev/sda, sector 393857150
JBD: failed to read block at ofset 27911
EXT4-fs (sda3): error loading journal
mount: wrong fs type, bad option, bad superblock on /dev/sda3,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail or so
и все заканчивается следующим сообщением:
Код: Выделить всё
mount: wrong fs type, bad option, bad superblock on /dev/sda3,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail or so
Can't mount root filesystem
[drm:drm_mode_rmfb] *ERROR* tried to remove a fb that we didn't own
Boot has failed, sleeping forewer.
Конфигурация компьютера: Pentium Dual-core 2.00Ghz, видеокарта интегрированная, 2 винчетера: 250 и 500 Гб (система на 250-м), оба WD, блок питания 400W.
Кроме того, обнаружил непонятную мне пока вещь: в биосе в разделе hardware monitoring напряжение на V12.0 он показывает только 11.07V.
А теперь вопросы:
1. Что это такое происходит и по какой причине (дохнет блок питания, бракованный винчестер или что-то другое)?
2. Как спасти ситуацию?
Desktop: PentiumD 2.0Ghz, 2GbRAM, video — intel, Fedora 14 x86_64, Gnome
Laptop 1: Toshiba Satellite M100, WinXP HE SP3
Laptop2: IBM Thinkpad R30, Debian 4.0 etch, Gnome
и целый зоопарк в VirtualBox…
hi,
could you post the outputs from:
*df
*mountwhen did this start happening? did you do anything before?
you should also check
journalctland/var/log/syslog, there might be hints there pointing to the root cause of the issue
outputs from: df, mount
root@proxmox:~# df
Filesystem 1K-blocks Used Available Use% Mounted on
udev 16357924 0 16357924 0% /dev
tmpfs 3277196 329076 2948120 11% /run
/dev/mapper/pve-root 98559220 72662212 20847460 78% /
tmpfs 16385964 21840 16364124 1% /dev/shm
tmpfs 5120 0 5120 0% /run/lock
tmpfs 16385964 0 16385964 0% /sys/fs/cgroup
/dev/sdb2 523248 312 522936 1% /boot/efi
/dev/fuse 30720 20 30700 1% /etc/pve
tmpfs 3277192 0 3277192 0% /run/user/0
root@proxmox:~# mount
sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime)
proc on /proc type proc (rw,relatime)
udev on /dev type devtmpfs (rw,nosuid,relatime,size=16357924k,nr_inodes=4089481,mode=755)
devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)
tmpfs on /run type tmpfs (rw,nosuid,noexec,relatime,size=3277196k,mode=755)
/dev/mapper/pve-root on / type ext4 (ro,relatime,errors=remount-ro)
securityfs on /sys/kernel/security type securityfs (rw,nosuid,nodev,noexec,relatime)
tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev)
tmpfs on /run/lock type tmpfs (rw,nosuid,nodev,noexec,relatime,size=5120k)
tmpfs on /sys/fs/cgroup type tmpfs (ro,nosuid,nodev,noexec,mode=755)
cgroup2 on /sys/fs/cgroup/unified type cgroup2 (rw,nosuid,nodev,noexec,relatime)
cgroup on /sys/fs/cgroup/systemd type cgroup (rw,nosuid,nodev,noexec,relatime,xattr,name=systemd)
pstore on /sys/fs/pstore type pstore (rw,nosuid,nodev,noexec,relatime)
efivarfs on /sys/firmware/efi/efivars type efivarfs (rw,nosuid,nodev,noexec,relatime)
none on /sys/fs/bpf type bpf (rw,nosuid,nodev,noexec,relatime,mode=700)
cgroup on /sys/fs/cgroup/cpu,cpuacct type cgroup (rw,nosuid,nodev,noexec,relatime,cpu,cpuacct)
cgroup on /sys/fs/cgroup/perf_event type cgroup (rw,nosuid,nodev,noexec,relatime,perf_event)
cgroup on /sys/fs/cgroup/hugetlb type cgroup (rw,nosuid,nodev,noexec,relatime,hugetlb)
cgroup on /sys/fs/cgroup/rdma type cgroup (rw,nosuid,nodev,noexec,relatime,rdma)
cgroup on /sys/fs/cgroup/blkio type cgroup (rw,nosuid,nodev,noexec,relatime,blkio)
cgroup on /sys/fs/cgroup/cpuset type cgroup (rw,nosuid,nodev,noexec,relatime,cpuset)
cgroup on /sys/fs/cgroup/devices type cgroup (rw,nosuid,nodev,noexec,relatime,devices)
cgroup on /sys/fs/cgroup/pids type cgroup (rw,nosuid,nodev,noexec,relatime,pids)
cgroup on /sys/fs/cgroup/memory type cgroup (rw,nosuid,nodev,noexec,relatime,memory)
cgroup on /sys/fs/cgroup/net_cls,net_prio type cgroup (rw,nosuid,nodev,noexec,relatime,net_cls,net_prio)
cgroup on /sys/fs/cgroup/freezer type cgroup (rw,nosuid,nodev,noexec,relatime,freezer)
systemd-1 on /proc/sys/fs/binfmt_misc type autofs (rw,relatime,fd=25,pgrp=1,timeout=0,minproto=5,maxproto=5,direct,pipe_ino=22009)
hugetlbfs on /dev/hugepages type hugetlbfs (rw,relatime,pagesize=2M)
debugfs on /sys/kernel/debug type debugfs (rw,relatime)
mqueue on /dev/mqueue type mqueue (rw,relatime)
sunrpc on /run/rpc_pipefs type rpc_pipefs (rw,relatime)
fusectl on /sys/fs/fuse/connections type fusectl (rw,relatime)
configfs on /sys/kernel/config type configfs (rw,relatime)
/dev/sdb2 on /boot/efi type vfat (rw,relatime,fmask=0022,dmask=0022,codepage=437,iocharset=iso8859-1,shortname=mixed,errors=remount-ro)
lxcfs on /var/lib/lxcfs type fuse.lxcfs (rw,nosuid,nodev,relatime,user_id=0,group_id=0,allow_other)
/dev/fuse on /etc/pve type fuse (rw,nosuid,nodev,relatime,user_id=0,group_id=0,default_permissions,allow_other)
tmpfs on /run/user/0 type tmpfs (rw,nosuid,nodev,relatime,size=3277192k,mode=700)
Проблема с запуском CentOS 5.11
4
Посты
4
Пользователи
0
Likes
6,857
Просмотры
(@iskandar)
New Member
Присоединился: 6 лет назад
Доброе времени суток.
Возникла проблема и никак не могу найти решение. Сервер не запускается и выдает такую ошибку:
ata1.01: status: { DRDY ERR }
ata1.01: error: { UNC }
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.01: BMDMA stat 0x64
ata1.01: cmd 25/00:08:d5:d0:57/00:00:58:00:00/f0 tag 0 dma 4096 in
res 51/40:08:d9:d0:57/40:00:58:00:00/10 Emask 0x9 (media error)
Как решить данную проблему? и что это за ошибка?
Заранее спасибо.
(@fix)
Eminent Member
Присоединился: 6 лет назад
Сталкивались с чем-то подобным на предыдущей работе, не помню как решилось, нужно спросить товарища.
(@utter)
Eminent Member
Присоединился: 5 лет назад
(@zerox)
Prominent Member
Присоединился: 9 лет назад
Тут ошибка с диском налицо. Правда не понятно, как это сервер не запускается, если это ошибка из системного лога. Он как минимум запустился.
Я использую Xubuntu на MacBook Pro с Fluxbox в качестве моего оконного менеджера. Вчера, когда я попытался запустить Firefox, я получил ошибку шины, и приложение не запустилось. Я исправил проблему, удалив и переустановив firefox. Сегодня та же проблема происходит с Emacs. Я не пробовал удалять и переустанавливать emacs, поэтому я не уверен, что это сработает, но поскольку проблема возникла более чем в одном приложении, я предполагаю, что это указывает на более серьезную проблему. Я провел некоторое исследование ошибок шины, но не ясно, почему эта проблема проявляется в разных приложениях таким образом.
После неудачного запуска dmesg сообщает об этом, что выглядит актуально:
[10227.675775] ata3.01: BMDMA stat 0x5
[10227.675782] ata3.01: failed command: READ DMA
[10227.675796] ata3.01: cmd c8/00:08:f8:2e:9f/00:00:00:00:00/fa tag 0 dma 4096 in
[10227.675799] res 51/40:00:fc:2e:9f/00:00:00:00:00/fa Emask 0x9 (media error)
[10227.675806] ata3.01: status: { DRDY ERR }
[10227.675811] ata3.01: error: { UNC }
[10227.712803] ata3.01: configured for UDMA/133
[10227.712830] ata3: EH complete
[10230.070892] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[10230.070901] ata3.01: BMDMA stat 0x5
[10230.070908] ata3.01: failed command: READ DMA
[10230.070922] ata3.01: cmd c8/00:08:f8:2e:9f/00:00:00:00:00/fa tag 0 dma 4096 in
[10230.070925] res 51/40:00:fc:2e:9f/00:00:00:00:00/fa Emask 0x9 (media error)
[10230.070932] ata3.01: status: { DRDY ERR }
[10230.070937] ata3.01: error: { UNC }
[10230.092783] ata3.01: configured for UDMA/133
[10230.092809] ata3: EH complete
[10232.466015] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[10232.466025] ata3.01: BMDMA stat 0x5
[10232.466032] ata3.01: failed command: READ DMA
[10232.466046] ata3.01: cmd c8/00:08:f8:2e:9f/00:00:00:00:00/fa tag 0 dma 4096 in
[10232.466049] res 51/40:00:fc:2e:9f/00:00:00:00:00/fa Emask 0x9 (media error)
[10232.466056] ata3.01: status: { DRDY ERR }
[10232.466061] ata3.01: error: { UNC }
[10232.488693] ata3.01: configured for UDMA/133
[10232.488721] sd 2:0:1:0: [sda] Unhandled sense code
[10232.488726] sd 2:0:1:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[10232.488734] sd 2:0:1:0: [sda] Sense Key : Medium Error [current] [descriptor]
[10232.488745] Descriptor sense data with sense descriptors (in hex):
[10232.488750] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[10232.488773] 0a 9f 2e fc
[10232.488783] sd 2:0:1:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
[10232.488794] sd 2:0:1:0: [sda] CDB: Read(10): 28 00 0a 9f 2e f8 00 00 08 00
[10232.488815] end_request: I/O error, dev sda, sector 178204412
[10232.488852] ata3: EH complete
Любые предложения относительно того, что может быть в корне проблемы?
I have one server with WDC WD3202ABYS … There are 100 virtual hosts. Server is working about 5 years and in this time period I have change 4 disks. All with same reason: sata error. The last one:
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x5
ata2.00: cmd 35/00:60:57:7b:b6/00:01:06:00:00/e0 tag 0 dma 180224 out
res 51/10:60:57:7b:b6/10:01:06:00:00/e0 Emask 0x81 (invalid argument)
ata2.00: status: { DRDY ERR }
ata2.00: error: { IDNF }
ata2.00: configured for UDMA/133
sd 1:0:0:0: SCSI error: return code = 0x08000002
sdb: Current [descriptor]: sense key: Aborted Command
Add. Sense: Recorded entity not found
Descriptor sense data with sense descriptors (in hex):
72 0b 14 00 00 00 00 0c 00 0a 80 00 00 00 00 00
06 b6 7b 57
end_request: I/O error, dev sdb, sector 112622423
Buffer I/O error on device dm-8, logical block 14077747
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077748
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077749
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077750
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077751
lost page write due to I/O error on dm-8
Buffer I/O error on device dm-8, logical block 14077756
lost page write due to I/O error on dm-8
ata2: EH complete
SCSI device sdb: 625142448 512-byte hdwr sectors (320073 MB)
sdb: Write Protect is off
sdb: Mode Sense: 00 3a 00 00
SCSI device sdb: drive cache: write back
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x5
ata2.00: cmd 35/00:90:17:30:b7/00:02:08:00:00/e0 tag 0 dma 335872 out
res 51/10:90:17:30:b7/10:02:08:00:00/e0 Emask 0x81 (invalid argument)
ata2.00: status: { DRDY ERR }
ata2.00: error: { IDNF }
ata2.00: configured for UDMA/133
sd 1:0:0:0: SCSI error: return code = 0x08000002
sdb: Current [descriptor]: sense key: Aborted Command
Add. Sense: Recorded entity not found
Descriptor sense data with sense descriptors (in hex):
72 0b 14 00 00 00 00 0c 00 0a 80 00 00 00 00 00
08 b7 30 17
end_request: I/O error, dev sdb, sector 146223127
printk: 34 messages suppressed.
Buffer I/O error on device dm-8, logical block 18277835
Looks like some software error…
but in short time after that (maybe when I started fsck) following error:
EXT3-fs error (device dm-8): ext3_put_super: Couldn't clean up the journal
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/01:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x1 (device error)
ata2.00: status: { DRDY ERR }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
Is it possible that this errors are also «software» … I mean this HDD is only 9000 hours old … where are no extra load on HDD… temperature is 29 Celsius… Do I need to replace hdd? or check disk is enough?
EXT3-fs error (device dm-8): ext3_put_super: Couldn't clean up the journal
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/01:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x1 (device error)
ata2.00: status: { DRDY ERR }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
ata2: EH complete
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x4
ata2.00: cmd c8/00:00:8f:0d:84/00:00:00:00:00/e1 tag 0 dma 131072 in
res 51/40:00:a8:0d:84/10:02:08:00:00/e1 Emask 0x9 (media error)
How to find out reason?
Here are errors from smart:
Error 36 occurred at disk power-on lifetime: 9160 hours (381 days + 16 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 22 09 80 e3 Error: UNC at LBA = 0x03800922 = 58722594
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 08 1f 09 80 03 0a 47d+13:38:13.534 READ DMA
ec 00 00 00 00 00 00 0a 47d+13:38:13.530 IDENTIFY DEVICE
ef 03 46 00 00 00 00 0a 47d+13:38:13.528 SET FEATURES [Set transfer mode]
Ok. Is it possible the following scenario:
1. Disk was on 9000 without fsck.
2. There are some errors
3. In dmesg there started errors like:
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata2.00: BMDMA stat 0x5
ata2.00: cmd 35/00:60:57:7b:b6/00:01:06:00:00/e0 tag 0 dma 180224 out
res 51/10:60:57:7b:b6/10:01:06:00:00/e0 Emask 0x81 (invalid argument)
ata2.00: status: { DRDY ERR }
ata2.00: error: { IDNF }
ata2.00: configured for UDMA/133
sd 1:0:0:0: SCSI error: return code = 0x08000002
sdb: Current [descriptor]: sense key: Aborted Command
Add. Sense: Recorded entity not found
- And errors like inode error and so on…
- I tried to umount this parition, and error come from hdd like it cannot find such inode and so on… ?
If so.. I do not understand. Do I need to change disk every year? Just to prevent this error? Does some one have same problem? Not only with one disk…










