Дорожки и секторы
- Подробности
- Родительская категория: Накопители на жестких дисках
- Категория: Принципы работы накопителей на жестких дисках
Дорожка — это одно “кольцо” данных на одной стороне диска. Дорожка записи на диске слишком велика, чтобы использовать ее в качестве единицы хранения информации. Во многих накопителях ее емкость превышает 100 тыс. байтов, и отводить такой блок для хранения небольшого файла крайне расточительно. Поэтому дорожки на диске разбивают на нумерованные отрезки, называемые секторами.
Количество секторов может быть разным в зависимости от плотности дорожек и типа накопителя. Например, дорожка гибких дисков может содержать от 8 до 36 секторов, а дорожка жесткого диска — от 380 до 700. Секторы, создаваемые с помощью стандартных программ форматирования, имеют емкость 512 байт, но не исключено, что в будущем эта величина изменится. Следует отметить один важный факт: для совместимости со старыми BIOS, независимо от реального количества секторов на дорожке, устройство должно выполнять трансляцию в режим 63 секторов на дорожке, принятый в адресации CHS.
Нумерация секторов на дорожке начинается с единицы, в отличие от головок и цилиндров, отсчет которых ведется с нуля. Например, дискета емкостью 1,44 Мбайт содержит 80 цилиндров, пронумерованных от 0 до 79, в дисководе установлены две головки (с номерами 0 и 1) и каждая дорожка цилиндра разбита на 18 секторов (1–18).
При форматировании диска в начале и конце каждого сектора создаются дополнительные области для записи их номеров, а также прочая служебная информация, благодаря которой контроллер идентифицирует начало и конец сектора. Это позволяет отличать неформатированную и форматированную емкости диска. После форматирования емкость диска уменьшается, и с этим приходится мириться, поскольку для обеспечения нормальной работы накопителя некоторое пространство на диске должно быть зарезервировано для служебной информации. Стоит, однако, отметить, что в новых дисках используется форматирование без идентификатора, т.е. не проставляются отметки начала и конца каждого из секторов. Это позволяет использовать немного больше пространства для хранения реальных данных.
В начале каждого сектора записывается его заголовок (или префикс), по которому определяется начало и номер сектора, а в конце — заключение (или суффикс), в котором находится контрольная сумма, необходимая для проверки целостности данных. В вышеупомянутой системе адресации без идентификаторов начало и конец каждого из секторов определяется на основании импульсов генератора тактовой частоты.
Помимо указанных областей служебной информации, каждый сектор содержит область данных емкостью 512 байт. При низкоуровневом (физическом) форматировании всем байтам данных присваивается некоторое значение, например F6h. Электронные схемы накопителей с большим трудом справляются с кодированием и декодированием некоторых шаблонов, поскольку эти шаблоны используются только при тестировании дисководов, выполняемом производителем в процессе первоначального форматирования. Используя специальные тестовые шаблоны, можно выявить ошибки, которые не обнаруживаются с помощью обычных шаблонов данных.
Примечание!
Форматирование низкого уровня обсуждается далее. Не путайте его с форматированием высокого уровня, которое выполняется с помощью программы FORMAT в DOS и Windows.Заголовки и суффиксы секторов не зависят от операционной и файловой систем, а также от файлов, хранящихся на жестком диске. Помимо этих элементов, существует множество промежутков в секторах, между секторами на каждой дорожке и между дорожками, но ни один из этих промежутков не может быть использован для записи данных. Промежутки создаются во время форматирования на низком (физическом) уровне, при котором удаляются все записанные данные. На жестком диске промежутки выполняют точно такие же функции, как и на магнитофонной кассете, где они используются для разделения музыкальных записей. Начальные, завершающие и промежуточные пробелы представляют собой именно то пространство, которое определяет разницу между форматной и неформатной емкостью диска. Например, емкость 4-мегабайтовой дискеты (3,5-дюйма) после форматирования “уменьшается” до 2,88 Мбайт (форматная емкость).
Форматирование низкого уровня современных жестких дисков ATA/IDE и SCSI выполняется еще на заводе, поэтому изготовитель указывает только форматную емкость диска. Тем не менее практически на всех дисках имеется некоторое зарезервированное пространство для управления данными, которые будут записаны на диске. Как видите, утверждать, что размер любого сектора равен 512 байт, — не вполне корректно. На самом деле в каждом секторе можно записать 512 байт данных, но область данных — это только часть сектора. Каждый сектор на диске обычно занимает 571 байт, из которых под данные отводится только 512 байт. В различных накопителях пространство, отводимое под заголовки и суффиксы, может быть разным, но, как правило, сектор имеет размер 571 байт. Как уже говорилось, многие современные диски используют схему разметки без идентификаторов заголовков секторов, что высвобождает дополнительное пространство для данных.
Для наглядности представьте, что секторы — это страницы в книге. На каждой странице содержится текст, но им заполняется не все пространство страницы, так как у нее есть поля (верхнее, нижнее, правое и левое). На полях помещается служебная информация, например названия глав (на диске это соответствует номерам дорожек и цилиндров) и номера страниц (что соответствует номерам секторов). Области на диске, аналогичные полям на странице, создаются во время форматирования диска; тогда же в них записывается и служебная информация. Кроме того, во время форматирования диска области данных каждого сектора заполняются фиктивными значениями. Отформатировав диск, можно записывать информацию в области данных обычным образом. Информация, которая содержится в заголовках и заключениях сектора, не меняется во время обычных операций записи данных. Изменить ее можно, только переформатировав диск.
В таблице в качестве примера приведен формат дорожки и сектора стандартного жесткого диска, имеющего 17 секторов на дорожке. Из таблицы видно, что “полезный” объем дорожки примерно на 15% меньше возможного.
Эти потери характерны для большинства накопителей, но для разных моделей они могут быть различными. Ниже подробно анализируются данные, представленные в табл. 9.2. Послеиндексный интервал нужен для того, чтобы при перемещении головки на новую дорожку переходные процессы (установка) закончились прежде, чем она окажется перед первым сектором. В этом случае его можно начать считывать сразу, не дожидаясь, пока диск совершит дополнительный оборот.
Послеиндексный интервал далеко не всегда обеспечивает время, достаточное для перемещения головки. В этом случае накопитель получает дополнительное время за счет смещения секторов на различных дорожках, которое приводит к задержке появления первого сектора. Другими словами, процесс форматирования низкого уровня приводит к смещению нумерации секторов, в результате чего секторы на соседних дорожках, имеющие одинаковые номера, смещаются друг относительно друга.
Примечание!
Раньше параметр смещения головки устанавливался пользователем вручную при низкоуровневом форматировании. Сегодня такое форматирования выполняется в промышленных условиях, и эти параметры нельзя изменить.Идентификатор сектора (ID) состоит из полей записи номеров цилиндра, головки и сектора, а также контрольного поля CRC для проверки точности считывания информации ID.
В большинстве контроллеров седьмой бит поля номера головки используется для маркировки дефектных секторов в процессе форматирования низкого уровня или анализа поверхности. Однако такой метод не является стандартным, и в некоторых устройствах дефектные секторы помечаются иначе. Но, как правило, отметка делается в одном из полей идентификатора сектора. Интервал включения записи следует сразу за байтами CRC; он гарантирует, что информация в следующей области данных будет записана правильно. Кроме того, он служит для завершения анализа контрольной суммы (CRC) идентификатора сектора.
В поле данных можно записать 512 байт информации. За ним располагается еще одно поле CRC для проверки правильности записи данных. В большинстве накопителей размер этого поля составляет 2 байт, но некоторые контроллеры могут работать и с более длинными полями кодов коррекции ошибок (Error Correction Code — ECC). Записанные в этом поле байты кодов коррекции ошибок позволяют при считывании обнаруживать и исправлять некоторые ошибки. Эффективность этой операции зависит от выбранного метода коррекции и особенностей контроллера. Интервал отключения записи позволяет полностью завершить анализ байтов ECC (CRC).
Интервал между записями необходим для того, чтобы застраховать данные следующего сектора от случайного стирания при записи в предыдущий сектор. Это может произойти, если при форматировании диск вращался с частотой, несколько меньшей, чем при последующих операциях записи. При этом сектор, естественно, всякий раз будет немного длиннее. Поэтому, чтобы он не выходил за установленные при форматировании границы, их слегка “растягивают”, вводя упомянутый интервал. Его реальный размер зависит от разности частот вращения диска при форматировании дорожки и при каждом обновлении данных.
Предындексный интервал необходим для компенсации неравномерности вращения диска вдоль всей дорожки. Размер этого интервала зависит от возможных значений частоты вращения диска и сигнала синхронизации при форматировании и записи.
Информация, записываемая в заголовке сектора, имеет огромное значение, поскольку содержит данные о номере цилиндра, головки и сектора. Все эти сведения (за исключением поля данных, байтов CRC и интервала отключения записи) записываются на диск только при форматировании низкого уровня.
- < Назад
- Вперёд >
Логическое строение диска | DOKI.
org.uaДавайте теперь разберемся с логической структурой диска. Естественно предположить, что минимальная единица записываемой информации — не бит, а гораздо более крупный блок данных. Действительно, если бы каждый бит записывался бы независимо, то необходимо было бы адресоваться к каждому биту на диске в отдельности. Так как бит на современном диске — сотни миллиардов, то пришлось бы адресоваться к огромному числу блоков данных на диске, а это крайне неэффективно. Поэтому диск разбивают на гораздо более крупные логические части, нежели куски по одному биту.
Каким образом производят подобное разбиение? Каждый диск разбивается на дорожки (Track), концентрические кольца. Кроме того, диск разбивают на секторы, области пересечения секторов и дорожек называют блоками (block), в блоке хранится 512 байт полезной информации. Тогда количество блоков на одной пластине равно произведению количества секторов на количество дорожек. Как учесть тот факт, что диск состоит из некоторого количества пластин? На первый взгляд нужно умножить количество блоков на одной пластине на количество пластин. Однако, если подумать, то правильнее будет сказать, что количество блоков на одной пластине (точнее, на одной стороне!) нужно умножить на количество используемых сторон, а если вспомнить, что количество используемых сторон равно количеству магнитных головок (head) на диске, то получаем итоговую формулу:
количество блоков на диске = количество дорожек * количество секторов * количество головок
или
Blocks = Tracks * Sectors * Heads
А емкость диска равна количеству блоков умноженному на объем одного блока, т.е. на 512 байт. Единственное замечание: так как магнитные головки жестко скреплены друг с другом, то запись производится на все дорожки всех сторон одновременно. Следовательно, вместо понятия «дорожка» следует ввести понятие, описывающее все равноудаленные от центра дорожки на всех сторонах всех пластин: совокупность таких дорожек по понятным соображениям (вспоминаем школьный курс геометрии) называется цилиндром (cylinder).
Итого: Емкость диска = Сylinders * Sectors * Heads * 512 byte.
Обращение к каждому блоку на диске (адресация блока), совершенно необходимое для работы с устройством осуществляется посредством задания номера цилиндра, сектора и головки для каждого блока. Т.е., по сути на диске вводится цилиндрическая система координат и каждый блок на диске имеет в этой системе координат свой собственный уникальный адрес, по которому контроллер жесткого диска находит необходимый блок. Такая адресация называется CHS (Cylinder, Sector, Head) или Normal.
Мы рассмотрели очень простую адресацию, на самом деле все гораздо сложнее, есть ряд причин, приводящих к тому, что так адресоваться к блокам на жестком диске нельзя.
Первая причина состоит в том, что идеальное разбиение диска на сектора приводит к тому, что блоки на внутренних цилиндрах будут иметь меньшую площадь, нежели блоки, расположенные на внешних цилиндрах. А так как объем информации в КАЖДОМ блоке одинаковый, то можно заметить, что полезная площадь диска используется крайне неэффективно: внешние блоки занимают слишком большую площадь. Для того, чтобы избежать такого расточительного расходования дискового пространства, применяют зонное деление на сектора. Т.е. на внутренних цилиндрах сектора шире, а на внешних — более узкие, так, чтобы сделать более эффективным использование площади поверхности диска. Однако про такой диск уже нельзя сказать, что он имеет некоторое количество секторов — количество секторов зависит от цилиндра.
Следовательно, рассмотренная нами выше схема адресации уже не может соответствовать реальной геометрии жесткого диска. Для того, чтобы по-прежнему пользоваться введенной системой координат, нужен какой-то механизм ТРАНСЛЯЦИИ, который смог бы преобразовать реальную геометрию жесткого диска в некоторую идеальную, в которой он имеет фиксированное количество секторов. В таком случае трансляция должна поддерживаться самим диском.
Обращения к диску в рамках описанной системы координат выполняет BIOS контроллера жесткого диска. В силу некоторых причин при написании первых BIOS для РС было зарезервировано явно недостаточное количество бит для хранения информации о цилиндрах, секторах и головках.
Первые BIOS поддерживали обращение лишь к 1024 цилиндров, 64 секторам и 16 головкам. Простейший расчет показывает, что в таком случае BIOS может обращаться только к 512 Мбайтам жесткого диска! Вот она, цена непродуманности. Впрочем такой непродуманности в РС достаточно много, вспомним хотя бы проблему 2000-го года: пожалели зарезервировать лишние 2 байта для хранения информации о годе.
Разумеется, сегодня совершенно никуда не годится поддержка дисков емкостью только 512 Мбайт. Для того, чтобы решить эту проблему следует добавить еще некоторое количество бит для хранения информации о цилиндрах и секторах. Однако, это не так просто: необходимые области памяти зарезервированы под другие нужды. Выход, тем не менее, удалось найти: оказалось возможным добавить некоторое количество бит под хранение информации о головках: BIOS получил возможность обращаться к 256 головкам. Но, естественно, такого количества головок у реального диска быть не может :). Однако, если геометрия жесткого диска и так не соответствует реальной, то какая уже разница, как производить трансляцию — лишь бы она позволяла обратиться к большему количеству блоков на диске.
Для того, чтобы использовать большее поддерживаемое количество головок, был разработан метод трансляции, названный LBA (Logical Block Addressing) — логическая блочная адресация. При такой адресации реальная геометрия диска с большим количеством цилиндров и секторов, заменяется виртуальной, при которой полагается, что у диска меньше цилиндров, но больше головок. Естественно, такая адресация не соответствует реальной геометрии, впрочем, в этом и нет острой необходимости, главное, что теперь можно в рамках рассмотренной системы координат обратиться к большему количеству блоков. Фактически необходим способ перенумеровать блоки для того, чтобы к ним обращаться, и трансляция LBA призвана решить эту проблему. Для того, чтобы трансляция LBA работала, и диск, и BIOS контроллера должны ее поддерживать. Так как количество поддерживаемых головок увеличилось в 16 раз, то и максимальный объем диска, поддерживаемый новой трансляцией стал в 16 раз больше: примерно 8,3 Гбайт. С одной стороны это большой шаг вперед относительно CSH, с другой стороны и такого объема сегодня мало. Но дальнейшее увеличение количества цилиндров, головок и секторов невозможно: дальнейшее обращение к жесткому диску в режиме LBA уже не поддерживает сам BIOS. Но тем не менее выход есть: обращение к цилиндрам выше 1024 обеспечивается средствами самих операционных систем.
Основной вывод: сегодня применяется только трансляция LBA, а когда объем диска выходит за рамки допустимых 8,3 Гбайт, то обращение к остальным цилиндрам производится самой операционной системой. Когда Вы встретитесь с некоторыми диагностическими утилитами для работы с жесткими дисками, Вы обнаружите, что те утилиты, которые работают через BIOS, «видят» только 8,3 Гбайт Вашего жесткого диска, а те утилиты, которые работают напрямую с оборудованием, нормально обращаются ко всему объему жесткого диска.
Hard Disk Drive Basics — NTFS.com
Жесткий диск — это запечатанный блок, содержащий несколько пластин в стеке. Жесткие диски могут быть установлены в горизонтальном или вертикальном положении. В этом описании жесткий диск установлен горизонтально.
Электромагнитные головки чтения/записи расположены над и под каждой пластиной. Когда пластины вращаются, приводные головки перемещаются к центральной поверхности и выдвигаются к краю. Таким образом, приводные головки могут достигать всей поверхности каждого диска.
Создание дорожек
На жестком диске данные хранятся тонкими концентрическими полосами. Головка привода, находясь в одном положении, может читать или записывать кольцевое кольцо или полосу, называемую дорожкой. На 3,5-дюймовом жестком диске может быть более тысячи дорожек. Секции внутри каждой дорожки называются секторами. Сектор — это наименьшая физическая единица хранения на диске, и почти всегда его размер составляет 512 байт (0,5 КБ).
На рисунке ниже показан жесткий диск с двумя пластинами.
Части жесткого диска
Структура старых жестких дисков (т. е. до Windows 95) будет относиться к обозначению цилиндр/головка/сектор. Цилиндр формируется, когда все приводные головки находятся в одном и том же положении на диске.
Гусеницы, уложенные друг на друга, образуют цилиндр. Эта схема постепенно устраняется с современными жесткими дисками. Во всех новых дисках используется коэффициент перевода, чтобы их фактическая аппаратная компоновка выглядела непрерывной, поскольку именно так операционные системы из Windows 95 вперед нравится работать.
Для операционной системы компьютера дорожки имеют скорее логическую, чем физическую структуру, и устанавливаются при низкоуровневом форматировании диска. Дорожки нумеруются, начиная с 0 (крайний край диска) и заканчивая дорожкой с наибольшим номером, обычно 1023 (ближе к центру). Точно так же на жестком диске имеется 1024 цилиндра (пронумерованных от 0 до 1023).
Стопка тарелок вращается с постоянной скоростью. Головка привода, расположенная близко к центру диска, считывает данные с поверхности, которая проходит медленнее, чем поверхность на внешних краях диска.
Чтобы компенсировать эту физическую разницу, дорожки рядом с внешней стороной диска менее плотно заполнены данными, чем дорожки ближе к центру диска. Результатом разной плотности данных является то, что один и тот же объем данных может быть прочитан за один и тот же период времени при любом положении головки привода.
Дисковое пространство заполняется данными по стандартному плану. Одна сторона одной пластины содержит пространство, зарезервированное для информации о позиционировании аппаратных дорожек, и недоступное для операционной системы. Таким образом, дисковая сборка, содержащая две пластины, имеет три стороны, доступные для данных. Данные о позиционировании трека записываются на диск во время сборки на заводе. Контроллер системного диска считывает эти данные, чтобы поместить головки дисков в правильное положение сектора.
Секторы и кластеры
Сектор, являющийся наименьшей физической единицей хранения на диске, почти всегда имеет размер 512 байт, поскольку 512 — это степень числа 2 (2 в степени 9). Число 2 используется потому, что в самых основных компьютерных языках есть два состояния — включено и выключено.
Каждый сектор диска помечен с использованием заводских данных позиционирования дорожек. Данные идентификации сектора записываются в область непосредственно перед содержимым сектора и идентифицируют начальный адрес сектора.
Оптимальный способ хранения файла на диске — непрерывная серия, т. е. все данные в потоке хранятся встык в одной строке. Поскольку размер многих файлов превышает 512 байт, файловая система сама должна выделить сектора для хранения данных файла. Например, если размер файла составляет 800 байт, для файла выделяется два сектора по 512 КБ. 3). Единственное нечетное число a секторов, из которых может состоять кластер, равно 1. Это не может быть 5 секторов или четное число, которое не является показателем степени 2. Это не будет 10 секторов, но может быть 8 или 16 секторов.
Они называются кластерами, потому что пространство зарезервировано для содержимого данных. Этот процесс защищает сохраненные данные от перезаписи. Позже, если данные добавляются к файлу и его размер увеличивается до 1600 байт, выделяются еще два кластера, сохраняя весь файл в четырех кластерах.
Если непрерывные кластеры недоступны (кластеры, расположенные рядом друг с другом на диске), вторые два кластера могут быть записаны в другом месте на том же диске или в пределах того же цилиндра или на другом цилиндре — везде, где файловая система находит два доступных сектора.
Файл, хранящийся несмежным образом, считается фрагментированным. Фрагментация может снизить производительность системы, если файловая система должна направлять головки дисков по нескольким разным адресам, чтобы найти все данные в файле, который вы хотите прочитать. Дополнительное время, затрачиваемое головками на перемещение по ряду адресов, приводит к задержке перед получением всего файла.
Размер кластера можно изменить для оптимизации хранения файлов. Больший размер кластера снижает вероятность фрагментации, но увеличивает вероятность того, что в кластере останется неиспользуемое пространство. Использование кластеров размером более одного сектора уменьшает фрагментацию и уменьшает объем дискового пространства, необходимого для хранения информации об используемых и неиспользуемых областях на диске.
Большинство дисков, используемых сегодня в персональных компьютерах, вращаются с постоянной угловой скоростью. Дорожки ближе к внешней стороне диска менее плотно заполнены данными, чем дорожки ближе к центру диска. Таким образом, фиксированный объем данных может быть прочитан за постоянный период времени, даже несмотря на то, что скорость поверхности диска выше на дорожках, расположенных дальше от центра диска.
Современные диски резервируют одну сторону одной пластины для информации о расположении дорожек, которая записывается на диск на заводе во время сборки диска.
Недоступно для операционной системы. Контроллер диска использует эту информацию для точной настройки расположения головок, когда головки перемещаются в другое место на диске. Когда сторона содержит информацию о положении дорожки, эта сторона не может использоваться для данных. Таким образом, дисковая сборка, содержащая две пластины, имеет три стороны, доступные для данных.
Технология жестких дисков — класс Mackenzie +A
|