Здоровье - правильное питание

Вкусно, полезно, эффективно!
 

RAID-масив. Що це? Навіщо? І як створити?

RAID-масив. Що це? Навіщо? І як створити? RAID-масив

За довгі десятиліття розвитку комп'ютерної індустрії кошти зберігання інформації для ЕОМ пройшли серйозний еволюційний шлях розвитку. Перфострічки і перфокарти, магнітні стрічки і барабани, магнітні, оптичні і магніто-оптичні диски, напівпровідникові накопичувачі - це лише короткий перелік вже випробуваних технологій. Зараз в лабораторіях світу робляться спроби створення голографічних і квантових накопичувачів, які дозволять багаторазово підвищити щільність запису і надійність її зберігання.

Поки ж найбільш поширеним засобом зберігання інформації в персональному комп'ютері вже тривалий час залишаються жорсткі диски. Інакше їх можуть називати НЖМД (накопичувачі на жорстких магнітних дисках), вінчестерами, хард-дисками, але суть від зміни назви не змінюється - це накопичувачі з пакетом магнітних дисків в єдиному корпусі.

Перший жорсткий диск, що називався IBM 350, був зібраний 10 січня 1955 року в лабораторії американської компанії IBM. При розмірі з хороший шафа і вазі в тонну цей вінчестер вміщував п'ять мегабайт інформації. З сучасної точки зору подібний обсяг навіть смішним назвати не можна, проте під час масового використання перфокарт і магнітних стрічок з послідовним доступом це був колосальний технологічний прорив.

Вивантаження першого жорсткого диска IBM 350 з літака

З того дня минуло менше шести десятків років, але зараз нікого не здивуєш жорстким диском вагою менше двохсот грам, довжиною десять сантиметрів і об'ємом інформації в пару терабайт. При цьому принципово технологія записи, збереження і зчитування даних нічим не відрізняється від застосовуваної в IBM 350 - ті ж магнітні пластини і ковзаючі над ними головки читання / запису.

При цьому принципово технологія записи, збереження і зчитування даних нічим не відрізняється від застосовуваної в IBM 350 - ті ж магнітні пластини і ковзаючі над ними головки читання / запису

Еволюція вінчестерів на тлі дюймової лінійки (фото з " Вікіпедії ")

На жаль, саме особливості цієї технології служать причиною виникнення двох основних проблем, які пов'язані з використанням жорстких дисків. Першою з них є занадто низька швидкість запису, читання і передачі інформації від диска до процесора. У сучасному комп'ютері саме вінчестер є повільним пристроєм, найчастіше визначальним продуктивність всієї системи в цілому.

Друга проблема - недостатня захищеність інформації, що зберігається на жорсткому диску інформації. При поломці вінчестера ви можете безповоротно втратити всі дані, які на ньому зберігалися. І добре, якщо втрати обмежаться втратою сімейного фотоальбому (хоча і в цьому хорошого насправді мало). Знищення ж важливою фінансової та маркетингової інформації може виявитися причиною краху бізнесу.

Частково допомагає захистити збережену інформацію регулярне резервне копіювання (бекапірованіе) всіх або тільки важливих даних на вінчестері. Але і в цьому випадку при його поломки буде втрачена та частина даних, яка була оновлена ​​з моменту останнього бекапа.

На щастя, існують методи, які допомагають усунути зазначені вище недоліки традиційних жорстких дисків. Одним з таких методів є створення RAID - масивів з декількох вінчестерів.

Що таке RAID

В Інтернеті і навіть сучасної комп'ютерної літературі нерідко можна зустріти термін "RAID-масив", що фактично є тавтологією, так як абревіатура RAID (redundant array of independent disks) вже розшифровується як "надлишковий масив незалежних дисків".

У назві повністю розкривається фізичний зміст таких масивів - це набір з двох і більш жорстких дисків. Спільна робота цих дисків управляється спеціальним контролером. В результаті роботи контролера такі масиви сприймаються операційною системою як один жорсткий диск і користувач може не замислюватися над нюансами управління роботою кожного вінчестера окремо.

Існує кілька основних типів RAID, кожен з яких по-різному впливає на сумарну надійність і швидкість роботи масиву в порівнянні з одиночними дисками. Позначаються вони умовним номером від 0 до 6. Таке позначення з докладним описом архітектури та принципу роботи масивів було запропоновано фахівцями Каліфорнійського університету в Берклі. Крім основних семи типів RAID можливі і різні їх поєднання. Розглянемо їх далі.

RAID 0

Це найпростіший тип масиву жорстких дисків, основним призначенням якого є підвищення продуктивності дискової підсистеми комп'ютера. Досягається це шляхом поділу потоків записується (зчитується) інформації на кілька підпотоків, які одночасно пишуться (зчитуються) на кілька вінчестерів. В результаті сумарна швидкість обміну інформацією, наприклад, для дводискових масивів зростає на 30-50% в порівнянні з одним жорстким диском того ж типу.

В результаті сумарна швидкість обміну інформацією, наприклад, для дводискових масивів зростає на 30-50% в порівнянні з одним жорстким диском того ж типу

Загальний обсяг RAID 0 дорівнює сумі обсягів включених в нього вінчестерів. Розбиття інформації виконується на блоки даних фіксованої довжини, незалежно від довжини записуваних файлів.

Основною перевагою RAID 0 є істотний приріст швидкості обміну інформацією між дискової системою без втрати корисного об'єму жорстких дисків. Недолік - зниження загальної надійності системи зберігання. При виході з ладу будь-якого з дисків RAID 0 безповоротно пропадає вся записана в масиві інформація.

RAID 1

Подібно розглянутому вище, цей тип масивів також є найпростішим в організації. Будується він на основі двох вінчестерів, кожен з яких є точним (дзеркальним) відображенням іншого. Інформація паралельно записується на обидва диска в масиві. Читання даних відбувається одночасно з обох дисків послідовними блоками (розпаралелювання запитів), за рахунок чого досягається деяке підвищення швидкості читання в порівнянні з одним жорстким диском.

Загальний обсяг RAID 1 дорівнює обсягу меншого з вхідних в масив жорстких дисків.

Переваги RAID 1: висока надійність зберігання інформації (дані неушкоджені, поки цілий хоча б один з вхідних в масив дисків) і деякий приріст швидкості читання. Недолік - купуючи два жорсткі диски, ви отримуєте корисний об'єм тільки одного. Незважаючи на втрату половини корисного об'єму, "дзеркальні" масиви досить популярні через високу надійності і відносно малою вартості - пара дисків все ж дешевше, ніж чотири або вісім.

RAID 2

При побудові цих масивів використовується алгоритм відновлення інформації за допомогою кодів Хеммінга (американський інженер, який розробив цей алгоритм в 1950 році для корекції помилок при роботі електромеханічних обчислювачів). Для забезпечення роботи цього RAID контролером створюються дві групи дисків - одна для зберігання даних, друга група для зберігання кодів корекції помилок.

Подібний тип RAID отримав мале поширення в домашніх системах через надмірну надмірності кількості жорстких дисків - так, в масиві з семи жорстких дисків під дані будуть відведені лише чотири. При зростанні кількості дисків надмірність знижується, що відображено в наведеній таблиці.

Основною перевагою RAID 2 є можливість корекції виникаючих помилок "на льоту" без зниження швидкості обміну даними між дисковим масивом і центральним процесором.

RAID 3 і RAID 4

Ці два типи дискових масивів дуже схожі за схемою побудови. В обох для зберігання інформації використовується кілька жорстких дисків, один з яких використовується виключно для розміщення контрольних сум. Для створення RAID 3 і RAID 4 досить трьох вінчестерів. На відміну від RAID 2 відновлення даних "на льоту" неможливо - інформація відновлюється після заміни вийшов з ладу жорсткого диска протягом деякого часу.

Різниця між RAID 3 і RAID 4 полягає в рівні розбиття даних. У RAID 3 інформація розбивається на окремі байти, що призводить до серйозного уповільнення при записі / зчитуванні великої кількості дрібних файлів. У RAID 4 відбувається розбиття даних на окремі блоки, розмір яких не перевищує розмір одного сектора на диску. В результаті підвищується швидкість обробки невеликих файлів, що критично для персональних комп'ютерів. З цієї причини RAID 4 набув більшого поширення.

Істотним недоліком розглянутих масивів є підвищене навантаження на жорсткий диск, призначений для зберігання контрольних сум, що істотно знижує його ресурс.

RAID 5

Дискові масиви цього типу фактично є розвитком схеми RAID 3 / RAID 4. Відмінною особливістю є те, що для зберігання контрольних сум не використовується окремий диск - вони рівномірно розподіляються по всьому жорстких дисків масиву. Результатом розподілу стала можливість паралельного запису на кілька дисків відразу, що трохи підвищує швидкість обміну даними в порівнянні з RAID 3 або RAID 4. Однак це підвищення не настільки істотно, тому що витрачаються додаткові ресурси системи на обчислення контрольних сум операцією "виключає або". У той же час швидкість читання зростає значно, так як можливо просте розпаралелювання процесу.

Мінімальна кількість жорстких дисків для побудови RAID 5 - три.

Масиви, побудовані за схемою RAID 5, мають досить істотний недолік. При виході з ладу будь-якого диска після його заміни необхідно кілька годин на повне відновлення інформації. В цей час неушкоджені жорсткі диски масиву працюють в сверхинтенсивного режимі, що істотно підвищує ймовірність виходу з ладу другого диска і повної втрати інформації. Хоч і рідко, але подібне відбувається. Крім того, під час відновлення цілісності RAID 5 масив майже повністю зайнятий цим процесом і поточні операції запису / читання виконуються з великими затримками. Якщо для більшості звичайних користувачів це не критично, то в корпоративному секторі такі затримки можуть призвести до певних фінансових втрат.

RAID 6

Значною мірою зазначену вище проблему вирішує побудова масивів за схемою RAID 6. У цих структурах під зберігання контрольних сум, які також циклічно і рівномірно розносяться на різні диски, виділяється обсяг пам'яті, що дорівнює об'єму двох жорстких дисків. Замість однієї обчислюються дві контрольні суми, що гарантує цілісність даних при одночасному виході з ладу відразу двох вінчестерів в масиві.

Переваги RAID 6 - високий ступінь захищеності інформації та менше, ніж в RAID 5, падіння продуктивності в процесі відновлення даних при заміні пошкодженого диска.

Недолік RAID 6 - зниження загальної швидкості обміну даними приблизно на 10% через збільшення обсягу необхідних обчислень контрольних сум, а також через зростання обсягу записуваної / зчитує інформацію.

Комбіновані типи RAID

Крім розглянутих вище основних типів широко застосовуються різні їх комбінації, які компенсують ті чи інші недоліки простих RAID. Зокрема, широко поширене використання схем RAID 10 і RAID 0 + 1. У першому випадку пару дзеркальних масивів об'єднують в RAID 0, у другому навпаки - два RAID 0, об'єднують в дзеркало. І в тому і в іншому випадку до захищеності інформації RAID 1 додається підвищена продуктивність RAID 0.

Нерідко з метою підвищення рівня захисту важливої ​​інформації використовуються схеми побудови RAID 51 або RAID 61 - віддзеркалення і так високо захищених масивів забезпечує виняткову збереження даних при будь-яких збоях. Однак в домашніх умовах такі масиви реалізовувати недоцільно через надмірну надмірності.

Побудова масиву дисків - від теорії до практики

Побудовою та управлінням роботою будь-якого RAID займається спеціалізований RAID-контролер. На превеликий полегшенню рядового користувача персонального комп'ютера, в більшості сучасних материнських плат ці контролери вже реалізуються на рівні південного моста чіпсета. Так що для побудови масиву жорстких дисків досить потурбуватися придбанням необхідної їх кількості та визначення бажаного типу RAID у відповідному розділі настройки BIOS. Після цього в системі замість декількох жорстких дисків ви побачите тільки один, який вже за бажанням можна розбивати на розділи і логічні диски. Врахуйте, що тим, хто ще користується ОС Windows XP, знадобиться встановити додатковий драйвер.

Зовнішній RAID-контролер c чотирма портами SATA

Відзначимо, що інтегровані контролери, як правило, здатні створити RAID 0, RAID 1 і їх поєднання. Для створення більш складних масивів все ж буде потрібно придбання окремого контролера.

І наостанок ще одна порада - для створення RAID купуйте жорсткі диски однакового обсягу, одного виробника, однієї моделі і бажано з однієї партії. Тоді вони будуть оснащені однаковими наборами логіки і робота масиву цих жорстких дисків буде найбільш стабільною.

Що це?
Навіщо?
І як створити?