سیستمهای ذخیره سازی داده (۲)

با توجه به پیشرفت فناوریها بخصوص در زمینه سیستمهای دیجیتال برای به روز بودن مقالات

و با توجه به درگیریها و مشغله روزانه تا جایی که ممکن باشد برای تکمیل مقالات گذشته اقدام می کنم.

RAID TP

این مدل از RAID مشابه مدلهای ۵ و ۶ می باشد که در مقاله سیستمهای ذخیره سازی داده (1) به آنها اشاره گردید، یعنی داده ها روی درایوهای متفاوت تقسیم می شوند با این تفاوت که در این نوع از RAID، عملیات محاسبه برای سه پریتی انجام می پذیرد و بر روی سه درایو مجزا ذخیره می گردد.

                    RAID TP

RAID TP از یک معادله مستقل برای محاسبه هر پریتی استفاده می نماید که بازسازی داده ها را هنگامیکه سه دیسک همزمان دچار مشکل شوند، امکانپذیر می سازد و با این فرآیند یک لایه اضافی امنیتی برای محافظت از داده های شما فراهم می سازد.

موارد استفاده:

۱- ذخیره سازی در طیف وسیع

۲- BackUp گیری از یک دیسک بر روی دیسک دیگر

۳- افزایش کارایی در سیسیتمها و برنامه های HD Video Streaming

۴- نسخه گیری پشتیبان و آرشیو محتوای ثابت ( Fixed Content BackUp)

۵- بازیابی مشکلات ذخیره سازی

لازم به ذکر است در حالت کمینه یا حداقل این روش RAID نیاز به ۴ دیسک دارد.

سیستمهای ذخیره سازی داده (۱)


با افزایش حجم اطلاعات رایانه ای در عصر حاضر، شاهد مشکلات ناشی از ذخیره نامناسب داده های با حجم بالا، عدم سرعت برای دسترسی مجدد و عدم مدیریت مناسب آنها می باشیم. از اینرو روشهای متفاوت ذخیره داده ها از طرف شرکتهای متفاوتی ارائه می شود که این روشها پس از بررسی در سازمانهای معتبر جهانی به عنوان استاندارد به کاربران جهانی ارائه می شود.

متداولترین و ساده ترین روش ذخیره داده ها ، در حال حاضر
RAID: Redundant Array of Independent Drives
می باشد و در صورتیکه سخت افزار شما آنرا پشتیبانی نماید، حتی در
PC های خانگی نیز قابل اجراست.

RAID را به سادگی میتوان نحوه ساماندهی به چگونگی ذخیره داده ها بر روی مجموعه ای از دیسکهای سخت ، تعریف نمود.

استفاده از RAID مزایای زیر را فراهم می آورد:

1-      افزایش حجم ذخیره سازی بدون خرید دیسکهای با حجم بالا و بار مالی زیاد

2-      دسترسی سریعتر به داده ها با توجه به نوع پیاده سازی

3-      قابلیت افزایش اطمینان بقای داده ها یا Availability

4-      امکان بازیابی داده های از بین رفته و جایگزینی آن بطور اتوماتیک

5-      دسترسی کاربران متعدد به داده ها بطور همزمان

 

یک سیستم RAID شامل مجموعه ای از دیسکهای سخت برای ذخیره داده ها ، کنترلرهایی که با مدیریت نرم افزار وظیفه پردازش داده ها و تقسیم آنها را بین دیسکها بر عهده دارند، کابلها، سیستمهای خنک کننده و... می باشد.

در ادامه به معرفی انواع RAID و توضیح مختصری از هر کدام می پردازیم:

 

JBOD : Just a Bunch Of Disks

از دو یا چند دیسک تشکیل می شود که می توانند دارای حجمهای متفاوتی باشند و هنگام ذخیره داده بترتیب از دیسک اول تا آخرین دیسک شروع به پر شدن می نمایند. حجم حافظه کل روی این مجموعه برابر با حجم تمامی دیسکهای موجود می باشد. این مجموعه هیچ فرقی از نظر افزایش سرعت دسترسی یا تامین بقای داده با یک دیسک تنها ندارد.

موارد استفاده این روش زمانی است که بخواهیم از دیسکهای کوچکی که استفاده چندانی ندارند، حجم مناسبی از حافظه بسازیم و یا دارای حافظه ای با مدیریت ساده باشیم که در آن تمامی دیسکها مثل یک دیسک واحد دیده شوند.

 

RAID 0

در این نوع RAID هر داده به تعداد دیسکها تقسیم شده و بطور موازی روی تمام دیسکها نوشته می شود. به این پردازش Striping یا ریز کردن داده گفته می شود. این روش باعث می شود تا سرعت دسترسی به داده ها بالا رود چرا که وقتی یک داده از روی n دیسک همزمان خوانده میشود زمان خوانده شدن به میزان 1/n کاهش می یابد ، اما تامین بقای داده ها پایین می آید چون اگر یکی از دیسکها دچار مشکل شود، تمامی اطلاعات از بین خواهد رفت به همین دلیل این نوع RAID برای مواردی که داده ها قابلیت تولید مجدد ندارند یا برای سیستمهای دارای شرایط بحرانی توصیه نمی شود.

این نوع RAID دارای دو یا چند دیسک با حجم مساوی است که حجم نهایی از مجموع تمامی دیسکها بدست می آید.

این نوع RAID برای شرایط زیر مناسب می باشد:

1-      برای ذخیره کتابخانه های تصاویر یا کتابخانه های برنامه های در حال اجرا چرا که یک نسخه پشتیبان روی مدیای دیگر وجود دارد.

2-   برای ذخیره جداول بسیار بزرگ و یا داده های فقط خواندنی برای برنامه هایی که نیاز به دسترسی سریع به داده ها دارند و امکان تهیه یک نسخه پشتیبان برای زمان بروز خطا وجود دارد.

3-      وارد کردن اطلاعات از منابع خارجی با نرخ انتقال داده بسیار بالا

 

و برای برنامه هایی که لیستی از درخواستها (Sequential Requests) را برای مقادیر کوچک داده ایجاد می نمایند یا لیستی از درخواستهای همزمان (Synchronous Random Requests) برای داده های کوچک میسازند، که بیشترین زمان را برای گردش دیسک و I/O ها صرف مینمایند، مناسب نمی باشد.

 


RAID 1

در این نوع RAID هر داده به تعداد دیسکها کپی میشود تا هم سرعت دسترسی و هم تامین بقای داده در سطح بالا فراهم گردد. این پردازش را فرآیند آینه ای یا Mirroring می نامند. اگر در این حالت یک دیسک از بین برود کنترل کننده RAID درخواستها را به اعضای دیگر RAID ارجاع می دهد.

این نوع RAID برای شرایطی که بقای داده ها در سطح بالا با نرخ دسترسی بالا مورد نظر باشد و هزینه حافظه در درجه دوم اهمیت باشد، مناسب است.


RAID 3

در این روش داده ها به بخشهایی تقسیم میشوند، بیت توازن یا Parity محاسبه میشود ، داده ها بطور موازی در دیسکهای مختلف و بیت توازن در یک دیسک مجزا نوشته می شوند. این پردازش را Striping with Parity می نامند. دیسک Parity اطلاعات اضافی درباره داده های سایر دیسکها ذخیره می سازد. اگر یکی از دیسکها دچار مشکل شود، بیت توازن با کمک داده های دیگر دیسکها اطلاعات دیسک خراب را بازسازی می نماید. ریز کردن داده ها نرخ دسترسی بالا و بیت توازن بقای داده مناسبی را برای RAID 3 فراهم می آورد. اما نوشته شدن تمامی بیتهای توازن روی یک دیسک گلوگاهی دائمی برای این روش محسوب می گردد.

RAID 3 از دو یا چند دیسک برای داده ها و یک دیسک برای بیت توازن تشکیل می شود. حجم نهایی این روش از مجموع دیسکهای داده بدون محاسبه دیسک Parity بدست می آید.

RAID 3 برای برنامه هایی که دارای درخواستهای ترتیبی برای داده های با حجم بالا هستند، مثل پردازش تصاویر ویدئویی یا گرافیکی و یا فایلهای CAD/CAM مناسب و بطور متمایز دارای کارایی عالی برای برنامه های متمرکز انتقال داده و نه برنامه های متمرکز برای درخواستهای I/O می باشد.

 

RAID 5

در این روش نیز مثل  RAID 3داده ها به بخشهایی تقسیم میشوند، بیت توازن یا Parity محاسبه میشود ،  اما داده ها و Parity بطور موازی در دیسکهای مختلف نوشته می شوند. گلوگاه مربوط به نوشته شدن بیتهای توازن روی یک دیسک در این نوع RAID از بین رفته است.

 محاسبه بیت توازن از  XORداده های معمولی بدست می آید و در صورت بروز خطا با عکس این رابطه میتوان داده از دست رفته را محاسبه کرد.

RAID 5 از دو یا چند دیسک برای داده ها و یک دیسک برای بیت توازن تشکیل می شود. حجم نهایی این روش از مجموع دیسکهای داده بدون محاسبه دیسک Parity (گرچه بیت توازن در تمامی دیسکها پخش شده است) بدست می آید.

RAID 5 برای استفاده در حالتهایی که داده ها دارای مشخصات زیر باشند، مناسب است:

1-    داده ها دارای ارزش نگهداری هستند اما نه به اهمیت RAID 1

2-      نرخ خواندن داده بالا

3-      نسبت نوشتن داده ها به خواندن آنها کم باشد.

 


RAID 6

این نوع RAID همان RAID 5 می باشد با این تفاوت که پس از تقسیم داده ها، محاسبه دو بیت توازن انجام می پذیرد و دو دیسک برای Parity باید در نظر گرفته شود. با این کار اگر دو دیسک از مجموع دیسکهای RAID دچار مشکل شود باز هم سیستم به کار خود ادامه خواهد داد.

این روش برای شرایطی مورد استفاده قرار می گیرد که بقای داده ها در بالاترین حد مورد نیاز باشد.

 
ترکیب انواع RAID

سطوح مختلف RAID را میتوان به صورتهای زیر ترکیب نمود:

RAID 0+1 همان RAID 1 است که دارای اعضای متشکل از RAID 0 می باشد.



RAID 1+0
همان RAID 0 است که دارای اعضای متشکل از RAID 1 می باشد.



RAID 5+0
همان RAID 0 است که دارای اعضای متشکل از RAID 5 می باشد.

 

دیسکهای یدکی Hot Spare Disks

دیسکهای اضافی یا یدکی ، دیسکهایی هستند که روی سیستم نصب می شوند اما تا زمانیکه یکی از اعضای زیر بار RAID دچار مشکل نشده باشد استفاده نمی شود. وقتی یکی از دیسکهای RAID به هر دلیلی خراب شود یا از مدار خارج گردد، با این دیسک بدون مداخله کاربر جایگزین می گردد.

 

 

معرفی و مشخصات مدیاهای آرشیو نوار - بخش سوم

بخش سوم معرفی کامل مدیای LTO

بحث آرشیو در هر شرکت ، سازمان یا ارگانی برای نگهداری سوابق و اطلاعات آن مجموعه لازم و ضروری مینماید. در سازمانها یا شبکه های تلویزیونی حفظ و نگهداری اطلاعاتی از قبیل متن ، صدا و تصویر مربوط به رویدادها و برنامه ها همواره امری حیاتی است و با توجه به اینکه معاونت سیاسی سازمان برای بحث آرشیو خود داخل تجهیزات نیوزروم مدیای LTO را در نظر گرفته و تجهیزات این مدیا را خریداری و نصب نموده است، در ادامه به معرفی کامل مدیای LTO می پردازیم:

معرفی فرمت LTO

فرمتهای LTO برای کارایی بهینه با ضریب اطمینان، قابلیت و حجم بالا برای کاربری بطور تنها یا استفاده در محیطهای اتوماتیک طراحی شده است.فرمت اولتریوم LTO از یک نوار کارتریج تک قرقره نیم اینچی برای ایجاد حجم بیشتر حافظه استفاده می نماید که ایده آل برای برنامه های پشتیبانی (Back Up) ، بازیابی (Restore) و آرشیو می باشد. علاوه بر آن ارایه دهندگان این فرمت در نظر دارند تا بزودی مشخصه WORM را ( مشخصه یکبار نوشتن و بارها خواندن) که مخصوص محصولات آرشیوی است ،در محصولاتشان اضافه نمایند .(Write Once , Read Many)

قصد این فرمت این است که نیازهای آینده کاربران تک سروری و کاربران دارای چند سرور و محیطهای با ساختارهای پیچیده را پیش بینی کرده و در یک مسیر پیشرفت قابل توسعه، طی یک دهه آنها را براورده سازد.
نسل اول فرمت اولتریوم از سال 2000 وارد بازار گردید ، نسل دوم تقریبا از سال 2002 به بازار آمد و حال مجوزهای نسل سوم از 26 جولای 2004 ارایه گردیده و محصولات آن نیز تا اواخر 2004 و اوایل 2005 به بازار خواهد آمد . نسل چهارم نیز تا سال 2006 ارایه شده و به بازار می آید. تفاوت نسلهای LTO در حجم و سرعت انتقال اطلاعات می باشد، بطور کلی انتظار میرود در هر نسل حجم اطلاعات قابل ذخیره روی هر کارتریج و سرعت انتقال اطلاعات دو برابر گردد.
نسل اول فرمت اولتریوم دارای حجم ذخیره سازی 100MB و نرخ انتقال اطلاعات تا 20 MB/s بود در حالیکه این آمار در نسل سوم به حجم 400MB و سرعت 80MB/s رسیده است .نسل سوم توانایی خواندن کارتریجهای هر دو نسل قبلی و نوشتن روی کارتریجهای نسل دوم را نیز دارا میباشد.

خصوصیات این فرمت برای تطبیق دادن تعدادی از فناوریهای متفاوت و عمده که در حال حاضر استفاده می شود ، طراحی گردیده است . هسته ضبط فرمت LTO را ضبط چند کاناله خطی بطور مارپیچ تشکیل می دهد که موازنه ای بهینه را بین اطمینان پذیری و جامعیت اطلاعات با کارایی و حجم بالا برقرار می سازد . در این فرمت داده ها در طول نوار نوشته می شوند . فرمت اولتریوم 768 شیار در هر اینچ و یا 384 شیار (Track) در نیم اینچ پهنای نوار را می نویسد. در ضمن این فرمت ضبط دارای خاصیت مارپیچ می باشد . مکانیسم ضبط برای خواندن تمامی 100 GB حجم کارتریج ، عبور چندباره از ابتدای نوار ( Beginning Of the Tape=BOT ) تا انتهای نوار ( End Of the Tape=EOT ) و بازگشت به BOT را ناگزیر می سازد . 384 شیار روی نوار به 4 باند که هر کدام 96 شیار دارند تقسیم می گردد . داده ها برای ایجاد محافظت بیشتر ، ابتدا در مرکز که پایدارترین بخش فیزیکی نوار می باشد و روی داخلی ترین باند نوشته می شوند . در هر بار عبور از طول نوار و یا بازگشت ، 8 شیار بطور همزمان نوشته و خوانده می شوند .

 

پایه فناوری LTO


طبق طراحی این فرمت، پهنای کامل نوار به چهار بخش تقسیم می گردد که باند داده (Data Band) نامیده می شود که هر کدام دارای 96 شیار (Track) می باشند.

 


هد دستگاه کارتریج خوان (Tape Reader Head) محدوده هر باند داده را روی نوار تشخیص داده و بترتیب آنها را پر می کند. بالا و پایین هر باند داده را یک باند کنترلی (Servo Band) پوشش می دهد که اطلاعات مکان نوشتن هد یا شیارهایی را که داخل آن باند داده می باشد ، نگه می دارد.

 


پردازش مکان هد روی نوار از اثر متقابل بین هد ، نوار و اجزای کنترلی بدست می آید. ابتدا باندهای داده نوشته می شوند تا داده ها در بخش پایدارتر نوار ضبط گردند و بترتیب باندهای کناری شروع به ضبط شدن می نمایند. برای تامین امنیت اطلاعات ضبط شده روی باندهای بیرونی دو باند خالی که باند محافظ لبه(Edge Guard Band) نامیده می شوند، در بیرونی ترین لبه، مرز نوار را تشکیل می دهند.

 

پردازش مکان هد روی نوار از اثر متقابل بین هد، نوار و اجزای کنترلی بدست می آید. حرکت هد توسط یک سیستم کنترلی (Servo System) که از اطلاعات کد شده روی باندهای کنترلی بالا و پایین هر باند داده استفاده می کند،‌ کنترل می گردد. باندهای کنترلی هنگامی که کارتریج ساخته می شود ، روی آن نوشته می شوند و هر دو باند کنترلی همزمان استفاده می شوند تا دو منبع اطلاعات کنترلی در اختیار باشد. این باعث افزایش دقت محل قرار گرفتن هد و کم شدن امکان بروز خطا در صورت خرابی در بخشی از باند کنترلی می باشد.

 

در طراحی نسل اول LTO ، هد دستگاه از هشت جزء تشکیل شده است.



در مثال زیر عملیات خواندن و نوشتن و عملکرد بخشهای مختلف نمایش داده می شود:

در طول عملیات نوشتن داده ها با یک هد هشت جزئی ، TS0 یا (Top Servo Zero) روی مکان کنترلی صفر قرار می گیرد و هشت جزء هد داده ها را در طول نوار روی شیارهای گروه اول (Servo Position Zero) می نویسند. با تشخیص نشانگر انتهای نوار توسط هد، TS1 یا (Top Servo One ) روی مکان کنترلی پنج قرار گرفته و شیارهای گروه دوم را در طول نوار و در جهت مخالف پر می کند.
پردازش نوشتن روی تمام طول نوار در یک جهت فقط چند دقیقه طول می کشد. در پایان این مرحله TS0 روی مکان کنترلی یک قرار می گیرد و باز طول نوار نوشته می شود بعد TS1 روی مکان چهارم قرار گرفته و به همین ترتیب تمامی شیارهای داده در عرض یک باند داده نوشته می شوند.

 

 

 

 

 

هد روی باند داده قرار می گیرد و اجزای نویسنده، داده ها را وقتی نوار از زیر آن حرکت می کند، در جهت حرکت نوار می نویسند. در انتهای هد بخشهای خواننده، داده ها را خوانده و درستی اطلاعات را چک می کنند و در صورت بروز خطا موارد را جلوتر روی نوار بازنویسی می نمایند. در شکل زیر اجزای نویسنده با رنگ زرد و خواننده با رنگ قرمز نمایش داده شده اند. جهت حرکت نوار به گونه ای است که از سمت اجزای زرد رنگ به زیر هد کشیده می شود.

 

 

 

در طول عملیات نوشتن روی نوار سیستم کنترل TS0 را روی مکان کنترلی صفر قرار می دهد تا اولین گروه شیارها نوشته شوند و به همین ترتیب وقتی نشانگر پایان نوار از مقابل هد می گذرد TS1 مقابل مکان کنترلی پنج قرار گرفته و این روال بطور گردشی بطرف داخل ادامه پیدا می کند.(مطابق شکلهای زیر) :

 

 

 

 


بین شیارهایی که داده ها در جهتهای مختلف روی آنها نوشته می شوند، فضاهایی وجود دارد که این فضاها برای به حداقل رسانیدن تداخل مغناطیسی بین شیارهای مجاوری که در جهت های متفاوت نوشته شده اند (Cross-Track Interference)، می باشند و آنها را بافر جهت (Direction Buffer) می نامند.

 



فناوری این طراحی تا حدی مبتنی بر سازگاری دوجهته و چند کاناله بودن فرمت خطی برای استفاده متداول در صنعت می باشد. تکنیکهای جدید و قوی تصحیح خطا و ساختار جدید هد برای تولید یک فرمت مناسب ترکیب شده اند که حجم ذخیره سازی بالای داده را با امکانات Ultrium و زمان دسترسی سریع به داده ها را با امکانات Accellis میسر می سازند.