Exastor انباره فایل در قرن ۲۱ - (۴)

  

راه حلهای ذخیره سازی قدیمی

بازار تجهیزات ذخیره سازی موجهای مختلفی را بخود دیده است. در این قسمت درباره راه حلهای ذخیره سازی رایج که امروزه استفاده میشوند، توضیح داده میشود. در این قسمت مزایا و معایب هر کدام از روشها را از منظر نیازهایی که در قسمت قبل عنوان شد مرور میکنیم:

DAS (Direct Attached Storage)

با وجود تمام کوششهایی که صنعت ذخیره سازهای شبکه ای انجام میگیرد تا به مشتریانی که ذخیره ساز را مستقیماً به سرور متصل میکنند آموزش دهند که این کار به مقرون به صرفه نمی باشد ولیکن تمام این کوششها همانند کابوس رام نشدنی می باشد. چرا این گونه است و هنوز DAS طرفداران زیادی دارد زیرا در حقیقت این روش دارای مزایای اندکی می باشد:

·         هزینه کم برای خریداری این سیستم.

·         ظاهراً روش راه اندازی ساده. کافیست یک سرور نصب شود و آرایه  RAID تنظیم و یک فایل سیستم ایجاد شود .

·         منحنی آموزش کوتاهی دارد و به مهارتهای مدیریتی استاندارد نیاز دارد.

از دید نیازهای جدید ذخیره سازی روش DAS بسیار نا مناسب است:   

حداقل استفاده از سخت افزار  

از آنجا که تقسیم بندی DAS بر اساس ملزومات یک سرور و برنامه خاص انجام میشود، از حداقل سخت افزار استفاده میکند. هر سرور یک تنظیم سخت افزاری ثابت دارد CPU، حافظه و پورتهای  HBA و  NIC، که فقط برای آن برنامه کاربردی خاص استفاده میشود. هر آرایه ذخیره ساز نیازهای مختلفی دارد و چرخه حیات مخصوص بخود را دارد به همین علت است که به سیستمهای  DAS عنوان جزایری از ذخیره ساز اطلاق میشود که منابع آن مابین سیستمها به اشتراک گذاشته نمیشود. بر اساس یک بررسی بصورت میانگین در UNIX فقط 56 در صد از حجم DAS و 75 درصد از حجم SAN استفاده میشود و همچنین در ویندوز 46 درصد از DAS و 56 درصد از حجم  SAN استفاده میشود. 

برای تعمیرات، سیستم مدتی از کار می افتد  

 DAS، دیسکهای سیستم عامل و دیتای کاربر و برنامه ها را در ارتباط با یکدیگر در یک سخت افزار قرار میدهد. اگرچه ممکن است اینها در دو مجموعه دیسک مجزا جدا شده باشند ولی توسط یک سرور مدیریت می شوند. تعمیرات سخت افزاری ذخیره ساز یا سرور و اعمال بسته های نرم افزار یا سیستم عامل و ارتقای آنها همه نیاز دارند تا سیستم برای مدتی از کار بیافتد (Downtime). در طی این مدت برنامه های کاربردی موجود بر روی آنها نیز از کار می افتند. ممکن است این زمانها غیر قابل پیش بینی باشند و کار سیستم در مدت زیادی دچار اختلال شود. 

برای آرشیو Online مناسب نمی باشد 

 DAS از نظر حجم و تعداد فایل بر روی یک فایل سیستم تکی محدودیت دارد، بنابراین برای آرشیو تکیه بر سیستم عاملهای همه منظوره نظیر ویندوز و لینوکس دارد. در  NTFS، فایل سیستم موجود در ویندوز، هنگامیکه از بلاکهای 4KB استفاده میکنیم از نظر حجم به 16 ترابایت و از نظر تعداد فایل به 268 میلیون فایل محدود هستیم. بدون افزایش سایز بلاکها، افزایش این مقدارها غیر ممکن است که در این صورت مقدار زیادی از فضای دیسک را هدر میدهد ( بیشتر از 93 در صد).

محدودیت مقیاس پذیری برای دیتاهای بدون ساختار 

 همانطور که در جدول 2 دیده میشود اندازه فایل در فایل سیستم های استاندارد ورای 2 تا 16 ترابایت نمی تواند باشد و همچنین بیشتر از 200 ملیون فایل نیز در آنها جا نمی گیرد. یک مرور سریع بر روی جدول 1 نشان میدهد که استفاده از فیلمهای HD تمام فایل سیستم را اشغال میکند.

Storage Area Networks (SAN)

یک روش بهبودیافته نسبت به DAS در اوایل 1990 به موفقیت رسید. در SAN آرایه های بزرگ ذخیره ساز از طریق ارتباطات FC یا iSCSI به کلاینت ها متصل میشوند. البته این ارتباط اصطلاحاً Block-Basedمی باشد. مزیت SAN ها را نسبت به DAS میتوان به این صورت بر شمرد:

·         عمل تخصیص فضا آسانتر صورت میگیرد

·         کارایی بالاتری دارد

·         یکپارچکی در زمینه کارهای مدیریتی دیتا را ایجاد میکند

با این وجود، از نظر ذخیره فایل، SAN ها در زمینه طراحی محدودیتهایی دارند:

·         راه حلی برای ذخیره فایل نیستند. 

     در اینجا  نمی توانید فایلها را مستقیماً ذخیره کنید، به این معنی که به یک فایل سیستم نیاز دارند.

·        مکانیزمی برای به اشتراک گذاری دیتا ندارد. 

     آرایه ها  به تنهایی نمیتوانند دیتا را به اشتراک گذارند، دسترسی فقط از طریق سروری که مالک فایل سیستم است امکانپذیر می باشد.

·        پیچیدگی مراحل تخصیص فضا. 

     کار تخصیص فضا در SAN  زحمت زیادی دارد، مراحلی بایستی طی شود: 

      تکه کردن دیسکها، بهم پیوستن تکه ها، ساختن گروههای RAID، ایجاد LUN های لایه بالا، نگاشت LUN ها برای کلاینتها و غیره.

·         بار مدیریتی زیاد در حجم های بالا. 

     مسائل بالا زمانیکه حجم افزایش می یابد بدتر  میشود بنابراین درک سیستم در این حالت برای یک مدیر سیستم به تنهایی مشکل است.


 اتلاف سخت افزار: سخت افزار نقطه اتکای راه حلهای مبتنی بر SAN است و به اجزای سخت افزاری زیادی نیاز دارد تا مساله چند مسیری و انبوهش پورت را با HBA ها و FC سوئیچ حل کند. اتلاف حجم نیز به میزان 25 تا 45 در صد در این حالت دیده میشود. 

برای تعمیرات سیستم مدتی از کار می افتد 

 با وجود اینکه آرایه های SAN در مقایسه با DAS ماجولار هستند، برای اعمال پچها و ارتقا فایل سرورها نیاز به زمانی دارند که از مدار خارج شوند. 

مقیاس پذیری محدود برای آرشیوهای Online و دیتاهای بدون ساختار 

 به علت محدودیتهای فایل سیستم، SAN ها در اینحالت برجستگی ویژه ای نسبت به DAS ها ندارند. بنابراین SAN ها راه حل بهینه ای برای بر طرف کردن نیازهای ذخیره سازی جدید ندارند، خیلی جای تعجب ندارد که رشد آنها در خلال سالهای 2005 تا 2010 رشد ملایم 4.1 درصدی را تجربه میکند در مقایسه با روش بهتر برای ذخیره سازی فایلها،NAS، که در همین مدت مشابه رشد 14.4 درصدی دارد.

Network Attached Storage (NAS)

به اشتراک گذاشتن فایلها بر روی شبکه از اوایل سال 1980 شروع شد، هنگامیکه کمپانی هایی همانند ناول، 3Com و Sun نرم افزار به اشتراک گذاری را ارائه کردند. 10 سال طول کشید تا سرورهای خاصی بدین منظور خاص توسعه داده شد و در اوایل سال 1990 سیستمهای Auspex به بازار آمدند. استفاده از NAS مزیتهای چندی نسبت به SAN و DAS دارد که بدین قرارند:

·         راه حلی حقیقی برای ذخیره سازی فایل: تمام بحث NAS درباره به اشتراک گذاشتن فایل است و بصورت ذاتی فایل سیستم را در خود جای میدهد.

·         روش به اشتراک گذاری کاملاً باز: از آنجا که برای دسترسی به آن از پروتکلهای استاندارد استفاده میکنیم تمام کلاینتها بدون اینکه نیاز به نصب برنامه دیگری داشته باشند میتوانند به NAS دسترسی داشته باشند.


استفاده محدود از سخت افزار
سیستمهای NAS از مفهوم مجتمع سازی ذخیره سازها استفاده میکنند، که با این ترتیب دیتای چندین DAS را با یکدیگر ذخیره میکنند. با وجود اینکه تخصیص فضا در این روش آسانتر است هنوز از حالت ایده آل فاصله دارد همچنین محدودیتهای سخت افزاری و نرم افزاری چندی وجود دارد:

·      محدودیت سخت افزاری فایل سرور: فروشندگان قدیمی سخت افزارهای اختصاصی میفروشند و بنابراین معمولاً یکی دو سیکل از آخرین دستاوردهای صنعتی عقب هستند. معمولاً فقط 1 تا 4 هسته در یک NAS Head وجود دارد بدون اینکه امکان افزایش آنرا داشته باشد. همچنین حافظه معمولاً به 4 تا 16 گیگابایت بر روی هر کنترلر محدود است بدون اینکه امکان افزایش آن باشد.

·    محدودیت سخت افزاری ذخیره ساز: بر روی یک NAS تکی از نظر تعداد دیسکها و حفره ها محدودیت وجود دارد.

·         محدودیت حجم و ظرفیت محدودیت 16 ترابایت برای یک فایل سیستم همچنان وجود دارد که در نتیجه آن ظرفیت یک NAS میتواند به حداکثر 50 تا 100 ترابایت برسد.

در مجموع این محدودیتها باعث میشود کارایی یک سیستم NAS تکی نتواند بیشتر از حدی بالا برود. این محدودیتها باعث میشود مشتریان ناچاراً کارهای زیر را انجام دهند:

·         خریدهای اضافی: تعدادی از سازمانهای بزرگ صدها سیستم دارند و دریافته اند که  خرید ذخیره سازهای جدید در اثر محدودیتهای NAS ها می باشد و نه در اثر نیازهای منطقی آنها.

·         جابجا کردن دیتا: در اثر مسائل مربوط به کارایی با پر شدن فایل سیستم و سیستمهای NAS، مدیران سیستم مجبورند پروژه وقت گیر و هزینه بر جابجایی سیستم را اجرا کنند. این تلاشها با پاک کردن دوباره دیتا و نسخه های پشتیبان روزانه شروع میشود و با متقاعد کردن سازمان به خرید سیستم جدید پایان می یابد.


هزینه آرشیوهای Online بسیار بالاست
راه حلهای NAS رایج از دیسکهای ارزان قیمت IDE و SATA پشتیبانی میکنند. با وجود اینکه فروشندگانی که این راه حلها را پیشنهاد میکنند بر این امر تکیه میکنند که دلیل اصلی کاهش هزینه ها بعلت بکارگیری این نوع دیسکها می باشد ولی واقعیت، مساله دیگری می باشد. سخت افزارهای اختصاصی دلیل اصلی کاهش قیمت است. نگهداری طولانی مدت دیتا به طور میانگین 3 تا 5 سال ما را مجبور میکند که از نظر سرویس تجهیزات به فروشندگان وابسته باشیم البته اگر در این فاصله پشتیبانی از طرف سازنده هنوز وجود داشته باشد. 

مقیاس پذیری محدود برای دیتاهای بدون ساختار (صدا و تصویر) 

اغلب راه حلهای رایج NAS از فایل سیستم اصلاح شده ای بهره می برند که عملکرد بهتری از نظر تعداد و حجم فایلها نسبت به فایل سیستمهای استاندارد دارند. با این حال این سیستمها برای در دست گیری وضعیت کنونی آرشیوهای فعال طراحی نشده اند. معمولاً این سیستمها به 16 ترابایت محدود میشوند که در مقیاس آرشیوهای بزرگ بسیار کم است. در ضمن از نظر تعداد فایل نیز محدودیت دارند که در برنامه هایی با تعداد زیادی فایل، نظیر انیمیشن مشکل دارند. چون اغلب این سیستمها از هاردهای رایج IDE وSATA استفاده می کنند، بنابراین از نظر پهنای باند مجموع خواندن و نوشتن به عملکرد این دیسکها محدود میشوند.

برای جابجایی دیتا از یک سیستم به سیستم دیگر (migration) حتماً بایستی زمانی صرف شود(Downtime)
با وجود اینکه راه حلهای برجسته NAS میزان در دسترس بودن (high availability) بالایی را توسط نرم افزار و سخت افزار فراهم میکنند، محدودیتهای ظرفیت و حجم، مدیر سیستم را مجبور میکند برای جابجایی دیتا فایل سرور را خاموش کند. رویه جابجایی دیتا ما را مجبور میکند که سیستم را قطع کنیم تا از تغییر فایلها هنگام کپی جلوگیری شود. حتی با بکارگیری ابزار مجازی سازی، هنوز قطع کردن در شروع و پایان کار لازم است. در بیشتر مواقع جابجایی باعث میشود تنظیمات برنامه های کاربران نیز تغییر کند زیرا مسیر دایرکتوریها و پوشه های به اشتراک گذاشته شده تغییر میکند. 
NAS های قدیمی همچنان در مورد نیازهای جدید محدودیت دارند: 
درباره محدودیتهای ذکر شده در ارتباط با انباره فایل، مشکلات مشابه قسمت قبل است: