آشنایی با کدک های تصویر (Video Codecs) - بخش اول


یکی از مهمترین مباحث در بخش تصویر انتقال و آرشیو آن می‌باشد. با توجه به اینکه تصاویر خام که بصورت دیجیتال می‌باشند دارای حجم زیادی از داده می‌باشند، انتقال و آرشیو آنها مشکل می‌باشد. تکنیک‌های مختلفی برای کم کردن حجم داده یا فشرده سازی در حوزه تصویر دیجیتال بوجود آمده است. این نکته قابل ذکر می‌باشد که فشرده سازی یک تصویر باعث از بین رفتن مقداری از اطلاعات تصویر می‌شود، در نتیجه تصویر کد شده نسبت به تصویر اصلی دارای کیفیت پایین‌تری میگردد. امروزه کدک های مختلفی بوجود آمده که با توجه به سیستم بصری انسان و تجزیه و تحلیل اطلاعات تصویر، داده‌هایی که سیستم بصری انسان نسبت به آن حساسیت کمتری دارد حذف و اطلاعات باقیمانده را نیز با انجام فرمولهای پیچیده فشرده میسازد.

کدک‌های خانواده Mpeg
کدک های خانواده (Mpeg (Moving picture Experts Group یکی از گسترده ترین انواع کدک هستند که دارای سطوح مختلف برای کاربردهای گوناگون می‌باشند. کدکMpeg4 در این بین از حیث تنوع بسیار گسترده تر می‌باشد. بطوری که هم تصاویر را بگونه‌ای کد می‌کند که قابل انتقال بر روی خطوط Dial-up باشد و یا بتوان آنها را با تجهیزات hand held ( مانند موبایلها و ساعتهای دیجیتال ) اجرا نمود و یا با بیت ریت‌های بالا که کیفیتی در حد برودکست داشته که می‌توان آنها را بر روی خطوط پر سرعت انتقال داد و یا توسط تجهیزات home theater ( مانند DVD player ) اجرا کرد. کدک‌های Mpeg4 گوناگون توسط شرکتهای مختلفی بوجود آمده که از جمله آنها می‌توان به WMV ,FFDSHOW ,XVID ,DIVX و... اشاره کرد. که در بین آنها کدک DIVX5.2 از شرکت DIVX و کدک WMV از شرکت مایکروسافت که با به خدمت گرفتن تکنیک‌های پیچیده تصاویری با کیفیت مناسب را با بیت ریت (Bitrate) پایین‌تر ارائه میدهند، قابل توجه می‌باشد. تصاویر Mpeg4 برای انتقال بر روی خطوطی که دارای سرعت پایین می‌باشد، مناسبتر هستند.

کدکWMV9 دارای مقادیر از پیش تنظیم شده‌ای می‌باشد که بر اساس سیستم تصویری که در آن اجرا می‌شود (Pal یا NTSC) و همچنین خطوط انتقال آن (از Dial-up تا خطوط پر سرعت که تا حدود یک مگابیت بر ثانیه می‌باشند) تعریف شده است، این کدک در Premiere Pro بعنوان Adobe Media Encoder بصورت plugin قرار دارد. یکی دیگر از مزیتهای این کدک آن است که می تواند تصویر کد شده را مستقیماً از طریق FTP ارسال نماید.

در کدک DIVX5.2 این دسته بندی بر اساس دستگاههایی که تصویر کد شده را اجرا (play) میکنند تقسیم بندی شده‌اند که به چهار گروه
 High Definition ,Home Theater ,Portable ,Handheld
تقسیم می شوند. تجهیزات هر یک از این گروهها توسط شرکتهای مختلفی ساخته و ارائه می شوند و دارای ظرفیتها و خصوصیات خاصی می‌باشند که این تقسیم بندی نیز بر اساس این محصولات طراحی شده است. در این نوشته سعی شده تا مفاهیم کلی و نکات عملی در رابطه با این دو کدک توضیح داده شود.

مفاهیم کلی

ماکرو بلوکها و حرکت

این کدک ها هر فرم را بصورت یک جدول تقسیم می نمایند که هر یک از خانه‌های این جدول یک ماکرو بلاک نامیده می‌شود. سپس در هر فرم هر یک از این ماکروبلاک‌ها در فرمهای پیرامون جستجو می‌شوند. این پردازش به نام جستجوی حرکت یا motion search نامیده می‌شود. وقتی کدک یک ماکرو بلاک را در فرم فعلی منطبق با یک ماکرو بلاک در فرمهای پیرامون پیدا میکند، مقدار جابجایی را بصورت یک بردار ذخیره می‌کند بنابراین دیگر لزومی به کد کردن این ماکرو بلاک در فرم فعلی وجود ندارد و فقط این بردار و آدرس این ماکرو بلاک ذخیره می‌شود که در حجم تصویر کد شده تاثیر قابل ملاحظه‌ای دارد.

انواع فرمها

همانطور که در قسمت قبل گفتیم کدک با جستجوی حرکت، یک بلاک را در فرمهای دیگر جستجو می‌کند و بجای اینکه آن بلاک را کد کند فقط مقدار همان بردار را ذخیره می‌کند. ولی بعضی فرمها وجود دارند که لازم است تمام بلاک‌های آن کد شوند مانند فرم اول و یا جاهایی از تصویرکه تغییرات کلی در تصویر حاصل می‌گردد و یا در فاصله‌های معین یک فرم بصورت کامل کد می‌شود تا بلاکهای بعدی بتوانند بر طبق آن آدرس دهی گردند. این فرمها بعنوان فرم اولیه یا intra frame نامیده می‌شوند.

فرمهایی که بعضی بلاکهای آن از روی بلاک‌های فرمهای دیگر کد می‌شوند بر دو نوع هستند:
در نوع اول بلاک‌ها فقط از روی فرمهای قبلی جستجو می‌شوند که به این فرمها فرم پیش بینی شده یا predicted frame و اططلاحاً p-frame گفته می‌شود.

در گروهی دیگر از فرم‌ها بعضی از بلاک‌ها از روی فرم‌های قبلی و بعضی از روی فرم‌های بعدی جستجو می‌شوند که بترتیب به آنها بلاک‌های پیش بینی شده رو به جلو یا forward-predicted block و بلاک‌های پیش‌بینی شده رو به عقب backward-predicted block گفته می‌شود و بلاکهایی که این دو نوع بلاک در آنها قرار دارد فرمهای پیش بینی شده دو جهته یا Bi-directional predicted frame و اصطلاحاً B-frame نامیده می‌شود.

کوانتیزر Quantizer

از آنجائیکه وقتی یک تصویر از حالت آنالوگ به دیجیتال تبدیل می‌گردد، نتیجه حاصله مقداری عدد می‌باشد و حجم این اعداد بسیار زیاد می‌باشد. یکی از راههای کم کردن آن تقسیم این اعداد بر یک عدد خاص که عدد کوانتیزه نامیده می‌شود، می‌باشد. بدین صورت که بعد از تقسیم و بدست آوردن خارج قسمت، این خارج قسمت بصورت یک عدد صحیح ذخیره میگردد. و چون این خارج قسمت‌ها نسبت به اعداد اصلی کوچکتر می‌باشند بنابراین مقدار داده ذخیره شده کاهش قابل ملاحظه‌ای پیدا می‌کند.

در هنگام اجرای تصویر دیکدر (یا Decoder) عدد کوانتیزه را در اعداد ذخیره شده ضرب می‌کند. نتیجه حاصله بعنوان اطلاعات تصویر دیجیتال برای اجرا بدست می‌آید و از آنجائیکه اطلاعات در موقع اجرا با اطلاعات تصویر اولیه متفاوت می‌باشند باعث کاهش کیفیت تصویر می‌شود. هر چه عدد کوانتیزه بزرگتر باشد، کاهش کیفیت تصویر بیشتر است.

روش‌های کد کردن تصاویر

One Pass

در این روش تصویر بر اساس بیت ریتی که انتخاب می‌شود کد می‌شود، در این حالت تصویر فقط یک مرتبه کد می‌شود و تصویر کد شده قابل اجرا می‌باشد. درکدک یک خصوصیت وجود دارد که هنگام کد کردن شما می‌توانید در قسمتهای مختلف تصویر بیت ریت را در هنگام کد کردن متناسب با نوع تصویر تغییر دهید.

Multipass

در حالت Multipass لازم است که تصویر دو یا چند مرتبه بر اساس بیت ریت انتخاب شده کد ‌شود. پس از اولین کد شدن تصویر قابل اجرا نمی‌باشد ولی یک LOG فایل تشکیل می‌شود که به اختصاص بیت ریت مناسب به فرمهای مختلف در مرحله بعدی کمک می‌کند. در WMV فقط میتوان تا دو مرتبه عمل Multipass را ادامه داد ولی در DIVX5.2 این عمل را n مرتبه می‌توان تکرار نمود، ولی بعد از سومین عمل کدینگ حدود 98 تا 99% تصویر بهینه می‌شود و تکرارهای بعدی تاثیر چندانی در بهبود کیفیت ندارد.

One Pass Quality Based

این حالت مشابه کد کردن بصورت One Pass می‌باشد با این تفاوت که در آنجا کیفیت تصویر با اختصاص بیت ریت مشخص می‌شد و در قسمتهایی از تصویر که دارای جزئیات بیشتر و حرکات سریعتر باشد کیفیت تصویر کاهش پیدا می‌کند، ولی در این حالت با اختصاص یک عدد کوانتایزر که قبلاً توضیح داده شد تصویر بصورت کیفیت ثابت کد می‌شود. این طریقه کد کردن در WMV وجود ندارد و در DIVX5.2 نیز اگر تصویر بدین طریق کد شود دیگر طبق استانداردهای دستگاه‌های DIVX نمی باشد، یعنی تضمینی وجود ندارد که این تصویر در وسایلی که تصویر را پخش می‌کنند اجرا شود.




با تشکر از دوست و همکار عزیزم : مهندس حجت وفا