دنیای مدرن امروز این امکان را فراهم آورده تا تصاویر به صورت دیجیتال دریافت و ذخیره شوند. برای بدست آوردن نتایج بهتر گاهی لازم است تا بر روی این تصاویر تغییراتی صورت گیرد این تغییرات سه هدف عمده را دنبال می کنند: پردازش، آنالیز و درک تصویر. به همین دلیل سیستم های کامپیوتری پردازش تصویر بوجود آمده است تا با سرعت و دقت بهتر بتوان این اعمال را انجام داد. در این سیستم ها ۴ فرایند عمده اتفاق می افتد: پیش پردازش، ارتقاء کیفیت تصویر، تبدیل تصاویر و طبقه بندی و آنالیز تصاویر. در این روش ها با استفاده از علم ریاضیات قواعدی برای شبیه سازی المان های بینائی انسان توسط کامپیوتر ایجاد شده است و یک جنبه آنالیز تصاویر است که برای منظورهای خاصی کاربرد دارد. دید کامپیوتری (Computer Vision) آنالیز تصویر علمی است که در شاخه های مختلف علم مانند پزشکی، مهندسی، تصویر برداری مولکولی، فضانوردی، امنیتی و …. کاربرد دارد.تکنولوژی مدرن دیجیتال این امکان را فراهم آورده که سیگنال های چند بعدی را توسط سیستم هائی از مدارات دیجیتال ساده گرفته تا چندین کامپیوتر موازی دستکاری کرد.
هدف از این دستکاری ها یکی از موارد زیر است:
-پردازش تصویر: ورودی تصویر / خروجی تصویر
– آنالیز تصویر: ورودی تصویر / خروجی شامل تعدادی از اندازه گیری ها
با توجه به این که در دنیای امروز بیشتر حس کننده های از راه دور اطلاعات خود را به صورت دیجیتال ذخیره می کنند، نهایتا تمام تفسیرها و آنالیز تصاویر نیازمند مقداری پردازش دیجیتال است. پردازش دیجیتالی تصاویر ممکن است شامل انواع مختلفی از پردازش از جمله فرمت و اصلاح داده ها، بهینه سازی دیجیتال به منظور آسان سازی هر چه بیشتر تفسیر و تحلیل یا حتی طبقه بندی هدف ها و خصوصیات به صورت خودکار توسط کامپیوتر باشد. به منظور انجام این اعمال لازم است تا داده ها به گونه های مناسب برای ذخیره بر روی فضای فیزیکی موجود باشند. شایع ترین اعمال
پردازشی که در سیستم های آنالیز تصاویر استفاده می شود را می توان در ۴ گروه زیر دسته بندی کرد:
پیش پردازش (Preprocessing)
این دسته از پردازش ها شامل آن هایی است که معمولا قبل از آنالیز اصلی تصاویر و استخراج اطلاعات لازمند و عموما تحت عنوان تصحیح های رادیومتریک یا ژئومتریک گروه بندی می شوند. تصحیح های رادیومتریک شامل اصلاح داده ها از نظر بی نظمی های گیرنده ها و نویز های ناخواسته هستند و هدف آن ها بدست آوردن تصویر دقیقی است که از تابش اشعه به گیرنده ها ایجاد می شود. تصحیح های ژئومتریک به منظور اصلاح اعوجاج های تصویر و تبدیل آن به مختصات حقیقی بر روی سطح زمین است.
افزایش کیفیت تصویر (Image Enhancement)
این دسته از پردازش ها صرفا به منظور بهبود و افزایش وضوح تصویر هستند تا بتوان تفسیر بهتری را از تصاویر بدست آورد.
تبدیل تصویر (Image Transformation)
این اعمال از جهت نظری شبیه گروه قبل است ولی بر خلاف این گروه که تنها بر روی یک کانال داده اعمال می شود، این گروه شامل پردازش ترکیبی بر روی داده های بدست آمده از چندین باند طیفی می شود. اعمال ریاضی (جمع، تفریق، ضرب، تقسیم) اعمال می شوند تا باند های اولیه را ترکیب کرده و آن ها را به تصاویر جدیدی که وضوح بیشتری داشته و یا خصوصیات ویژه ای را بهتر نمایان می کنند تبدیل نماید.
طبقه بندی و آنالیز تصویر
هدف از اعمال این بخش از پردازش ها، طبقه بندی و مشخص سازی پیکسل ها در داده است. طبقه بندی معمولا بر روی گروه های داده چند کانالی اعمال می شود و این عمل هر پیکسل تصویر را بر اساس خصوصیات آماری مقادیر روشنائی آن ها به یک گروه یا تم اختصاص می دهد. برای انجام این پردازش دو روش عمده، با سرپرست و بدون سرپرست وجوددارد.
تعاریف
تعریف تصویر در دنیای واقعی شامل تابعی از دو متغیر حقیقی است مثل (I(x,y که در آن I شدت تصویر (مثلا میزان روشنائی) در مکان حقیقی (x,y) است. یک تصویر ممکن است شامل تعدادی زیر تصویر باشد که گاهی به آنها نواحی مورد توجه (Regions-Of-Interest) یا (ROI)و یا نواحی گفته می شود. این نظریه مشخص می کند که تصاویر معمولا شامل مجموعه هائی از اشیاء است که هر کدام پایه یک ناحیه را تشکیل می دهد. در یک سیستم پردازش تصویر مناسب باید بتوان روی نواحی مختلف اعمال متفاوتی انجام داد مثلا در یک ناحیه تاری ناشی از حرکت را کاهش داد و در همان زمان در ناحیه دیگر کیفیت رنگ را تغییر داد.
شدت ها در تصاویر یا به صورت اعداد حقیقی و یا به صورت اعداد صحیح است. حالت دوم ناشی از Quantization است که شدت ها را از حالت پیوسته به حالت مجزا تبدیل می کند. در برخی فرایندهای تشکیل تصویر از شمارش فوتون استفاده می شود که در این صورتquantization به طور ذاتی در فرایند وجود دارد. در برخی تصویر برداری ها مانند MRIاعداد به صورت حقیقی است. مورفومتری به معنای توضیح کمی یک ساختار است.استریولوژی در واقع استخراج و تفسیر اطلاعات سه بعدی از تصاویر دو بعدی است. پردازش تصویر به معنای ارتقاء کامپیو تری تصاویر دیجیتال است (یعنی استفاده از انواع فیلترها برای حذف نویز، بهینه سازی کنتراست و ….)
آنالیز کامپیوتری تصاویر استخراج کمی و یا کیفی خصوصیات تصاویر دیجیتال دوبعدی و یا سه بعدی است. به عنوان مثال آنالیز تصاویر دو بعدی در دید کامپیوتری و آنالیز تصاویر سه بعدی در تصویر برداری پزشکی کاربرد دارد. آنالیز تصویر در واقع استخراج اطلاعات از درون تصویر است مثل استخراج انواع سطوح، محیط ها و طول ها و …
تصویر برداری دیجیتال
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
یک تصویر دیجیتال [I[m,n در یک فضای گسسته دو بعدی در واقع از یک تصویر دو بعدی مشتق (I(x,y در یک فضای پیوسته دو بعدی توسط فرایند نمونه برداری به نام digitization می شود.تصویر دو بعدی به n ردیف و m ستون تقسیم می شود (شکل۱).
تصویر شماره۱ به ۱۶ردیف و ۱۶ ستون تقسیم شده که هر پیکسل آن گرد شده مقدار روشنائی به نزدیک ترین عدد صحیح است.
دقت تصویر به صورت پیکسل بر اینچ اندازه گیری می شود. یک تصویر با دقت ۱۰۰۰۰PPI در یک اینچ مربع دارای پیکسل است. برای انجام آنالیز تصویر لازم است ویژگی های مورد نظر به گونه ای استخراج شوند تا اندازه گیری ها بر روی تصاویر پیکسلی شده انجام نشود.
دقت پیکسلی یا عمق پیکسل به معنی تعداد بیت اطلاعات به ازاء هر پیکسل است. عمق پیکسل مشخص می کند چه مقدار اطلاعات مربوط به رنگ و یا طیف خاکستری برای هر پیکسل امکان پذیر است. در تصاویر باینری عمق پیکسل۱ (روشن – خاموش) است. این ها تصاویر سفید وسیاه است. برای آنالیز تصاویر طیف خاکستری حداقل عمق پیکسل لازم ۸ بیت است. برای تصاویر رنگی حداقل عمق ۲۴ بیت لازم است.قانون نیکوئیست بیان می کند که اگر می خو اهیم به صورت دیجیتالی دقت جزئیات حفظ شود باید dpi تصویربرداری دو برابر دقت ویژگی مورد نظر باشد.
المان های تفسیر توسط چشم
همان طور که قبلا گفته شد، آنالیز تصویر شامل شناسائی اهداف متفاوتی درون تصویر است. این اهداف ممکن است ویژگی های محیطی یا مصنوعی باشند که از نقاط، خطوط یا نواحی تشکیل شده اند.
چه چیز تفسیر تصاویر را نسبت به تفسیر چشمی روزمره مشکل می سازد؟
در تصاویر دو بعدی فرد حس مربوط به عمق را از دست می دهد مگر آن که بتواند آنرا به صورت استریوسکوپی ببیند تا عمق آن شبیه سازی شود. در واقع در دید استریوسکوپی تفسیر بسیار آسان تر خواهد بود. یک پرسپکتیو غیر معمول اگر با جزئیات کم و اندازه بسیار نامتعارف ادغام شود می تواند آشنا ترین اشیاء را غیر قابل تشخیص کند. همچنین چشم انسان در محدوده مشخصی از طول موج می تواند عمل کند و تصویر برداری خارج از این محدوده می تواند جهت درک بسیار مشکل باشد.
در تشخیص هدف ها کلید استخراج اطلاعات و تفسیر تصویر است. مشاهده اختلاف بین هدف ها و زمینه آن ها شامل مقایسه از نظر تعدادی از المان های بینائی یعنی تون، شکل، اندازه، الگو، سایه و ارتباط است. تفسیر بینائی روزمره انسان توسط استفاده از این المان ها صورت می گیرد. اکنون به توضیح هر یک از این موارد پرداخته می شود:
تون
به روشنائی یا رنگ نسبی اشیاء در تصویر اتلاق می شود. عموما، تون مهمترین المان برای تمایز بین هدف ها یا ویژگی های مختلف است. تغییرات تون می تواند باعث تمایز المان های شکل، بافت و الگو شود.
شکل
بیان کننده فرم، ساختار و محیط اشیاء است. شکل می تواند در تفسیر بسیار متمایز کننده باشد. اشکال طبیعی بیشتر شکل نامنظم و ساخته های دست بشر بیشتر لبه های مستقیم دارد.
اندازه
اندازه تصاویر تابعی است از بزرگنمائی تصویر. بسیار مهم است که در تفسیر تصاویر اشیاء از نظر اندازه با اشیاء ذیگر و با اندازه واقعی تصویر مقایسه شوند.
الگو
الگو بیان کننده ترتیب قرار گرفتن فضائی اشیاء دیدنی است. به طور مشخص تکرار منظم تون ها و بافت های مشابه می تواند بیان کننده یک الگو باشد.
بافت
به ترتیب و تکرار تغییرات تون در نواحی خاصی از تصویر اطلاق می شود. در بافت های خشن تغییرات تون خاکستری در یک ناحیه کوچک به میزان زیاد به چشم می خورد ولی در بافت های ملایم تغییرات تون خاکستری بسیار کم است.
سایه
سایه نیز می تواند در تفسیر تصاویر بسیار کمک کننده باشد. سایه می تواند ارتفاع نسبی اشیاء را مشخص سازد. البته گاهی سایه ها می توانند تشخیص اهداف را مشکل سازند زیرا اهدافی که در درون سایه قرار دارند کمتر قابل تشخیص خواهند بود. سایه ها برای تشخیص توپوگرافی نیز می توانند کمک کننده باشند.
ارتباط
ارتباط، رابطه بین هدف و دیگر اشیائ قابل تشخیص در نزدیکی آن را در نظر می گیرد. این مساله می تواند به تشخیص مواردی که این رابطه شناخته شده است کمک کند. مثلا در یک تصویر ماهواره ای، ساختمان هائی که نزدیک مسیر های اصلی دیده می شود به احتمال زیاد ساختمان های تجاری است.
طبقه بندی اشیا توسط انسان
انسان برای دسته بندی اشیاء از روش شناخت الگو بر اساس قرار گرفتن در معرض چندین نمونه استفاده می کند. انسان همیشه یک الگوی ذهنی از اشیاء درست می کند که این الگو با دیگر اطلاعات مربوط به شیء به همراه مقداری عینیت بخشی این قابلیت را می دهد که انسان سریعا شیء را دسته بندی کند ولی همیشه یک المان ذهنی وجود دارد.
انسان به کنتراست حساس است. همیشه اشیائی که کنتراست بالا دارند بیشتر در ذهن خود را نشان می دهند.
انسان به پرسپکتیو و تغییرات عمق تصویر حساس است.
انسان به جهت تابش نور حساس است و ترجیح می دهد که نور از بالا بتابد.
انسان همیشه دوست دارد چیزی را در تصویر ببیند که انتظار آن را دارد.
پردازش تصویر (Image processing) و پزشکی
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
پردازش تصویر عملیاتی است که طی آن ویژگی های تصویر بارزتر می شوند و قبل از آنالیز تصویر انجام می گیرد. پردازش تصویر بر روی پیکسل ها یعنی کوچک ترین اجزای تصویر انجام می شود. الگوریتم های مختلفی که در پردازش تصویر استفاده می شوند عملیات خود را بر روی گروهی از پیکسل ها انجام می دهند. به این گروه ها کرنل (Kernel) گفته می شود.در شکل (۲) یک سری از کرنل های ۳×۳ خود را بر روی پیکسل وسط یا سیاه رنگ، با استفاده از اطلاعات موجود در پیکسل های همسایه اعمال می کنند.
در کرنل A اطلاعات تمام پیکسل های همسایه در عملیات پردازش نقش دارد . در کرنل B تنها اطلاعات همسایه های با ارزش (همسایه های عمودی و افقی) در نظر گرفته می شود. در کرنل C اطلاعات پیکسل های همسایه ضعیف یعنی همسایه های مورب مورد استفاده قرار می گیرد. انواع متفاوت این کرنل ها مبنای پردازش دیجیتالی تصاویر است.
پیش پردازش (Preprocessing)
عملیات پیش پردازش که گاهی بازیابی یا اصلاح تصویر نیز نامیده می شود به منظور اصلاح اعوجاج های رادیومتریک یا ژئومتریک مربوط به سنسور و سکو به کار برده می شود. اصلاحات رادیومتریک به دلیل تغییرات در هنگام روشن سازی صحنه و جهت های تصویر برداری، شرایط محیطی و نویز گیرنده است. این موارد و ابسته به سنسور، سکو و شرایط تصویر برداری است. تغییر داده ها به اشعه های اصلی تشکیل دهنده تصویر برای آسان سازی مقایسه بین داده ها مطلوب است.
تغییرات در نورپردازی و اشکالات هندسی را می توان با استفاده از مدل کردن وضعیت هندسی و فاصله بین شیئ و گیرنده و منبع نور اصلاح کرد. این عمل نیاز است تا بتوان تصاویر بدست آمده در شرایط و زمان ها و با گیرنده های مختلف را با یکدیگر مقایسه کرد و یا تصاویر بدست آمده از یک گیرنده را به صورت موزائیک در کنار یکدیگر قرار داد و نتیجه مطلوبی بدست آورد.
در تصویر برداری پزشکی اختلالات عمده شامل نویز ناشی از دریافت با فرکانس بالا، روشنائی متفاوت در زمینه و مشکلات ناشی از جهت گیری دور مشاهده می شود. به همین دلیل پیش پردازش ها به طور سیستماتیک بر روی تمام تصاویر گرفته شده از یک دستگاه اعمال می شوند. به همین دلیل این پردازش ها معمولا وابسته به دستگاه هستند و باید سریع و موثر باشند. هنگامی که خصوصیات فضائی یا روشنائی نویز ها مشخص باشد از متدهای فوتوگرامتریک استفاده می شود.
وقتی خصوصیات طیفی نویز ها مشخص باشد از فیلتر ها استفاده می شود. فیلتر های پایین گذر برای حذف نویز ها، فیلتر های میان گذر برای نویز های پریودیک و فیلتر های بالا گذر برای تیز کردن تصاویر به کار برده می شوند. یک گروه الگوریتمیک از فیلتر ها هنگامی که یک شئ خاص مورد نظر باشد به کار برده می شوند. این در صورتی است که نوع های دیگری از همان شیء با زوایا و دیگر خصوصیات متفاوت وجود داشته باشد. باید توجه داشت که مرحله پیش پردازش نباید به گونه ای باشد که تصویر اصلی را آنقدر تغییر دهد که بیننده دچار خطای تشخیص شود.
ارتقای تصویر(Image Enhancement)
ارتقا کیفیت تصویر توسط دستکاری هیستوگرام
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
ارتقاء تصویر به منظور آسان سازی تفسیر بینائی و درک تصویر به کار برده می شود. مزیت تصاویر دیجیتال در این است که می توان یک نقطه را دستکاری کرد. حتی بعد از پیش پردازش و اصلاح خطاهای ناشی از گیرنده و جهت، ممکن است تصویر برای بیننده وضوح کافی نداشته باشد. اگر اهداف مختلف دارای طیف های مختلفی از روشنائی است پردازش های اولیه نمی تواند همه آنها را به طور مطلوب نشان دهد. به همین دلیل برای هر تصویر باید تنظیم خاصی از نظر روشنائی و پراکندگی آن وجود داشته باشد.
در تصویر برداری روزمره تنها از ظرفیت کمی از قابلیت تصویر برداری دیجیتال مثلا ۸ بیت استفاده می شود. ارتقای کنتراست بدین معنا است که از ظرفیت بیشتری برای نشان دادن کنتراست استفاده شود و اشیای در تصویر مشخص تر باشند. برای درک بهتر ارتقای کنتراست باید هیستوگرام را شناخت. یک هیستوگرام یک نمودار گرا فیکی است که مقادیر روشنائی که یک ها تصویر ر ا می سازند مشخص می سازد. مقادیر روشنائی در محور x ها و میزان تکرار یا فرکانس هرکدام از این مقادیر در تصویر روی محور yها نشان داده می شود. شکل(۳)، یک تصویر نمونه به همراه هیستوگرام آن را نشان می دهد.
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
با استفاده از دستکاری محدوده مقادیر دیجیتال یک تصویر، که در هیستوگرام آن نشان داده شده، می توان تصویر را بهبود داد. روش های مختلفی برای ارتقای کنتراست وجود دارد. ساده ترین روش کشیدن خطی کنتراست است .بدین صورت که حد بالا و پایین کنتراست از روی هیستوگرام مشخص می شود سپس با استفاده از یک تبدیل، محدوده کنتراست کشیده می شود تا کل محدوده ممکن را پر می کند.شکل(۴) نحوه انجام این کار را نشان می دهد. نتیجه اعمال این روش در شکل(۵) نشان داده شده است.
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
این عمل همیشه منجر به نتیجه مناسب نمی شود به خصوص در مواردی که محدوده ورودی به طور یکنواخت پراکنده نباشد. در این موارد از روش کشیدگی هیستوگرام تعدیل شده (Histogram Equalized stretch) استفاده می شود. در این روش محدوده بیشتری به مقادیری که فرکانس بالاتری دارند اختصاص می یابد. در این روش جزئیات دقیق تری از نواحی که بیشتر تکرار شده است در مقایسه با نواحی که کمتر تکرار شده نشان داده می شود. در برخی موارد ممکن است فقط در یک محدوده خاص از هیستوگرام بخواهیم تصویر را ارتقا دهیم در مواردی که هیستوگرام در یک طرف طیف یا در وسط طیف جمع شده باشد و تصویر تیره یا روشن به نظز برسد می توان از روش Histogram sliding استفاده کرد. در این روش یک مقدار ثابت به کل پیکسل ها اضافه و یا از آن ها کم می شود.
باید دقت داشت که این روش ها رزولوشن تصویر را بالا نمی برند بلکه ویژگی های مورد نظر در تصویر را بهبود می دهند. گاما (Gamma) در یک هیستوگرام، همان شیب نمودار است و به معنی نسبت تغییرات خروجی به تغییرات ورودی است. مقدار گامای ۱ بیانگر نسبت ۱:۱خروجی به ورودی است و نیاز به اصلاح ندارد. در برخی برنامه ها یک تابع گاما یک تابع جستجوکننده در جدول استفاده می کندتا خطاهای ایجاد شده در تصویر را اصلاح کند.
حذف نویز
در مواردی که تصویر در نور کم گرفته شود نسبت نویز به سیگنال بالا می رود. یک روش برای کاهش این نویز استفاده از میانگین گیری است به این صورت که فریم های متعددی از تصویر گرفته می شود و میانگین آن ها به عنوان تصویر نهائی در نظر گرفته می شود که حاوی اطلاعات بیشتر و نویز کم تر است البته استفاده از این فیلترها مقداری تاری در تصویر ایجاد می کند. استفاده از آن ها در تصاویر دقت بالا توصیه نمی شود. فیلتر کردن فضائی در مواردی به کار می رود که بخواهیم ویژگی هائی از تصویر را بر اساس تکرار فضائی آن ها بهبود یا کاهش دهیم. فرکانس فضائی با بافت تصویر مرتبط است و اشاره دارد به میزان تکرار تغییرات تون در تصویر. نواحی خشن که تغییرات تون در آن ها زیاد است فرکانس فضائی بالاتر نسبت به نواحی ملایم دارند. در یک روش یک پنجره شامل ابعادی کوچک بر روی تصویر پیکسل به پیکسل حرکت می کند و بر اساس مقادیر پیکسل ها با استفاده از روابط ریاضی مقداری محاسبه و به جای پیکسل مرکز قرار داده می شود. این عمل بر روی کل تصویر انجام می شود. با این روش نیز می توان با استفاده از فیلتر، تصویر را ارتقا داد.
فیلتر پایین گذر به منظور تاکید بر نواحی بزرگ و هوموژن دارای تون یکسان و کاهش جزئیات کوچک تر به کار می رود. پس تصویر را هموارتر می کنند. این فیلتر در تصویر برداری رادار استفاده می شود. فیلتر بالا گذر عکس آن عمل می کند و باعث افزایش جزئیات و تیز شدن تصویر می شود.
فیلترهای تشخیص لبه یا جهت دار به منظور شناسائی ویژگی های خطی طراحی شده اند. این فیلترها به منظور تشخیص ویژگی هائی که در یک جهت خاص قرار داده شده اند نیز هستند.
فیلتر های میانه کمترین میزان بلوری را ایجاد می کند .این فیلتر ها با استفاده از یک کرنل ۳×۳ یا ۵×۵ ، روشنائی پیکسل وسط یا هدف را بر اساس میانه روشنائی پیکسل های همسایه تغییر می دهد. در نتیجه یک ترکیب از روشنائی در یک محدوده به وجود می آید. این فیلتر پیکسل هائی که روشنائی بسیار متفاوتی با همسایه ها داشته باشند را در نظر نمی گیرد. شکل(۵)، نتیجه اعمال فیلتر میانه را نشان می دهد.
نویزهای پریودیک در یک تصویر را عمدتا می توان با استفاده از یک تبدیل فوریه دو بعدی حذف کرد. تبدیل فوریه تصویر می تواند نویز پریودیک را مشخص سازد. این نویز را می توان از تصویر حذف کرد و با انجام عکس تبدیل فوریه بر روی تصویر، تصویر بدون نویز را بدست آورد. شکل (۶)، حذف نویز پریودیک با استفاده از تبدیل فوریه سریع (Fast Fourier Transform-FFT) را نشان می دهد.
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
بهبود لبه ها
در این روش ها وضوح تصویر کاهش می یابد و لبه های موجود در آن بهبود می یابند. این روش ها همانند استفاده از فیلتر بالا گذر هستند ولی با این تفاوت که به لبه ها اهمیت ویژه ای می دهند نه به اختلاف کنتراست دو قسمت از تصویر. یکی از معروف ترین آن ها، بهبود لبه لاپلاسین است که بدون توجه به جهت لبه ها آن ها را مشخص تر می سازد (شکل۷).
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
استفاده از رنگ مجازی
بینائی انسان به رنگ حساس تر است. استفاده از رنگ مجازی در تصاویر طیف خاکستری می تواند برخی جنبه های تصویر را نمایان تر سازد (شکل۸).
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
تبدیل تصاویر(Image Transformation)
عمدتا تبدیل تصاویر نیازمند دستکاری چندین باند داده است چه از یک تصویر چند طیفی یا از دو یا بیشتر تصویر از یک ناحیه که در زمان های مختلفی گرفته شده است (مولتی تمپورال). تبدیلات پایه شامل اعمال عملگر های جبری بر روی داده ها است. کم کردن تصاویر از یکدیگر معمولا برای مواقعی که می خواهیم بدانیم در طول زمان چه تغییراتی رخ داده است بکار برده می شود (کاربرد در آنژیوگرافی). ابتدا دو تصویر که از نظر خطاهای هندسی تثبیت شده اند، مقادیر پیکسل هایشان از یکدیگر کم می شود و یک مقدار ثابت به پیکسل های تصویر حاصله اضافه می شود (مثلا عدد ۱۲۰). تصویر نهائی نتیجه خوبی از تغییرات است. در چنین تصویری نقاطی که اختلاف کمی در دو تصویر اولیه دارند دارای روشنائی ۱۲۰ می شوند ولی نقاطی که اختلاف بیشتری دارند پس از تبدیل دارای روشنائی بیشتر یا کمتر از ۱۲۰ خواهند بود.شکل(۹)، نتیجه اجرای این روش را نشان می دهد.
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
تقسیم کردن تصاویر یا Spectral rationing یکی از متداول ترین تبدیلات بر روی تصاویر است. این روش برای روشن ساختن تغییرات کوچکی که در طیف پوششی سطح های مختلف وجود دارد، به کار برده می شود.یکی از محاسن استفاده از این روش این است که به دلیل این که فرد به مقادیر به صورت نسبی نگاه می کند و نه مقادیر مطلق روشنائی، تغییرات نور پردازی ناشی از اثرات توپوگرافیک خود را کمتر نشان می دهند.
باند های متفاوت از داده های چند طیفی معمولا به شدت با یکدیگر مرتبطند و بنابراین اطلاعات مشابهی را در خود دارند. تکنیک های تبدیل تصویر که ویژگی های آماری داده های چند طیفی را پردازش می کنند به منظور کاهش این افزونگی داده استفاده می شوند. یکی از این تکنیک ها آنالیز اجزائ اصلی (Principal Components Analysis) است. هدف این تبدیل کاهش تعداد باندها و فشرده سازی اطلاعات باندهای اولیه در تعداد کمتری از باندها است.باندهای جدید بدست آمدهcomponent نام دارند و حاوی بیشترین اطلاعات در کمترین تعداد باند هستند.
آنالیز تصاویر (Image Analysis)
پس از این که تصاویر از نظر کیفی بهبو یافتند در مرحله بعد باید ویژگی های آن ها مشخص و استخراج شوند. بیشتر داده های تصاویر ممکن است به نواحی با محیط بسته، نقاط و خط ها تقسیم و دسته بندی شوند. برای شناسائی اشیاء باید بتوان آن ها را از زمینه متمایز و جدا کرد. معمولا بهتر است تصویر طیف خاکستری به تصویر باینری (سیاه و سفید) تبدیل شود. تکنیک هائی مثل تقسیم تصویر و شناسائی لبه بر روی تصاویر باینری بهتر اجرا می شود ولی بر روی تصاویر طیف خاکستری یا رنگی نیز گاهی اعمال می شوند. بیشترین پارامتر هائی که در آنالیز تصویر اندازه گیری می شوند شامل موارد زیر است:
طول: اندازه یک خط کشیده شده
سطح: سطح پیکسلهای درون یک شیء
محیط: فاصله اطراف محیط یک شیء در واحد پیکسل
نسبت سطح به محیط: مقداری برای اندازه گیری میزان گرد بودن یا فشرده بودن. مقدار آن بین صفر و یک است.
محور اصلی: محوری که بزرگ ترین خط را در درون شیء تشکیل می دهد.
محور فرعی: بزرگ ترین محوری که می توان در درون شیء عمود بر محور اصلی در نظر گرفت.
تعداد حفره ها: تعداد حفره هایی که در درون شیء موجود است.
باید توجه داشت که هیچ روش قطعه سازی تصویری وجود ندارد که بر روی تمام تصاویر عمل کند. همچنین هیچ روش قطعه سازی کامل نیست.
تعیین آستانه( Thresholding)
ساده ترین روش بر ای قطعه کردن تصویر استفاده از تکنیک های تعیین آستانه است. تعیین آستانه می تواند بر روی تصاویر مونوکروم یا رنگی انجام شود. در موارد مونوکروم، پیکسل های یک محدوده خاص از طیف خاکستری بر روی مانیتور نمایش داده می شوند و آنالیز بر روی آن ها صورت می گیرد.سوال اساسی در این روش این است که آستانه را چگونه باید مشخص کرد؟ با این که جوابی برای این سوال وجود ندارد که بر روی تمام تصاویر عمل کند ولی راه هائی برای این کار وجود دارد:
آستانه ثابت (Fixed threshold)
یک روش انتخاب آستانه بدون توجه به داده های تصویر است. اگر مشخص باشد که تصویر مورد نظر دارای کنتراست بالاست و اشیاء بسیار تیره است و زمینه یکنواخت و روشن است، در این صورت یک آستانه کنتراست ۱۲۸در محدوده ۰ تا ۲۵۵ می تواند دقیق باشد. منظور از دقت این است که پیکسل های اشتباه انتخاب شده حداقل باشد.
آستانه های به دست آمده از هیستوگرام(Histogram-derived thresholds)
در بیشتر موارد آستانه از هیستوگرام روشنائی تصویر یا ناحیه مورد نظر جهت تقسیم کردن انتخاب می شود. تعدادی از روش های تعیین آستانه جهت تعیین خودکار آستانه که از هیستوگرام طیف خاکستری شروع می شود ارائه شده اند. تعدادی از آن ها در این قسمت ارائه می شود. در بیشتر این الگوریتم ها، ساده سازی داده های هیستوگرام خام مفید واقع می شود ولی این ساده سازی نباید به گونه ای باشد که پیک های هیستوگرام را جابجا کند. این مساله منجر به استفاده از یک الگوریتم ساده سازی فاز صفر می شود و مقدار W می تواند ۳ یا ۵ باشد.
در شکل ۱۰ پیکسل های زیر آستانه به عنوان پیکسل های شیء و پیکسل های بالای آستانه به عنوان پیکسل های زمینه در نظر گرفته می شوند.
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
الگوریتم ایزو دیتا
این تکنیک تکرار شونده برای انتخاب آستانه توسط ریدلر و کالوارد ایجاد شد. در ابتدا هیستوگرام با استفاده از یک مقدار آستانه به دو قسمت تقسیم می شود. این آستانه معمولا نصف مقادیر ممکن می تواند باشد. میانگین مقادیر خاکستری نمونه ۰، f و m مربوط به پیکسل های foreground و میانگین مقادیر خاکستری نمونه۰، b و m مربوط به زمینه محاسبه می شوند. یک مقدار آستانه جدید به نام teta1 به صورت میانگین دو مقدار بدست آمده محاسبه می شود. این فرایند بر اساس مقادیر جدید به طور مرتب تکرار می شود تا زمانی که مقدار آستانه دیگر تغییری نکند.
الگوریتم Background – symmetry
این روش در نظر می گیرد که قله مشخص و واضح برای زمینه وجود دارد که نسبت به ماکسیمم حالت قرینه دارد. در این تکنیک نیز بهتر است از روش ساده سازی استفاده شود. تعیین قله ماکسیمم (maxp) توسط جستجوی بیشترین مقدار در هیستوگرام انجام می گیرد. سپس الگوریتم در پیکسل های طرف نامربوط به اشیاء آن قله به دنبال یک نقطه p% است.
به عنوان مثال در شکل ۱۰ که پیکسل های شیء در طرف چپ قله زمینه در مقدار ۱۸۳ قرار دارند، بدان معنی است که در سمت راست قله باید جستجو شود تا مقدار مثلا % ۹۵یافت شود. در این مقدار روشنائی، ۵% پیکسل ها در طرف راست یا بالاتر قرار می گیرند و این مساله در مقدار ۲۱۶ اتفاق می افتد. به دلیل تقارن در نظر گرفته شده ما آستانه را مقداری در نظر می گیریم که مقدار ماکسیمم به اندازه اختلافش تا مقدار p%به سمت چپ تغییر مکان دهد. یعنی مقدار آستانه معادل می شود با ۱۵۰= ۱۸۳ – (۲۱۶-۱۸۳)
این تکنیک به راحتی قابل تبدیل به مواردی است که شیء روشن بر روی زمینه تاریک قرار دارد. همچنین در مواردی که قله مربوط به شیء بزرگ تر است و روشنائی مربوط به آن در اطراف قله به صورت متقارن پخش شده است نیز قابل استفاده است.
الگوریتم مثلث
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
این روش که در شکل (۱۱) نشان داده شده است توسط زاک مطرح شد. از بلند ترین نقطه هیستوگرام خطی به کوتاه ترین نقطه آن کشیده می شود. فاصله بین خط و هیستوگرام (d) برای تمام مقادیر b از b min تا b max محاسبه می شود. مقدار روشنائی b0 که فاصله بین h(b0) تا خط بیشترین مقدار را داشته باشد به عنوان آستانه تعریف می شود. این تکنیک زمانی موثر است که قله مربوط به شیء ضعیف باشد.
تعیین آستانه نباید بر روی کل تصویر اعمال شود بلکه می تواند به صورت ناحیه به ناحیه اعمال شود. چو و کانکو روشی را ابداع کردند که در آن تصویر m*n به نواحی جدا از هم تقسیم می شود. در هر ناحیه یک آستانه مشخص شده و پس از تعیین تمام آستانه ها، همه مقادیر آن ها در تعیین یک سطح آستانه برای کل تصویر استفاده می شوند. اندازه ناحیه ها باید منطقی باشد و دارای تعداد کافی پیکسل به منظور تعیین هیستوگرام و آستانه باشند. کاربرد این روش بستگی به نحوه استفاده و مهارت فرد دارد.
استفاده از تصاویر رنگی می تواند تمایز بیشتری به همراه داشته باشد. بخش بندی تصویر می تواند انجام بر اساس رنگ های قرمز، سبز و آبی (RGB) انجام شود و یا بر اساس روش رنگ، اشباع و شدت (HSI) که روشی قدرتمند تر است. روش HSI به مغز انسان برای تشخیص اشیاء نزدیک تر است. Hue به معنی طول موج رنگ، Saturation بیانگر درجه خلوص رنگ و Intensity نشان دهنده میزان روشنائی یا تاریکی نسبی است.
تشخیص لبه
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
یکی دیگر از روش های بخش کردن تصویر، تشخیص لبه است. در روش تعیین آستانه تصویر به پیکسل هائی تقسیم می شود که هر کدام اصولا به یک شیء مورد نظر اختصاص می یابند. حالت دیگری وجود دارد و آن این است که پیکسل هائی جستجو شوند که به کناره اشیاء اختصاص دارند. تکنیک های مربوط به این عمل، تکنیک های تشخیص لبه نامیده می شوند. ریاضیات شکل شناسی بیان می کند که یک رابطه ذاتی بین لبه ها و نواحی وجود دارد. فیلترهای تشخیص لبه زیادی وجود دارد از جمله لاپلاس، سوبل، کنی، پرویت و روبرتز که می توانند اشیاء را تشخیص و ارتقا دهند. این فیلتر ها گرادیان ها را برجسته می سازد و تحول از یک روشنائی به دیگری را تشخیص می دهد. با این حال این فیلتر ها اشیاء ناپیوسته و اشیائی را که روی هم افتاده باشند تشخیص نمی دهند. الگوریتم هائی ممکن است استفاده شوند تا لبه های نزدیک به هم به یکدیگر بچسبند. همچنین فیلترهای آب پخشان (Watershed) می توانند اشیاء روی هم افتاده را جدا کنند.
روش بر اساس گرادیان(Gradient-based procedure)
چالش اصلی در تکنیک های تشخیص لبه یافتن روش هایی است که می توانند یک محیط بسته را در اطراف اشیاء مورد نظر ایجاد کنند. برای اشیائی که دارای SNR بالا هستند می توان گرادیان را محاسبه کرد و سپس از یک آستانه مناسب استفاده نمود.
روش عبور کردن از صفر (Zero-crossing procedure)
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
یک نمای پیشرفته تر برای حل مشکل تشخیص لبه در تصاویر پر از نویز استفاده از روش های عبور کردن از صفر در لاپلاس یک تصویر است. این روش از یک مدل ایده آل لبه آغاز می شود، یک تابع پله ، که توسط یک OFT تار شده است و شکل زیر حا صل می شود:
بر اساس مدل محل لبه در نقطه ای از تصویر است که لاپلاسین تغییر علامت می دهد یعنی از صفر عبور می کند. به دلیل این که عمل لاپلاسین شامل مشتق دوم است این احتمال وجود دارد که در تصویر های دارای فرکانس فاصله ای بالا نویزها ارتقا یابند. برای جلوگیری از ارتقاء نویز ها در هنگام جستجو برای منطقه عبور از صفر، یک عملیات هموار سازی لازم است انجام گیرد.
یک فیلتر هموار سازی مناسب از میان فیلترهای موجود، طبق نظر کنی باید دار ای خواص زیر باشد:
– در دامنه فرکانس، فیلتر باید تا حد ممکن باریک باشد تا بتواند نویز های فرکانس بالا را کاهش دهد.
– فیلتر باید تا حد ممکن باریک باشد تا بتواند در دامنه فضائی (spatial domain) به خوبی لبه ها را مکان یابی کند. یک فیلتر عریض این عدم اطمینان را دارد که در محدوده خود فیلتر، لبه دقیقا کجا قرار گرفته است.
فیلتر هموار سازی که به طور همزمان هر دوی این خصوصیات را داشته باشد، فیلتر گاوسین است. این بدان معنی است که تصویر باید با یک گاوسین مناسب هموار سازی شود، سپس لاپلاسین بر روی آن اعمال شود.
باید توجه داشت که ترتیب عملگرها می تواند عوض شود و یا هر دو در یک فیلتر ترکیب شوند.
روش فیلتر PLUS
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
از بین تمام روش های عبور از صفر برای تشخیص لبه، شاید دقیق ترین آن ها فیلتر PLUS باشد. این فیلتر توسط ونبیک و ولیت ساخته شد.
تمام روش های تشخیص لبه بر اساس عبور از صفر در لاپلاسین باید بتوانند بین عبور از صفر و مقدار صفر تمایز قائل شوند. برای تمایز بین این دو حالت، ابتدا کلیه عبور از صفر ها را تشخیص داده و آن ها را با ۱ علامتگذاری می کنیم بقیه پیکسل ها را با ۰ علامت می زنیم. سپس تصویر حاصل را در هر پیکسل در یک مقدار تحت عنوان توان لبه ضرب می کنیم. اندازه های مختلفی برای توان لبه وجود دارد که بر اساس گرادیان بدست می آیند. این قابلیت یعنی استفاده از گرادیان مورفولوجیکال به عنوان مقدار توان لبه بسیار موثر است. پس از انجام ضرب، تصویر آستانه گذاری می شود تا نتیجه نهائی به دست آید.
روش های تشخیص لبه نهایتا منجر به تصاویری می شوند که حاوی یک سری از پیکسل های لبه است. اگر این لبه ها با اشیاء مورد نظر تطبیق داشته باشند باید از یک روش پر کردن ناحیه برای بدست آوردن اشیاء نهائی استفاده کرد.
استخراج منطقه (Region extraction)
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
این روش ها قسمت هائی از تصویر که از یک قاعده یکنواختی پیروی می کند را جدا سازی می کند. قاعدتا لازم است برای هر پیکسل موجود در هر منطقه اختلاف سطح خاکستری با دیگر پیکسل های آن از یک مقدار مشخصی کمتر باشد. در حالتی از این روش فقط یک نقطه و نقاط همسایه نزدیک آن در نظر گرفته می شوند. اصولا این روش ها منجر به تشخیص نواحی بسته و در نتیجه محیط های بسته می شوند که به راحتی قابل بررسی با روش های اندازه گیری مورفولوجیکال هستند. نکات منفی این روش ها پیچیدگی آن ها است و این که معمولا مناطق کوچک زیادی تشخیص داده می شوند. در اینحا معمولا پس پردازش لازم است مثل منظم سازی اشکال و حذف نواحی کوچک با استفاده از Erosion/ Dilation. به علاوه جداسازی تصاویر دارای بافت هنوز یک مشکل عمده است. در حال حاضر برای اینگونه موارد از توابع حمایت کننده فشرده مثل فیلتر های گیبور و یا ویولت ها استفاده می شود.پس از اینکه اشیاء جداسازی شدند، باید با روش هائی بتوان اشیاء را دسته بندی کرد.
دسته بندی تصویر (Image Classification)
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
یک شخص خبره برای دسته بندی کردن ویژگی های تصویر از المان های بینائی که قبلا ذکر شد استفاده می کند تا گروه پیکسل های مشابه که ویژگی های خاصی را در تصویر نشان می دهند شناسائی کند.طبقه بندی دیجیتال تصویر از اطلاعات طیفی تصویر که توسط اعداد دیجیتال در یک یا چند باند طیفی وجود دارند استفاده می کند و سعی می کند که هر پیکسل را بر اساس این اطلاعات طیفی طبقه بندی کند. این نوع از طبقه بندی شناسائی الگوی طیفی نامیده می شود. به هر حال هدف این است که در تصویر تمام پیکسل ها به یک دسته یا تم اختصاص یابند. تصویر دسته بندی شده حاصله از یک موازئیک پیکسل ها تشکیل شده که هر کدام به یک تم اختصاص دارند و این تصویر لزوما یک نقشه تماتیک از تصویر اولیه است.
هنگام صحبت از طبقه بندی باید بین طبقه بندی اطلاعاتی و طبقه بندی طیفی تمایز قائل شد. طبقه بندی اطلاعاتی بیانگر قسمت هائی از تصویر است که فرد مایل به تشخیص آن ها است مثل انواع درخت، رودخانه و غیره در یک تصویر هوائی. ولی دسته های طیفی گروه هائی از پیکسل است که از نظر مقدار روشنائی در کانال های طیفی مختلف داده ها متحدالشکل هستند. هدف، نگاشت دسته های طیفی با دسته های اطلاعاتی مورد جستجو است. با این حال دسته های طیفی وجود دارند که با هیچ طبقه اطلاعاتی مورد نظر فرد مطابقت ندارند. متقابلا در یک دسته اطلاعاتی بزرگ نیز ممکن است زیر گروه های طیفی منحصر به فردی وجود داشته باشد.
برای مشاهده کامل تصویر بر روی آن کلیک کنید.
عملیات طبقه بندی شایع بسته به روش هایی که در آن ها استفاده می شود به دو دسته عمده با سرپرست و بدون سرپرست تقسیم می شوند. در نوع با سرپرست فرد خودش نمونه های مشابه بیان کننده نوع سطح پوشاننده را شناسائی می کند. این نمونه ها به عنوان نواحی آموزنده (Training areas) نامیده می شوند. انتخاب این نواحی آموزنده بسته به میزان آشنائی فرد با بافت موجود در تصویر دارد. بنابراین فرد نحوه انتخاب گروه ها و دسته ها را نظارت می کند. اطلاعات رقمی موجود در همه باندهای طیفی که تشکیل دهنده این نواحی هستند برای آموزش کامپیوتر جهت شناسائی نواحی مشابه از نظر طیفی برای هر طبقه استفاده می شود. کامپیوتر از روش ها و الگوریتم های مختلفی برای شناسائی مشخصه های عددی هر دسته آموزشی استفاده می کند. هنگامی که کامپیوتر همه دسته های آموزشی را شناسائی کرد، هر پیکسل تصویر با این دسته ها مقایسه می شود و نهایتا برای یک دسته نزدیک به خودش علامتگذاری می شود. پس در مدل دارای سرپرست، ابتدا طبقه های اطلاعاتی مشخص می شود سپس از روی این طبقه های اطلاعاتی، طبقه های طیفی که نماینده آن ها هستند مشخص می شود.
دسته بندی بدون سرپرست اصولا عکس نوع دارای سرپرست است. در ابتدا کلاس های طیفی بر اساس عدد طیفیشان مشخص می شوند سپس با دسته های طیفی مد نظر فرد نگاشت می شوند. برنامه هائی تحت عنوان الگوریتم های خوشه بندی برای تشخیص گروه بندی های طبیعی (آماری) و ساختار های موجود در تصویر به کار برده می شوند. معمولا فرد مشخص می کند که چه تعداد گروه یا طبقه باید در نظر گرفته شود. به علاوه، فرد مشخص می کند که بین طبقه ها چه مقدار فاصله تمایز وجود داشته باشد و همچنین چه مقدار تغییر در درون یک طبقه مجاز است.نتیجه نهائی این طبقه بندی ممکن است به دسته هائی منجر شود که فرد لازم می داند تعدادی از آن ها ر ا به هم بپیوندد یا تعدادی را به میزان بیشتری بشکند که این مساله خود نیازمند کاربرد بیشتر الگوریتم خوشه بندی است. پس طبقه بندی بدون سرپرست لزوما بدون دخالت انسان نیست ولی با نظارت اولیه یک انسان نیز شروع نمی شود.