بینایی ماشین

پردازش تصاویر یک کار لایه لایه است. اگر هوش مصنوعی را مجموعه‌ای از هزاران نورون در نظر بگیریم که هر گروه مسئول لایه‌ای از پردازش باشند، گروه اول رنگ‌های داخل تصویر را تشخیص می‌دهند، گروه بعدی در لایه دوم اشکالی که در تصویر وجود دارد را شناسایی می‌کنند، گروه سوم می‌تواند بافت و نور را مشخص کند و الی آخر. تا جایی که لایه آخر متوجه می‌شود حالت چشمان شخص توی تصویر ناراحت است یا خوشحال. همان مراحلی که برای توصیف یک تصویر طی می‌کردیم، اما بسیار دقیق‌تر و جزئی‌تر.

پیش‌پردازش (Pre-Processing)

کامپیوتر در مرحله اول تصویر را آماده یا پیش پردازش می‌کند تا دقت پردازش بیشتر شود. اگر این مرحله به خوبی انجام نشود، نتایج بهینه‌ای از پردازش تصویر به دست نمی‌آید. کامپیوتر در این مرحله نویزهای ناخواسته تصویر را از بین می‌برد و ویژگی‌هایش را بهبود می‌بخشد.

آنالیز چهره و بدن (Face and Body Analysis)

یکی از کارهایی که هوش مصنوعی می‌تواند انجام دهد، تشخیص چهره است. این فناوری با استفاده از تفاوت‌هایی که در چهره افراد وجود دارد، آن‌ها را شناسایی می‌کند و به قدری قدرتمند است که از قدرت تشخیص چهره انسان هم پیشی گرفته. مثلا می‌تواند چهره چینی‌ها، ژاپنی‌ها و کره‌ای‌ها را به راحتی تشخیص دهد! گذشته از تشخیص چهره، می‌تواند ویژگی‌های چهره و حالت بدن افراد را هم آنالیز کند.

آنالیز صحنه (Scene Analysis)

هدف از آنالیز صحنه، شناخت انواع اشیا و دسته بندی آن‌هاست. هوش مصنوعی به قدرتی رسیده که می‌تواند تفاوت اشیا در یک تصویر را تشخیص دهد و بفهمد در آن چه اشیایی و از هر کدام چندتا وجود دارد. این ویژگی کاربردهای بسیاری در سیستم‌های صنعتی، پزشکی، نظامی، امنیتی و... دارد. مثلا می‌تواند به رانندگان کمک کند تا موانعی که در مسیرشان وجود دارد را ببینند یا به نابینایان کمک کند اشیاء اطراف‌شان را تشخیص دهند. از کاربردهای نظامی آن‌ها نیز می‌توان به آنالیز، تشخیص و تعیین مختصات قرار گرفتن اشیا اشاره کرد.

آنالیز محتوا (Content Analysis)

این توانایی سیستم‌های بینایی، به ماشین کمک می‌کند تا محتوای داخل تصاویر را تشخیص دهد و اطلاعات آن‌ها را استخراج کند. این فناوری به درد بسیاری از کسب و کارها می‌خورد، مخصوصا اگر بخواهند مدارک اسکن شده‌ای را دریافت، بررسی و دسته‌بندی کنند.

بهبود تصویر (Improving image processing)

مهم‌ترین مسئله در عکاسی، کیفیت و وضوح تصویر است. طوری که قدرت فوکوس و رزولوشن دوربین‌ها از اصلی‌ترین ملاک‌ها برای انتخاب دوربین‌های حرفه‌ای هستند. رزولوشن همان دقت و میزان جزئیات در یک تصویر است، طوری که هرچه اندازه تصویر بزرگ یا زوم شود، از کیفت آن کم نشود. عواملی مثل دقت در فوکوس، کیفیت لنز، سنسور دوربین و تعداد پیکسل‌ها در بهبود رزولوشن موثر هستند. پیشرفت هوش مصنوعی به کمک حرفه عکاسی آمده و با تحلیل صحنه و تشخیص عناصر آن، می‌تواند در بالا بردن کیفیت تصویر و رزولوشن آن تاثیر بسزایی داشته باشد.

سبک سازی (Stylisation)

تغییرات ظاهری و ساختاری در تصاویر، بخش جالب توجه و جذاب پردازش تصویر و بینایی است. در این بخش به تغییر سبک یک تصویر یا انتقال سبک از یک تصویر به تصویر دیگر پرداخته خواهد شد که باعث خلق اثری جدید می‌شود. همچنین از سرویس‌هایی برای حفظ حق کپی و محرمانگی تصویر استفاده شده است. دو اصلی که با گسترش شبکه‌های اجتماعی و اینترنت، بسیار مهم هستند. از دیگر سرویس‌های این بخش رنگ آمیزی و روح بخشی به تصاویر، ویرایش و زیباسازی آن‌ها هستند. فشرده‌سازی تصویر نیز یکی دیگر از سرویس‌هاست که ساختار تصویر را تغییر می‌دهد تا ذخیره سازی و انتقال تصویر آسان شود.

آنالیز تصویر پزشکی (Medical Image Analysis)

دنیای مدرن امروز این امکان را فراهم آورده تا تصاویر به صورت دیجیتال دریافت و ذخیره شوند؛ در کنار آن، سیستم‌های پردازش تصویر بوجود آمده‌اند تا با سرعت و دقت بهتری تصاویر را تجزیه و تحلیل کنند. یکی از مهم‌ترین کاربردهای پردازش تصویر، حوزه پزشکی است. جایی که نیاز است تصاویر برای دیده شدن تمام جزئیات، با نهایت شفافیت و وضوح گرفته شوند. به این ترتیب جراحی‌های میکروسکوپی (Microsurgery) با ایجاد یک سوراخ کوچک و فقط دیدن محل جراحی توسط پزشک، از راه دور و توسط بازوهای رباتیک بسیار دقیق انجام می‌شوند. به علاوه پردازشگرهای بینایی ماشین می‌توانند در آشکار سازی بیماری‌ها و مشخص کردن نوع و درجه بیماری کمک کنند. از دیگر کاربردهای بینایی ماشین در این بخش می‌توان به بررسی بسته‌بندی تجهیزات پزشکی و دارویی، تشخیص نقص بسته‌بندی در سرعت‌های بالا، پردازش و آنالیز خودکار تصاویرCT،MRI و اشعه X اشاره کرد.