وظیفه شناسایی آنچه که یک تصویر نشان می دهد طبقه بندی تصویر نامیده می شود. یک مدل طبقه بندی تصویر برای تشخیص دسته های مختلف تصاویر آموزش داده شده است. برای مثال، میتوانید به مدلی آموزش دهید که عکسهای سه نوع حیوان مختلف را تشخیص دهد: خرگوش، همستر و سگ. TensorFlow Lite مدل های از پیش آموزش دیده بهینه شده ای را ارائه می دهد که می توانید آنها را در برنامه های تلفن همراه خود مستقر کنید. درباره طبقه بندی تصاویر با استفاده از TensorFlow در اینجا بیشتر بیاموزید.
تصویر زیر خروجی مدل طبقه بندی تصاویر در اندروید را نشان می دهد.
اگر با TensorFlow Lite تازه کار هستید و با Android یا iOS کار می کنید، توصیه می شود برنامه های کاربردی مثال زیر را که می توانند به شما در شروع کار کمک کنند، بررسی کنید.
میتوانید از API خارج از جعبه از TensorFlow Lite Task Library استفاده کنید تا مدلهای طبقهبندی تصویر را تنها در چند خط کد یکپارچه کنید. شما همچنین می توانید خط لوله استنتاج سفارشی خود را با استفاده از کتابخانه پشتیبانی TensorFlow Lite بسازید.
مثال اندروید زیر اجرای هر دو روش را به ترتیب lib_task_api و lib_support نشان می دهد.
اگر از پلتفرمی غیر از Android/iOS استفاده میکنید، یا اگر قبلاً با APIهای TensorFlow Lite آشنا هستید، مدل شروع و فایلهای پشتیبانی را دانلود کنید (در صورت وجود).
در طول آموزش، یک مدل طبقهبندی تصویر به تصاویر و برچسبهای مرتبط با آنها داده میشود. هر برچسب نام یک مفهوم یا کلاس متمایز است که مدل یاد می گیرد آن را تشخیص دهد.
با توجه به دادههای آموزشی کافی (اغلب صدها یا هزاران تصویر در هر برچسب)، یک مدل طبقهبندی تصویر میتواند پیشبینی کند که آیا تصاویر جدید متعلق به هر یک از کلاسهایی هستند که در آن آموزش دیدهاند یا خیر. این فرآیند پیش بینی استنتاج نامیده می شود. توجه داشته باشید که با استفاده از یک مدل از پیش موجود می توانید از آموزش انتقال برای شناسایی کلاس های جدید تصاویر نیز استفاده کنید. یادگیری انتقالی به مجموعه داده آموزشی بسیار بزرگ نیاز ندارد.
هنگامی که متعاقباً یک تصویر جدید به عنوان ورودی به مدل ارائه می دهید، احتمالات تصویر را نشان می دهد که نشان دهنده هر یک از انواع حیوانی است که روی آن آموزش دیده است. یک نمونه خروجی ممکن است به صورت زیر باشد:
نوع حیوانی | احتمال |
---|---|
خرگوش | 0.07 |
همستر | 0.02 |
سگ | 0.91 |
هر عدد در خروجی مربوط به یک برچسب در داده های آموزشی است. با مرتبط کردن خروجی با سه برچسبی که مدل روی آنها آموزش دیده است، می توانید ببینید که مدل احتمال زیادی را پیش بینی کرده است که تصویر نشان دهنده یک سگ است.
ممکن است متوجه شوید که مجموع همه احتمالات (برای خرگوش، همستر و سگ) برابر با 1 است. این یک نوع خروجی رایج برای مدلهایی با کلاسهای متعدد است (برای اطلاعات بیشتر به Softmax مراجعه کنید).
از آنجایی که مجموع احتمالات خروجی همیشه برابر با 1 خواهد بود، اگر تصویری با اطمینان به عنوان متعلق به هر یک از کلاسهایی که مدل روی آن آموزش داده شده است، تشخیص داده نشود، ممکن است بدون اینکه هیچ مقداری به طور قابلتوجهی بزرگتر باشد، احتمال توزیع در سراسر برچسبها را مشاهده کنید.
به عنوان مثال، موارد زیر ممکن است نشان دهنده یک نتیجه مبهم باشد:
برچسب | احتمال |
---|---|
خرگوش | 0.31 |
همستر | 0.35 |
سگ | 0.34 |
- پیش بینی نوع و موقعیت یک یا چند شی در یک تصویر (به تشخیص شی مراجعه کنید)
- پیشبینی ترکیب یک تصویر، برای مثال موضوع در مقابل پسزمینه (به بخشبندی مراجعه کنید)
نام مدل | اندازه مدل | دستگاه | NNAPI | CPU |
---|---|---|---|---|
Mobilenet_V1_1.0_224_quant | 4.3 مگابایت | پیکسل 3 (اندروید 10) | 6 میلیثانیه | 13 میلیثانیه* |
پیکسل 4 (اندروید 10) | 3.3 میلیثانیه | 5 میلیثانیه* | ||
آیفون XS (iOS 12.4.1) | 11 میلی ثانیه** |
* 4 نخ استفاده شده است.
** 2 رشته مورد استفاده در آیفون برای بهترین نتیجه عملکرد.
دقت بر حسب تعداد دفعاتی که مدل به درستی یک تصویر را طبقه بندی می کند اندازه گیری می شود. به عنوان مثال، می توان انتظار داشت که یک مدل با دقت 60 درصدی به طور متوسط در 60 درصد مواقع یک تصویر را به درستی طبقه بندی کند.
مرتبط ترین معیارهای دقت Top-1 و Top-5 هستند. Top-1 به این اشاره دارد که هر چند وقت یکبار برچسب صحیح به عنوان برچسب با بیشترین احتمال در خروجی مدل ظاهر می شود. Top-5 به این اشاره دارد که هر چند وقت یکبار برچسب صحیح در 5 احتمال بالاتر در خروجی مدل ظاهر می شود.
محدوده دقت Top-5 مدل های موبایل نت کوانتیزه TensorFlow Lite از 64.4 تا 89.9 درصد است.
اندازه یک مدل روی دیسک با عملکرد و دقت آن متفاوت است. اندازه ممکن است برای توسعه تلفن همراه مهم باشد (جایی که ممکن است بر اندازه دانلود برنامه تأثیر بگذارد) یا هنگام کار با سخت افزار (در جایی که فضای موجود ممکن است محدود باشد).
اندازه مدل های موبایل نت کوانتیزه TensorFlow Lite از 0.5 تا 3.4 مگابایت است.
از منابع زیر برای کسب اطلاعات بیشتر در مورد مفاهیم مرتبط با طبقه بندی تصاویر استفاده کنید: