convolutional neural network (CNN) کے اہم اجزاء اور تصویر کی شناخت کے کاموں میں ان کے متعلقہ کردار کیا ہیں؟

by ای آئی ٹی سی اے اکیڈمی / منگل، 08 اگست 2023 / میں شائع مصنوعی ذہانت, ای آئی ٹی سی/اے آئی/ڈی ایل ٹی ایف ڈیپ لرننگ ٹینسرفلو کے ساتھ, ٹینسرفلو میں کنونیوشنل عصبی نیٹ ورک, ٹینسرفلو کے ساتھ اختتامی عصبی نیٹ ورک, امتحان کا جائزہ

Convolutional neural network (CNN) ایک قسم کا گہرا سیکھنے والا ماڈل ہے جو تصویر کی شناخت کے کاموں میں بڑے پیمانے پر استعمال ہوتا رہا ہے۔ یہ خاص طور پر بصری ڈیٹا کو مؤثر طریقے سے پروسیس کرنے اور تجزیہ کرنے کے لیے ڈیزائن کیا گیا ہے، جس سے یہ کمپیوٹر ویژن ایپلی کیشنز میں ایک طاقتور ٹول ہے۔ اس جواب میں، ہم تصویر کی شناخت کے کاموں میں CNN کے اہم اجزاء اور ان کے متعلقہ کرداروں پر تبادلہ خیال کریں گے۔

1. Convolutional Layers: Convolutional Layers CNN کی عمارت کا حصہ ہیں۔ وہ سیکھنے کے قابل فلٹرز یا دانا کے سیٹ پر مشتمل ہوتے ہیں جو خصوصیت کے نقشے تیار کرنے کے لیے ان پٹ امیج کے ساتھ جڑے ہوتے ہیں۔ ہر فلٹر تصویر میں ایک مخصوص پیٹرن یا فیچر کا پتہ لگاتا ہے، جیسے کہ کنارے، کونے، یا بناوٹ۔ کنوولوشن آپریشن میں فلٹر کو امیج پر سلائیڈ کرنا اور فلٹر کے وزن اور متعلقہ امیج پیچ کے درمیان ڈاٹ پروڈکٹ کو کمپیوٹنگ کرنا شامل ہے۔ یہ عمل تصویر میں ہر مقام کے لیے دہرایا جاتا ہے، ایک خصوصیت کا نقشہ تیار کرتا ہے جو مختلف خصوصیات کی موجودگی کو نمایاں کرتا ہے۔

مثال: آئیے ایک 3×3 فلٹر پر غور کریں جو افقی کناروں کا پتہ لگاتا ہے۔ جب کسی ان پٹ امیج کے ساتھ بات چیت کی جائے گی، تو یہ ایک خصوصیت کا نقشہ تیار کرے گا جو تصویر کے افقی کناروں پر زور دیتا ہے۔

2. پولنگ لیئرز: پولنگ لیئرز کا استعمال کنوولوشنل لیئرز کے ذریعے بنائے گئے فیچر نقشوں کو نیچے کرنے کے لیے کیا جاتا ہے۔ وہ سب سے اہم معلومات کو برقرار رکھتے ہوئے خصوصیت کے نقشوں کے مقامی طول و عرض کو کم کرتے ہیں۔ سب سے زیادہ استعمال ہونے والا پولنگ آپریشن میکس پولنگ ہے، جو پولنگ ونڈو کے اندر زیادہ سے زیادہ قیمت کا انتخاب کرتا ہے۔ یہ نیٹ ورک کی کمپیوٹیشنل پیچیدگی کو کم کرنے میں مدد کرتا ہے اور اسے ان پٹ امیج میں چھوٹے مقامی تغیرات کے لیے زیادہ مضبوط بناتا ہے۔

مثال: فیچر میپ پر 2×2 پولنگ ونڈو کے ساتھ زیادہ سے زیادہ پولنگ لاگو کرنے سے ہر نان اوور لیپنگ 2×2 ریجن میں زیادہ سے زیادہ ویلیو منتخب ہو جائے گی، جس سے مقامی طول و عرض کو مؤثر طریقے سے نصف تک کم کر دیا جائے گا۔

3. ایکٹیویشن فنکشنز: ایکٹیویشن فنکشنز CNN میں غیر خطوطی کو متعارف کراتے ہیں، جس سے یہ پیچیدہ پیٹرن سیکھنے اور پیشین گوئیاں کرنے کی اجازت دیتا ہے۔ CNNs میں سب سے زیادہ استعمال ہونے والا ایکٹیویشن فنکشن Rectified Linear Unit (ReLU) ہے، جو آؤٹ پٹ کو زیادہ سے زیادہ صفر اور ان پٹ کے حساب سے شمار کرتا ہے۔ ReLU کو اس کی سادگی اور غائب ہونے والے تدریجی مسئلے کو دور کرنے کی صلاحیت کی وجہ سے ترجیح دی جاتی ہے۔

مثال: اگر نیوران کا آؤٹ پٹ منفی ہے، تو ReLU اسے صفر پر سیٹ کرتا ہے، مؤثر طریقے سے نیوران کو بند کر دیتا ہے۔ اگر آؤٹ پٹ مثبت ہے، تو ReLU اسے بغیر کسی تبدیلی کے رکھتا ہے۔

4. مکمل طور پر جڑی ہوئی پرتیں: مکمل طور پر جڑی ہوئی پرتیں نکالی گئی خصوصیات کی بنیاد پر حتمی پیشین گوئیاں کرنے کی ذمہ دار ہیں۔ وہ پچھلی تہوں سے چپٹی خصوصیت کے نقشے لیتے ہیں اور انہیں مکمل طور پر منسلک نیوران کی ایک سیریز سے گزرتے ہیں۔ مکمل طور پر منسلک پرت میں ہر نیوران پچھلی پرت کے ہر نیوران سے جڑا ہوا ہے، جس سے یہ خصوصیات کے درمیان پیچیدہ تعلقات کو سیکھنے اور درست پیشین گوئیاں کرنے کی اجازت دیتا ہے۔

مثال: تصویر کی شناخت کے کام میں، مکمل طور پر جڑی ہوئی پرت میں مختلف کلاسوں سے مطابقت رکھنے والے نیوران ہو سکتے ہیں، جیسے "بلی،" "کتا،" اور "کار۔" مکمل طور پر منسلک پرت کے آؤٹ پٹ کو ہر کلاس سے تعلق رکھنے والی ان پٹ امیج کے امکانات کے طور پر سمجھا جا سکتا ہے۔

5. نقصان کا فنکشن: نقصان کا فنکشن پیش گوئی شدہ نتائج اور زمینی سچائی کے لیبل کے درمیان فرق کو ماپتا ہے۔ یہ اندازہ کرتا ہے کہ CNN اپنے کام پر کتنی اچھی کارکردگی کا مظاہرہ کر رہا ہے اور تربیت کے دوران ماڈل کے پیرامیٹرز کو اپ ڈیٹ کرنے کے لیے سگنل فراہم کرتا ہے۔ نقصان کے فنکشن کا انتخاب تصویر کی شناخت کے مخصوص کام پر منحصر ہوتا ہے، جیسے بائنری درجہ بندی کے لیے بائنری کراس اینٹروپی یا ملٹی کلاس کی درجہ بندی کے لیے دوٹوک کراس اینٹروپی۔

مثال: بائنری درجہ بندی کے کام میں، بائنری کراس اینٹروپی نقصان مثبت طبقے کے پیش گوئی شدہ امکان کا حقیقی لیبل (0 یا 1) سے موازنہ کرتا ہے اور ان کے درمیان بڑے تضادات کو جرمانہ کرتا ہے۔

ایک convolutional عصبی نیٹ ورک (CNN) convolutional تہوں، پولنگ تہوں، ایکٹیویشن فنکشنز، مکمل طور پر جڑی ہوئی تہوں، اور نقصان کے فنکشن پر مشتمل ہوتا ہے۔ ارتعاشی پرتیں ان پٹ امیج سے معنی خیز خصوصیات نکالتی ہیں، جبکہ پولنگ پرتیں فیچر کے نقشوں کو کم کرتی ہیں۔ ایکٹیویشن فنکشن غیر خطوطی کو متعارف کراتے ہیں، اور مکمل طور پر منسلک پرتیں حتمی پیشین گوئیاں کرتی ہیں۔ نقصان کا فنکشن تربیتی عمل کی رہنمائی کرتے ہوئے پیشن گوئی شدہ نتائج اور زمینی سچائی کے لیبلز کے درمیان فرق کی پیمائش کرتا ہے۔

سے متعلق دیگر حالیہ سوالات اور جوابات ٹینسرفلو میں کنونیوشنل عصبی نیٹ ورک:

مزید سوالات اور جوابات:

ٹیگ کے تحت: مصنوعی ذہانت, سی این این, کمپیوٹر ویژن, Convolutional Neural نیٹ ورک, گہری سیکھنا, تصویری شناخت

ای آئی ٹی سی اے اکیڈمی

convolutional neural network (CNN) کے اہم اجزاء اور تصویر کی شناخت کے کاموں میں ان کے متعلقہ کردار کیا ہیں؟

سے متعلق دیگر حالیہ سوالات اور جوابات ٹینسرفلو میں کنونیوشنل عصبی نیٹ ورک:

مزید سوالات اور جوابات:

EITCA اکیڈمی یورپی IT سرٹیفیکیشن فریم ورک کا ایک حصہ ہے۔

EITCA اکیڈمی کے لیے اہلیت 80٪ EITCI DSJC سبسڈی سپورٹ۔

ای آئی ٹی سی اے اکیڈمی

اپنے صارف نام یا ای میل ایڈریس کے ذریعے اپنے اکاؤنٹ میں لاگ ان ہوں

اپنی تفصیلات کو آگے بڑھاؤ؟

ایک اکاؤنٹ بناؤ

convolutional neural network (CNN) کے اہم اجزاء اور تصویر کی شناخت کے کاموں میں ان کے متعلقہ کردار کیا ہیں؟

سے متعلق دیگر حالیہ سوالات اور جوابات ٹینسرفلو میں کنونیوشنل عصبی نیٹ ورک:

مزید سوالات اور جوابات:

EITCA اکیڈمی کے لیے اہلیت 80٪ EITCI DSJC سبسڈی سپورٹ۔