Convolutional Neural Networks (CNNs) کو پہلے کمپیوٹر ویژن کے میدان میں تصویر کی شناخت کے مقصد کے لیے ڈیزائن کیا گیا تھا۔ یہ نیٹ ورک ایک مخصوص قسم کے مصنوعی اعصابی نیٹ ورک ہیں جو بصری ڈیٹا کا تجزیہ کرنے میں انتہائی موثر ثابت ہوئے ہیں۔ CNNs کی ترقی ایسے ماڈلز بنانے کی ضرورت سے کارفرما تھی جو تصاویر کو درست طریقے سے درجہ بندی اور درجہ بندی کر سکیں، اور اس ڈومین میں ان کی کامیابی نے مختلف دیگر ایپلی کیشنز جیسے آبجیکٹ کا پتہ لگانے، تصویر کی تقسیم، اور یہاں تک کہ قدرتی زبان کی پروسیسنگ میں ان کے وسیع پیمانے پر استعمال کا باعث بنا ہے۔
CNNs انسانی دماغ میں بصری پرانتستا کی ساخت اور فعالیت سے متاثر ہیں۔ بصری پرانتستا کی طرح، CNNs ایک دوسرے سے منسلک نیوران کی متعدد تہوں پر مشتمل ہوتے ہیں جو ان پٹ ڈیٹا کے مختلف پہلوؤں پر کارروائی کرتے ہیں۔ CNNs کی کلیدی اختراع ان کی تصاویر سے متعلقہ خصوصیات کو خود بخود سیکھنے اور نکالنے کی صلاحیت میں مضمر ہے، جس سے دستی فیچر انجینئرنگ کی ضرورت ختم ہو جاتی ہے۔ یہ convolutional تہوں کے استعمال کے ذریعے حاصل کیا جاتا ہے، جو مختلف بصری نمونوں اور خصوصیات جیسے کہ کناروں، کونوں اور ساخت کا پتہ لگانے کے لیے ان پٹ امیج پر فلٹر لگاتی ہیں۔
CNNs میں پہلی کامیابی Yann LeCun et al کے LeNet-5 فن تعمیر کے تعارف کے ساتھ آئی۔ 1998 میں۔ LeNet-5 کو خاص طور پر ہاتھ سے لکھے ہوئے ہندسوں کی شناخت کے لیے ڈیزائن کیا گیا تھا اور اس نے MNIST ڈیٹاسیٹ پر نمایاں کارکردگی حاصل کی، ایک بینچ مارک ڈیٹاسیٹ جو بڑے پیمانے پر تصویری شناخت الگورتھم کا جائزہ لینے کے لیے استعمال ہوتا ہے۔ LeNet-5 نے تصویروں سے درجہ بندی کی خصوصیات حاصل کرنے میں CNNs کی طاقت کا مظاہرہ کیا، پیمانے، گردش اور ترجمے میں تغیرات کی موجودگی میں بھی درست درجہ بندی کو فعال کیا۔
اس کے بعد سے، CNNs نے نمایاں طور پر ترقی کی ہے، جس میں گہرے اور زیادہ پیچیدہ فن تعمیرات تیار کیے جا رہے ہیں۔ ایک قابل ذکر پیشرفت الیکس کرزیوسکی ایٹ ال کے ذریعہ الیکس نیٹ فن تعمیر کا تعارف تھا۔ 2012 میں۔ AlexNet نے امیج نیٹ لارج اسکیل ویژول ریکگنیشن چیلنج (ILSVRC) جیت کر تصویر کی درجہ بندی میں ایک پیش رفت حاصل کی جس میں پچھلے طریقوں کے مقابلے میں نمایاں طور پر کم خرابی کی شرح تھی۔ اس کامیابی نے تصویر کی شناخت کے کاموں میں CNNs کو بڑے پیمانے پر اپنانے کی راہ ہموار کی۔
سی این این کو کمپیوٹر ویژن کے دیگر کاموں پر بھی کامیابی سے لاگو کیا گیا ہے۔ مثال کے طور پر، آبجیکٹ کا پتہ لگانے میں، CNNs کو ایک تصویر کے اندر اشیاء کو مقامی اور درجہ بندی کرنے کے لیے اضافی تہوں کے ساتھ جوڑا جا سکتا ہے۔ مشہور ریجن پر مبنی Convolutional Neural Network (R-CNN) Ross Girshick et al نے متعارف کرایا۔ 2014 میں اس طرح کے ایک فن تعمیر کی ایک مثال ہے. R-CNN نے خصوصیت نکالنے کے لیے CNNs کی طاقت کا فائدہ اٹھا کر اور اسے علاقائی تجویز کے طریقوں کے ساتھ جوڑ کر آبجیکٹ کا پتہ لگانے والے بینچ مارکس پر جدید ترین نتائج حاصل کیے ہیں۔
Convolutional Neural نیٹ ورکس کو پہلے کمپیوٹر ویژن کے میدان میں تصویر کی شناخت کے کاموں کے لیے ڈیزائن کیا گیا تھا۔ انہوں نے دستی فیچر انجینئرنگ کی ضرورت کو ختم کرتے ہوئے خود بخود تصاویر سے متعلقہ خصوصیات سیکھ کر میدان میں انقلاب برپا کر دیا ہے۔ CNNs کی ترقی نے امیج کی درجہ بندی، آبجیکٹ کا پتہ لگانے، اور کمپیوٹر ویژن کے مختلف کاموں میں نمایاں ترقی کی ہے۔
سے متعلق دیگر حالیہ سوالات اور جوابات EITC/AI/ADL ایڈوانسڈ ڈیپ لرننگ:
- ہمیں مشین لرننگ میں اصلاح کو لاگو کرنے کی ضرورت کیوں ہے؟
- اوور فٹنگ کب ہوتی ہے؟
- کیا Convolutional Neural Networks وقت کے ساتھ convolutions کو شامل کرکے ترتیب وار ڈیٹا کو سنبھال سکتے ہیں، جیسا کہ Convolutional Sequence to Sequence ماڈلز میں استعمال ہوتا ہے؟
- کیا جنریٹو ایڈورسریل نیٹ ورکس (GANs) جنریٹر اور امتیازی سلوک کے خیال پر انحصار کرتے ہیں؟