گوگل ویژن API کا استعمال کرتے ہوئے کسی تصویر سے نکالے گئے متن تک رسائی حاصل کرنے کے لیے، آپ کئی مراحل کی پیروی کر سکتے ہیں جن میں API کی آپٹیکل کریکٹر ریکگنیشن (OCR) صلاحیتوں کو استعمال کرنا شامل ہے۔ Google Vision API میں OCR ٹیکنالوجی تصویروں سے متن کا پتہ لگانے اور نکالنے کے قابل بناتی ہے، بشمول ہینڈ رائٹنگ۔ یہ فعالیت خاص طور پر ان ایپلی کیشنز میں مفید ہے جن کے لیے بصری ڈیٹا میں موجود متنی معلومات کے تجزیہ اور تفہیم کی ضرورت ہوتی ہے۔
سب سے پہلے، آپ کو Google Vision API کے ساتھ کام کرنے کے لیے ضروری ماحول ترتیب دینے کی ضرورت ہے۔ اس میں Google Cloud Console میں ایک پروجیکٹ بنانا، Vision API کو فعال کرنا، اور مطلوبہ تصدیقی اسناد جیسے API کلید یا سروس اکاؤنٹ کی کلید حاصل کرنا شامل ہے۔
ایک بار جب آپ کا ماحول قائم ہو جائے تو، آپ تصویری فائل پر OCR کرنے کے لیے Vision API کے `asyncBatchAnnotateFiles` طریقہ استعمال کر سکتے ہیں۔ یہ طریقہ آپ کو پروسیسنگ کے لیے تصویری فائلوں کی ایک فہرست پاس کرنے اور نتائج کو متضاد طور پر وصول کرنے کی اجازت دیتا ہے۔ متبادل طور پر، آپ تصاویر کی فہرست پر براہ راست کارروائی کرنے کے لیے `asyncBatchAnnotateImages` طریقہ استعمال کر سکتے ہیں۔
کسی تصویر سے متن نکالنے کے لیے، آپ کو 'AnnotateImageRequest' آبجیکٹ کا ایک نمونہ بنانا ہوگا اور مطلوبہ خصوصیات کی وضاحت کرنی ہوگی۔ اس صورت میں، آپ `TEXT_DETECTION` خصوصیت کو یہ بتانے کے لیے سیٹ کریں گے کہ آپ تصویر سے متن نکالنا چاہتے ہیں۔ آپ OCR کی درستگی کو بہتر بنانے کے لیے زبان کے اشارے جیسے اضافی پیرامیٹرز کی بھی وضاحت کر سکتے ہیں۔
اس کے بعد، آپ کو تصویری فائل کو ایک base64-انکوڈ شدہ سٹرنگ میں انکوڈ کرنے اور انکوڈ شدہ تصویری ڈیٹا کا استعمال کرتے ہوئے `Image` آبجیکٹ کی ایک مثال بنانے کی ضرورت ہے۔ اس `Image` آبجیکٹ کو پہلے بنائے گئے `AnnotateImageRequest` آبجیکٹ میں شامل کیا جانا چاہئے۔
درخواست ترتیب دینے کے بعد، آپ اسے اپنے منتخب کردہ نقطہ نظر پر منحصر کرتے ہوئے `batchAnnotateImages` یا `batchAnnotateFiles` طریقہ استعمال کرتے ہوئے Vision API کو بھیج سکتے ہیں۔ API تصویر پر کارروائی کرے گا اور نکالے گئے متن پر مشتمل جواب واپس کرے گا۔
جواب سے نکالے گئے متن تک رسائی حاصل کرنے کے لیے، آپ 'AnnotateImageResponse' آبجیکٹ کے 'textAnnotations' فیلڈ پر اعادہ کر سکتے ہیں۔ یہ فیلڈ `EntityAnnotation` اشیاء کی فہرست پر مشتمل ہے، ہر ایک تصویر میں پائے جانے والے متنی عنصر کی نمائندگی کرتا ہے۔ ہر ایک `EntityAnnotation` آبجیکٹ کے `تفصیل` فیلڈ میں نکالا گیا متن ہوتا ہے۔
یہاں ازگر میں ایک مثال کوڈ کا ٹکڑا ہے جو یہ ظاہر کرتا ہے کہ گوگل ویژن API کا استعمال کرتے ہوئے تصویر سے نکالے گئے متن تک کیسے رسائی حاصل کی جائے:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
اس مثال میں، `extract_text_from_image` فنکشن ان پٹ کے بطور تصویری فائل کا راستہ لیتا ہے اور Vision API کو درخواست بھیجنے کے لیے Google Cloud Vision کلائنٹ لائبریری کا استعمال کرتا ہے۔ نکالا ہوا متن پھر پرنٹ کیا جاتا ہے۔
گوگل ویژن API کا استعمال کرتے ہوئے کسی تصویر سے نکالے گئے متن تک رسائی حاصل کرنے کے لیے، آپ کو ماحول ترتیب دینا ہوگا، مطلوبہ خصوصیات کے ساتھ ایک `AnnotateImageRequest` آبجیکٹ بنانا ہوگا، امیج فائل کو انکوڈ کرنا ہوگا، API کو درخواست بھیجنا ہوگا، اور نکالے گئے متن کو بازیافت کرنا ہوگا۔ جواب سے. ویژن API کی OCR صلاحیتیں ہینڈ رائٹنگ سمیت تصاویر سے متن کا پتہ لگانے اور نکالنے کے قابل بناتی ہیں۔
سے متعلق دیگر حالیہ سوالات اور جوابات دستی تحریر سے متن کا پتہ لگانا اور نکالنا:
- گوگل ویژن API کا استعمال کرتے ہوئے پیچیدہ دستاویزات سے متن نکالتے وقت کیا حدود پیدا ہوسکتی ہیں؟
- گوگل ویژن API کی متن کی تشریح میں اعتماد کی سطح کی کیا اہمیت ہے؟
- گوگل ویژن API ہاتھ سے لکھے ہوئے نوٹوں سے متن کو درست طریقے سے کیسے پہچان اور نکال سکتا ہے؟
- ہاتھ سے لکھی گئی تصاویر سے متن کا پتہ لگانے اور نکالنے میں کیا چیلنجز ہیں؟
- کیا گوگل وژن ہینڈ رائٹنگ کو پہچان سکتا ہے؟