آپ گوگل ویژن API کا استعمال کرتے ہوئے تصویر سے نکالے گئے متن تک کیسے رسائی حاصل کر سکتے ہیں؟

by ای آئی ٹی سی اے اکیڈمی / بدھ ، 27 دسمبر 2023 / میں شائع مصنوعی ذہانت, EITC/AI/GVAPI گوگل وژن API, بصری ڈیٹا میں متن کو سمجھنا, دستی تحریر سے متن کا پتہ لگانا اور نکالنا, امتحان کا جائزہ

گوگل ویژن API کا استعمال کرتے ہوئے کسی تصویر سے نکالے گئے متن تک رسائی حاصل کرنے کے لیے، آپ کئی مراحل کی پیروی کر سکتے ہیں جن میں API کی آپٹیکل کریکٹر ریکگنیشن (OCR) صلاحیتوں کو استعمال کرنا شامل ہے۔ Google Vision API میں OCR ٹیکنالوجی تصویروں سے متن کا پتہ لگانے اور نکالنے کے قابل بناتی ہے، بشمول ہینڈ رائٹنگ۔ یہ فعالیت خاص طور پر ان ایپلی کیشنز میں مفید ہے جن کے لیے بصری ڈیٹا میں موجود متنی معلومات کے تجزیہ اور تفہیم کی ضرورت ہوتی ہے۔

سب سے پہلے، آپ کو Google Vision API کے ساتھ کام کرنے کے لیے ضروری ماحول ترتیب دینے کی ضرورت ہے۔ اس میں Google Cloud Console میں ایک پروجیکٹ بنانا، Vision API کو فعال کرنا، اور مطلوبہ تصدیقی اسناد جیسے API کلید یا سروس اکاؤنٹ کی کلید حاصل کرنا شامل ہے۔

ایک بار جب آپ کا ماحول قائم ہو جائے تو، آپ تصویری فائل پر OCR کرنے کے لیے Vision API کے `asyncBatchAnnotateFiles` طریقہ استعمال کر سکتے ہیں۔ یہ طریقہ آپ کو پروسیسنگ کے لیے تصویری فائلوں کی ایک فہرست پاس کرنے اور نتائج کو متضاد طور پر وصول کرنے کی اجازت دیتا ہے۔ متبادل طور پر، آپ تصاویر کی فہرست پر براہ راست کارروائی کرنے کے لیے `asyncBatchAnnotateImages` طریقہ استعمال کر سکتے ہیں۔

کسی تصویر سے متن نکالنے کے لیے، آپ کو 'AnnotateImageRequest' آبجیکٹ کا ایک نمونہ بنانا ہوگا اور مطلوبہ خصوصیات کی وضاحت کرنی ہوگی۔ اس صورت میں، آپ `TEXT_DETECTION` خصوصیت کو یہ بتانے کے لیے سیٹ کریں گے کہ آپ تصویر سے متن نکالنا چاہتے ہیں۔ آپ OCR کی درستگی کو بہتر بنانے کے لیے زبان کے اشارے جیسے اضافی پیرامیٹرز کی بھی وضاحت کر سکتے ہیں۔

اس کے بعد، آپ کو تصویری فائل کو ایک base64-انکوڈ شدہ سٹرنگ میں انکوڈ کرنے اور انکوڈ شدہ تصویری ڈیٹا کا استعمال کرتے ہوئے `Image` آبجیکٹ کی ایک مثال بنانے کی ضرورت ہے۔ اس `Image` آبجیکٹ کو پہلے بنائے گئے `AnnotateImageRequest` آبجیکٹ میں شامل کیا جانا چاہئے۔

درخواست ترتیب دینے کے بعد، آپ اسے اپنے منتخب کردہ نقطہ نظر پر منحصر کرتے ہوئے `batchAnnotateImages` یا `batchAnnotateFiles` طریقہ استعمال کرتے ہوئے Vision API کو بھیج سکتے ہیں۔ API تصویر پر کارروائی کرے گا اور نکالے گئے متن پر مشتمل جواب واپس کرے گا۔

جواب سے نکالے گئے متن تک رسائی حاصل کرنے کے لیے، آپ 'AnnotateImageResponse' آبجیکٹ کے 'textAnnotations' فیلڈ پر اعادہ کر سکتے ہیں۔ یہ فیلڈ `EntityAnnotation` اشیاء کی فہرست پر مشتمل ہے، ہر ایک تصویر میں پائے جانے والے متنی عنصر کی نمائندگی کرتا ہے۔ ہر ایک `EntityAnnotation` آبجیکٹ کے `تفصیل` فیلڈ میں نکالا گیا متن ہوتا ہے۔

یہاں ازگر میں ایک مثال کوڈ کا ٹکڑا ہے جو یہ ظاہر کرتا ہے کہ گوگل ویژن API کا استعمال کرتے ہوئے تصویر سے نکالے گئے متن تک کیسے رسائی حاصل کی جائے:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

اس مثال میں، `extract_text_from_image` فنکشن ان پٹ کے بطور تصویری فائل کا راستہ لیتا ہے اور Vision API کو درخواست بھیجنے کے لیے Google Cloud Vision کلائنٹ لائبریری کا استعمال کرتا ہے۔ نکالا ہوا متن پھر پرنٹ کیا جاتا ہے۔

گوگل ویژن API کا استعمال کرتے ہوئے کسی تصویر سے نکالے گئے متن تک رسائی حاصل کرنے کے لیے، آپ کو ماحول ترتیب دینا ہوگا، مطلوبہ خصوصیات کے ساتھ ایک `AnnotateImageRequest` آبجیکٹ بنانا ہوگا، امیج فائل کو انکوڈ کرنا ہوگا، API کو درخواست بھیجنا ہوگا، اور نکالے گئے متن کو بازیافت کرنا ہوگا۔ جواب سے. ویژن API کی OCR صلاحیتیں ہینڈ رائٹنگ سمیت تصاویر سے متن کا پتہ لگانے اور نکالنے کے قابل بناتی ہیں۔

سے متعلق دیگر حالیہ سوالات اور جوابات دستی تحریر سے متن کا پتہ لگانا اور نکالنا:

مزید سوالات اور جوابات:

ٹیگ کے تحت: مصنوعی ذہانت, گوگل کلاؤڈ ویژن API, تصویری پروسیسنگ, OCR, آپٹیکل کریکٹر ریکگنیشن, متن نکالنا

ای آئی ٹی سی اے اکیڈمی

آپ گوگل ویژن API کا استعمال کرتے ہوئے تصویر سے نکالے گئے متن تک کیسے رسائی حاصل کر سکتے ہیں؟

سے متعلق دیگر حالیہ سوالات اور جوابات دستی تحریر سے متن کا پتہ لگانا اور نکالنا:

مزید سوالات اور جوابات:

EITCA اکیڈمی یورپی IT سرٹیفیکیشن فریم ورک کا ایک حصہ ہے۔

EITCA اکیڈمی کے لیے اہلیت 80٪ EITCI DSJC سبسڈی سپورٹ۔

ای آئی ٹی سی اے اکیڈمی

اپنے صارف نام یا ای میل ایڈریس کے ذریعے اپنے اکاؤنٹ میں لاگ ان ہوں

اپنی تفصیلات کو آگے بڑھاؤ؟

ایک اکاؤنٹ بناؤ

آپ گوگل ویژن API کا استعمال کرتے ہوئے تصویر سے نکالے گئے متن تک کیسے رسائی حاصل کر سکتے ہیں؟

سے متعلق دیگر حالیہ سوالات اور جوابات دستی تحریر سے متن کا پتہ لگانا اور نکالنا:

مزید سوالات اور جوابات:

EITCA اکیڈمی کے لیے اہلیت 80٪ EITCI DSJC سبسڈی سپورٹ۔