بصری ڈیٹا میں متن کو سمجھنے اور تصاویر سے متن کا پتہ لگانے اور نکالنے کے لیے Google Vision API کے تناظر میں فائل پاتھ کے بجائے تصویری URLs کو ہینڈل کرنے کے لیے "detect_text" فنکشن میں ترمیم کرنے کے لیے، ہمیں موجودہ کوڈ میں کچھ ایڈجسٹمنٹ کرنے کی ضرورت ہے۔ یہ ترمیم ہمیں تصویر کے URLs کو براہ راست فنکشن میں داخل کرنے کی اجازت دے گی، API کو تصاویر پر کارروائی کرنے اور متن کو نکالنے کے قابل بنائے گی۔
سب سے پہلے، ہمیں موجودہ "detect_text" فنکشن کی ساخت کو سمجھنے کی ضرورت ہے۔ عام طور پر، فنکشن ان پٹ پیرامیٹر کے طور پر فائل کا راستہ لیتا ہے اور تصویر سے نکالا ہوا متن واپس کرتا ہے۔ کوڈ کچھ اس طرح نظر آسکتا ہے:
python def detect_text(file_path): # Code to load the image from the file path # Code to call the Google Vision API and process the image # Code to extract and return the text from the processed image return extracted_text
تصویری یو آر ایل کو ہینڈل کرنے کے لیے اس فنکشن میں ترمیم کرنے کے لیے، ہمیں ضروری تبدیلیاں شامل کرنے کی ضرورت ہے۔ یہاں فنکشن کا ایک تازہ ترین ورژن ہے:
python import requests from PIL import Image from io import BytesIO def detect_text(image_url): # Download the image from the URL response = requests.get(image_url) image = Image.open(BytesIO(response.content)) # Code to call the Google Vision API and process the image # Code to extract and return the text from the processed image return extracted_text
ترمیم شدہ کوڈ میں، ہم فراہم کردہ یو آر ایل سے تصویر ڈاؤن لوڈ کرنے کے لیے `درخواستیں` لائبریری کا استعمال کرتے ہیں۔ PIL (Python Imaging Library) ماڈیول سے `Image.open` طریقہ پھر تصویر کو مزید پروسیسنگ کے لیے کھولنے کے لیے استعمال کیا جاتا ہے۔
تصویر کے لوڈ ہونے کے بعد، ہم گوگل ویژن API کو کال کرنے اور متن کو نکالنے کے لیے تصویر پر کارروائی کر سکتے ہیں۔ اس مرحلے کے لیے مخصوص کوڈ API کے نفاذ اور استعمال کی جا رہی پروگرامنگ زبان کے لحاظ سے مختلف ہو سکتا ہے۔ تاہم، عمومی نقطہ نظر میں تصویری ڈیٹا کا استعمال کرتے ہوئے API کی درخواستیں کرنا اور ایک جواب موصول کرنا شامل ہے جس میں نکالا گیا متن ہو۔
آخر میں، ہم فنکشن سے نکالے گئے متن کو آؤٹ پٹ کے طور پر واپس کرتے ہیں۔
ترمیم شدہ فنکشن کے استعمال کی ایک مثال یہ ہے:
python image_url = "https://example.com/image.jpg" extracted_text = detect_text(image_url) print(extracted_text)
اس مثال میں، ہم 'detect_text' فنکشن میں تصویر کا URL بطور ان پٹ فراہم کرتے ہیں، جو پھر تصویر کو ڈاؤن لوڈ کرتا ہے، Google Vision API کا استعمال کرتے ہوئے اس پر کارروائی کرتا ہے، اور نکالا ہوا متن واپس کرتا ہے۔
فائل پاتھ کے بجائے تصویری یو آر ایل کو ہینڈل کرنے کے لیے "detect_text" فنکشن میں ترمیم کرنے کے لیے، ہمیں کوڈ کو شامل کرنے کی ضرورت ہے جو فراہم کردہ یو آر ایل سے تصویر کو ڈاؤن لوڈ کرتا ہے اور پھر Google Vision API کا استعمال کرتے ہوئے اس پر کارروائی کرتا ہے۔ یہ ایڈجسٹمنٹ کر کے، ہم تصویری URLs کو بطور ان پٹ استعمال کرتے ہوئے تصاویر سے متن کو مؤثر طریقے سے نکال سکتے ہیں۔
سے متعلق دیگر حالیہ سوالات اور جوابات شبیہہ سے متن کا پتہ لگانا اور نکالنا:
- ٹیکسٹ نکالنے کے لیے گوگل ویژن API استعمال کرنے کی کچھ ممکنہ ایپلی کیشنز کیا ہیں؟
- ہم پانڈا لائبریری کا استعمال کرتے ہوئے نکالے گئے متن کو مزید پڑھنے کے قابل کیسے بنا سکتے ہیں؟
- تصویر سے متن نکالنے کے لیے گوگل ویژن API استعمال کرنے میں کون سے اقدامات شامل ہیں؟
- ہم تصاویر سے متن کا پتہ لگانے اور نکالنے کے لیے گوگل ویژن API کا استعمال کیسے کر سکتے ہیں؟