وقت کی ترقی کے ساتھ، ہماری روزمرہ کی زندگی میں موثر کام زیادہ سے زیادہ اہم ہوتا جا رہا ہے۔ جیسے کہ فنانس، تعلیم، انشورنس، گورنمنٹ اور انٹرپرائز الیکٹرانک آفس کے شعبوں میں، OCR/دستاویز سکینر مصنوعات اس پر بہت اہم کردار ادا کرتی ہیں۔ OCR پروڈکٹس کے ہوتے ہیں، جو عملے کے کام کا بوجھ بہت کم کرتے ہیں، کام کی کارکردگی کو بہتر بناتے ہیں۔
آپٹیکل کریکٹر ریکگنیشن (OCR) کیا ہے؟
آپٹیکل کریکٹر ریکگنیشن (OCR) ٹیکنالوجی ایک موثر کاروباری عمل ہے جو خودکار ڈیٹا نکالنے اور ذخیرہ کرنے کی صلاحیتوں کو استعمال کرکے وقت، لاگت اور دیگر وسائل کو بچاتا ہے۔
آپٹیکل کریکٹر ریکگنیشن (OCR) کو بعض اوقات ٹیکسٹ ریکگنیشن بھی کہا جاتا ہے۔ ایک OCR پروگرام سکین شدہ دستاویزات، کیمرہ امیجز اور صرف تصویری پی ڈی ایف سے ڈیٹا نکالتا اور دوبارہ تیار کرتا ہے۔ OCR سافٹ ویئر تصویر پر حروف کو اکٹھا کرتا ہے، انہیں الفاظ میں ڈالتا ہے اور پھر الفاظ کو جملوں میں ڈالتا ہے، اس طرح اصل مواد تک رسائی اور اس میں ترمیم کرنے کے قابل بناتا ہے۔ یہ دستی ڈیٹا انٹری کی ضرورت کو بھی ختم کرتا ہے۔
OCR سسٹمز جسمانی، پرنٹ شدہ دستاویزات کو مشین پڑھنے کے قابل متن میں تبدیل کرنے کے لیے ہارڈ ویئر اور سافٹ ویئر کے امتزاج کا استعمال کرتے ہیں۔ ہارڈ ویئر — جیسا کہ آپٹیکل سکینر یا خصوصی سرکٹ بورڈ — متن کی کاپیاں یا پڑھتا ہے۔ پھر، سافٹ ویئر عام طور پر ایڈوانس پروسیسنگ کو ہینڈل کرتا ہے۔
OCR سافٹ ویئر مصنوعی ذہانت (AI) کا فائدہ اٹھا کر ذہین کردار کی شناخت (ICR) کے مزید جدید طریقوں کو نافذ کر سکتا ہے، جیسے زبانوں یا ہینڈ رائٹنگ کے انداز کی شناخت۔ OCR کا عمل عام طور پر ہارڈ کاپی قانونی یا تاریخی دستاویزات کو پی ڈی ایف دستاویزات میں تبدیل کرنے کے لیے استعمال کیا جاتا ہے تاکہ صارف دستاویزات میں ترمیم، فارمیٹ اور تلاش کر سکیں جیسے کہ ورڈ پروسیسر کے ذریعے تخلیق کیا گیا ہو۔
آپٹیکل کریکٹر ریکگنیشن کیسے کام کرتی ہے؟
آپٹیکل کریکٹر ریکگنیشن (OCR) کسی دستاویز کی جسمانی شکل پر کارروائی کرنے کے لیے اسکینر کا استعمال کرتا ہے۔ تمام صفحات کاپی ہونے کے بعد، OCR سافٹ ویئر دستاویز کو دو رنگوں یا سیاہ اور سفید ورژن میں تبدیل کرتا ہے۔ اسکین شدہ امیج یا بٹ میپ کا روشنی اور تاریک علاقوں کے لیے تجزیہ کیا جاتا ہے، اور تاریک علاقوں کی شناخت ایسے حروف کے طور پر کی جاتی ہے جنہیں پہچاننے کی ضرورت ہوتی ہے، جبکہ ہلکے علاقوں کی شناخت پس منظر کے طور پر کی جاتی ہے۔ پھر تاریک علاقوں کو حروف تہجی کے حروف یا عددی ہندسوں کو تلاش کرنے کے لیے پروسیس کیا جاتا ہے۔ اس مرحلے میں عام طور پر ایک وقت میں ایک حرف، لفظ یا متن کے بلاک کو نشانہ بنانا شامل ہوتا ہے۔ پھر کرداروں کی شناخت دو الگورتھم میں سے ایک کا استعمال کرتے ہوئے کی جاتی ہے — پیٹرن کی شناخت یا خصوصیت کی شناخت۔
پیٹرن کی شناخت کا استعمال اس وقت ہوتا ہے جب OCR پروگرام کو اسکین شدہ دستاویز یا تصویری فائل میں حروف کا موازنہ اور شناخت کرنے کے لیے متن کی مثالیں مختلف فونٹس اور فارمیٹس میں دی جاتی ہیں۔
خصوصیت کا پتہ لگانا اس وقت ہوتا ہے جب OCR اسکین شدہ دستاویز میں حروف کو پہچاننے کے لیے مخصوص حرف یا نمبر کی خصوصیات کے حوالے سے قواعد کا اطلاق کرتا ہے۔ خصوصیات میں ایک کردار میں زاویہ کی لکیروں، کراس شدہ لائنوں یا منحنی خطوط کی تعداد شامل ہے۔ مثال کے طور پر، بڑے حرف "A" کو دو ترچھی لکیروں کے طور پر محفوظ کیا جاتا ہے جو درمیان میں ایک افقی لکیر سے ملتی ہیں۔ جب کسی کردار کی شناخت ہو جاتی ہے، تو اسے ASCII کوڈ (امریکن اسٹینڈرڈ کوڈ فار انفارمیشن انٹرچینج) میں تبدیل کر دیا جاتا ہے جسے کمپیوٹر سسٹم مزید ہیرا پھیری کو سنبھالنے کے لیے استعمال کرتے ہیں۔
ایک OCR پروگرام دستاویز کی تصویر کی ساخت کا بھی تجزیہ کرتا ہے۔ یہ صفحہ کو عناصر میں تقسیم کرتا ہے جیسے متن کے بلاکس، ٹیبلز یا تصاویر۔ لائنوں کو الفاظ میں اور پھر حروف میں تقسیم کیا گیا ہے۔ ایک بار کرداروں کو اکٹھا کرنے کے بعد، پروگرام ان کا موازنہ پیٹرن امیجز کے سیٹ سے کرتا ہے۔ تمام ممکنہ میچوں پر کارروائی کرنے کے بعد، پروگرام آپ کو تسلیم شدہ متن کے ساتھ پیش کرتا ہے۔
OCR کو اکثر ایک پوشیدہ ٹیکنالوجی کے طور پر استعمال کیا جاتا ہے، جو ہماری روزمرہ کی زندگی میں بہت سے معروف نظاموں اور خدمات کو طاقت فراہم کرتی ہے۔ اہم - لیکن کم معروف - OCR ٹیکنالوجی کے استعمال کے معاملات میں ڈیٹا انٹری آٹومیشن، نابینا اور بصارت سے محروم افراد کی مدد اور سرچ انجنوں کے لیے دستاویزات کی فہرست سازی، جیسے پاسپورٹ، لائسنس پلیٹس، رسیدیں، بینک اسٹیٹمنٹس، بزنس کارڈز اور خودکار نمبر پلیٹ کی شناخت شامل ہیں۔ .
روایتی سکینرز کے مقابلے میں خصوصیات:
1. ہلکا پھلکا، لے جانے اور انسٹال کرنے میں آسان؛
2. اسکیننگ کا وقت کم ہے، عام اسکیننگ کا وقت 1-2S ہے، اور آپ اسے فوری طور پر حاصل کر سکتے ہیں۔
3. کم قیمت
4. یہ پکڑی گئی تصویروں پر OCR کی شناخت کر سکتا ہے، تصویروں کو WORD قابل تدوین دستاویزات میں تبدیل کر سکتا ہے، اور خود بخود ٹائپ سیٹ کر سکتا ہے۔
5. پیپر لیس فیکس ٹیکنالوجی کو شامل کرنا، یہاں تک کہ اگر فیکس مشین نہ بھی ہو، تب بھی آپ فیکس بھیج سکتے ہیں، جس سے فیکس کی کارکردگی میں نمایاں بہتری آتی ہے۔
آپٹیکل کریکٹر ریکگنیشن کے استعمال کے کیسز
آپٹیکل کریکٹر ریکگنیشن (او سی آر) کے لیے سب سے زیادہ معروف کیس پرنٹ شدہ کاغذی دستاویزات کو مشین پڑھنے کے قابل ٹیکسٹ دستاویزات میں تبدیل کرنا ہے۔ ایک بار اسکین شدہ کاغذی دستاویز OCR پروسیسنگ سے گزرنے کے بعد، دستاویز کے متن کو ورڈ پروسیسر جیسے Microsoft Word یا Google Docs سے ایڈٹ کیا جا سکتا ہے۔
OCR کاغذ اور اسکین شدہ تصویری دستاویزات کو مشین پڑھنے کے قابل، قابل تلاش پی ڈی ایف فائلوں میں تبدیل کرکے بڑے ڈیٹا ماڈلنگ کی اصلاح کو قابل بناتا ہے۔ قیمتی معلومات کو پروسیسنگ اور بازیافت کرنا ان دستاویزات میں او سی آر کا اطلاق کیے بغیر خودکار نہیں ہو سکتا جہاں ٹیکسٹ کی تہیں پہلے سے موجود نہیں ہیں۔
OCR ٹیکسٹ ریکگنیشن کے ساتھ، اسکین شدہ دستاویزات کو ایک بڑے ڈیٹا سسٹم میں ضم کیا جا سکتا ہے جو اب بینک اسٹیٹمنٹس، معاہدوں اور دیگر اہم پرنٹ شدہ دستاویزات سے کلائنٹ ڈیٹا کو پڑھنے کے قابل ہے۔ ملازمین کو لاتعداد تصویری دستاویزات کی جانچ پڑتال کرنے اور خودکار بڑے ڈیٹا پروسیسنگ ورک فلو میں دستی طور پر ان پٹ فیڈ کرنے کے بجائے، تنظیمیں ڈیٹا مائننگ کے ان پٹ مرحلے پر خودکار کرنے کے لیے OCR کا استعمال کر سکتی ہیں۔ OCR سافٹ ویئر تصویر میں موجود متن کی شناخت کرسکتا ہے، تصویروں میں متن نکال سکتا ہے، ٹیکسٹ فائل کو محفوظ کرسکتا ہے اور jpg، jpeg، png، bmp، tiff، pdf اور دیگر فارمیٹس کو سپورٹ کرسکتا ہے۔
اس کی بنیادی بات پر ہیمپو کے پاس ہے۔lآنچed سے کیمرہ ماڈیولز کی ایک سیریزجس سے5MP-16MP تعریف کے. ہیمپو کی ترقی کے مرحلے کے آغاز میں، ہماری ٹیم نے تیز رفتار دستاویز سکینر کے لیے پہلی قسم کا 5MP USB کیمرہ ماڈیول تیار کیا۔کے ساتھکا مطالبہمارکیٹ, 8MP، 13MP، اور یہاں تک کہ 16MP USB کیمرہ ماڈیولز رہے ہیں۔پیدا کیا کیا'مزید یہ کہ دستاویز اسکینر پر ایک کیمرہ، 2 کیمروں اور ملٹی کیمروں کی مانگ ہے۔
مزید اپنی مرضی کے مطابق کی ضرورت ہے، ہم سے رابطہ کریں، ہم ایک مطمئن ڈیزائن کر سکتے ہیںکیمرے ماڈیولآپ کے OCR/OCV دستاویز سکینر کے لیے۔
پوسٹ ٹائم: فروری-23-2023