काळाच्या विकासाबरोबर, आपल्या दैनंदिन जीवनात कार्यक्षम कार्य अधिकाधिक महत्त्वाचे होत आहे. जसे की वित्त, शिक्षण, विमा, सरकारी आणि एंटरप्राइझ इलेक्ट्रॉनिक कार्यालय या क्षेत्रात, OCR/दस्तऐवज स्कॅनर उत्पादने यावर खूप महत्त्वाची भूमिका बजावतात. OCR उत्पादने येतात, जे कर्मचाऱ्यांवर कामाचा भार मोठ्या प्रमाणात कमी करतात, कामाची कार्यक्षमता सुधारतात.
ऑप्टिकल कॅरेक्टर रिकग्निशन (OCR) म्हणजे काय?
ऑप्टिकल कॅरेक्टर रेकग्निशन (OCR) तंत्रज्ञान ही एक कार्यक्षम व्यवसाय प्रक्रिया आहे जी स्वयंचलित डेटा काढणे आणि स्टोरेज क्षमतांचा वापर करून वेळ, खर्च आणि इतर संसाधने वाचवते.
ऑप्टिकल कॅरेक्टर रेकग्निशन (ओसीआर) ला कधीकधी मजकूर ओळख म्हणून संबोधले जाते. एक OCR प्रोग्राम स्कॅन केलेल्या दस्तऐवज, कॅमेरा प्रतिमा आणि प्रतिमा-फक्त pdf मधून डेटा काढतो आणि पुन्हा वापरतो. OCR सॉफ्टवेअर प्रतिमेवरील अक्षरे काढते, त्यांना शब्दांमध्ये ठेवते आणि नंतर शब्दांना वाक्यांमध्ये ठेवते, अशा प्रकारे मूळ सामग्रीमध्ये प्रवेश आणि संपादन सक्षम करते. हे मॅन्युअल डेटा एंट्रीची आवश्यकता देखील काढून टाकते.
OCR प्रणाली भौतिक, मुद्रित दस्तऐवजांना मशीन-वाचनीय मजकूरात रूपांतरित करण्यासाठी हार्डवेअर आणि सॉफ्टवेअरच्या संयोजनाचा वापर करतात. हार्डवेअर — जसे की ऑप्टिकल स्कॅनर किंवा विशेष सर्किट बोर्ड — कॉपी किंवा मजकूर वाचतो; त्यानंतर, सॉफ्टवेअर विशेषत: प्रगत प्रक्रिया हाताळते.
भाषा किंवा हस्तलेखनाच्या शैली ओळखणे यासारख्या इंटेलिजेंट कॅरेक्टर रिकग्निशन (ICR) च्या अधिक प्रगत पद्धती लागू करण्यासाठी OCR सॉफ्टवेअर कृत्रिम बुद्धिमत्ता (AI) चा फायदा घेऊ शकते. OCR ची प्रक्रिया सामान्यतः हार्ड कॉपी कायदेशीर किंवा ऐतिहासिक दस्तऐवजांना पीडीएफ दस्तऐवजांमध्ये रूपांतरित करण्यासाठी वापरली जाते जेणेकरुन वापरकर्ते एखाद्या वर्ड प्रोसेसरने तयार केल्याप्रमाणे दस्तऐवज संपादित करू शकतात, स्वरूपित करू शकतात आणि शोधू शकतात.
ऑप्टिकल वर्ण ओळख कसे कार्य करते?
ऑप्टिकल कॅरेक्टर रेकग्निशन (OCR) कागदपत्राच्या भौतिक स्वरूपावर प्रक्रिया करण्यासाठी स्कॅनर वापरते. एकदा सर्व पृष्ठे कॉपी झाल्यानंतर, OCR सॉफ्टवेअर दस्तऐवज दोन-रंगीत किंवा काळ्या-पांढऱ्या आवृत्तीत रूपांतरित करते. स्कॅन-इन इमेज किंवा बिटमॅपचे प्रकाश आणि गडद भागांसाठी विश्लेषण केले जाते आणि गडद भाग ओळखले जाणे आवश्यक असलेले वर्ण म्हणून ओळखले जातात, तर प्रकाश क्षेत्र पार्श्वभूमी म्हणून ओळखले जातात. नंतर वर्णमाला अक्षरे किंवा अंकीय अंक शोधण्यासाठी गडद भागांवर प्रक्रिया केली जाते. या स्टेजमध्ये सामान्यत: एका वेळी एक वर्ण, शब्द किंवा मजकूराच्या ब्लॉकला लक्ष्य करणे समाविष्ट असते. त्यानंतर दोन अल्गोरिदमपैकी एक वापरून वर्ण ओळखले जातात - नमुना ओळख किंवा वैशिष्ट्य ओळख.
OCR प्रोग्रामला स्कॅन केलेल्या दस्तऐवज किंवा इमेज फाइलमधील वर्णांची तुलना आणि ओळखण्यासाठी विविध फॉन्ट आणि फॉरमॅटमधील मजकूराची उदाहरणे दिली जातात तेव्हा नमुना ओळख वापरली जाते.
OCR स्कॅन केलेल्या दस्तऐवजातील वर्ण ओळखण्यासाठी विशिष्ट अक्षर किंवा क्रमांकाच्या वैशिष्ट्यांशी संबंधित नियम लागू करते तेव्हा वैशिष्ट्य शोधणे उद्भवते. वैशिष्ट्यांमध्ये वर्णातील कोन रेषा, ओलांडलेल्या रेषा किंवा वक्रांची संख्या समाविष्ट असते. उदाहरणार्थ, कॅपिटल अक्षर “A” हे दोन कर्णरेषा म्हणून संग्रहित केले जाते जे मध्यभागी आडव्या रेषेला भेटतात. जेव्हा एखादे वर्ण ओळखले जाते, तेव्हा ते ASCII कोड (अमेरिकन स्टँडर्ड कोड फॉर इन्फॉर्मेशन इंटरचेंज) मध्ये रूपांतरित केले जाते जे संगणक प्रणाली पुढील हाताळणी हाताळण्यासाठी वापरतात.
ओसीआर प्रोग्राम डॉक्युमेंट इमेजच्या संरचनेचे विश्लेषण देखील करतो. हे पृष्ठ मजकूर, सारणी किंवा प्रतिमा यांसारख्या घटकांमध्ये विभाजित करते. ओळी शब्दांमध्ये आणि नंतर वर्णांमध्ये विभागल्या जातात. पात्रांची निवड केल्यावर, प्रोग्राम त्यांची तुलना नमुना प्रतिमांच्या संचाशी करतो. सर्व संभाव्य जुळण्यांवर प्रक्रिया केल्यानंतर, प्रोग्राम तुम्हाला मान्यताप्राप्त मजकूर सादर करतो.
आपल्या दैनंदिन जीवनात अनेक सुप्रसिद्ध सिस्टीम आणि सेवांना शक्ती देणारे, ओसीआर अनेकदा लपविलेले तंत्रज्ञान म्हणून वापरले जाते. OCR तंत्रज्ञानासाठी महत्त्वाच्या - परंतु कमी ज्ञात - वापराच्या प्रकरणांमध्ये डेटा-एंट्री ऑटोमेशन, अंध आणि दृष्टिहीन व्यक्तींना मदत करणे आणि शोध इंजिनांसाठी अनुक्रमणिका कागदपत्रे, जसे की पासपोर्ट, लायसन्स प्लेट्स, इनव्हॉइस, बँक स्टेटमेंट, व्यवसाय कार्ड आणि स्वयंचलित नंबर प्लेट ओळख यांचा समावेश आहे. .
पारंपारिक स्कॅनरच्या तुलनेत वैशिष्ट्ये:
1. हलके, वाहून नेणे आणि स्थापित करणे सोपे;
2. स्कॅनिंग वेळ लहान आहे, सामान्य स्कॅनिंग वेळ 1-2S आहे, आणि आपण ते त्वरित मिळवू शकता;
3. कमी खर्च
4. ते कॅप्चर केलेल्या चित्रांवर ओसीआर ओळख करू शकते, चित्रांना वर्ड संपादन करण्यायोग्य दस्तऐवजांमध्ये रूपांतरित करू शकते आणि स्वयंचलितपणे टाइपसेट करू शकते;
5. पेपरलेस फॅक्स तंत्रज्ञान समाविष्ट करणे, फॅक्स मशीन नसले तरीही, तुम्ही फॅक्स पाठवू शकता, ज्यामुळे फॅक्स कार्यक्षमतेत लक्षणीय सुधारणा होते;
ऑप्टिकल वर्ण ओळख वापर प्रकरणे
ऑप्टिकल कॅरेक्टर रेकग्निशन (OCR) साठी सर्वात प्रसिद्ध वापर केस म्हणजे मुद्रित कागदी दस्तऐवजांना मशीन-वाचनीय मजकूर दस्तऐवजांमध्ये रूपांतरित करणे. एकदा स्कॅन केलेला कागदी दस्तऐवज OCR प्रक्रियेतून गेला की, दस्तऐवजाचा मजकूर Microsoft Word किंवा Google Docs सारख्या वर्ड प्रोसेसरने संपादित केला जाऊ शकतो.
OCR पेपर आणि स्कॅन केलेल्या प्रतिमा दस्तऐवजांना मशीन-वाचण्यायोग्य, शोधण्यायोग्य pdf फायलींमध्ये रूपांतरित करून बिग-डेटा मॉडेलिंगचे ऑप्टिमायझेशन सक्षम करते. ज्या दस्तऐवजांमध्ये मजकूर स्तर आधीपासून अस्तित्वात नाहीत तेथे प्रथम OCR लागू केल्याशिवाय मौल्यवान माहितीवर प्रक्रिया करणे आणि पुनर्प्राप्त करणे स्वयंचलित केले जाऊ शकत नाही.
OCR मजकूर ओळखीसह, स्कॅन केलेले दस्तऐवज एका बिग-डेटा प्रणालीमध्ये एकत्रित केले जाऊ शकतात जे आता बँक स्टेटमेंट्स, करार आणि इतर महत्त्वाच्या मुद्रित दस्तऐवजांमधून क्लायंट डेटा वाचण्यास सक्षम आहे. कर्मचाऱ्यांना असंख्य प्रतिमा दस्तऐवजांची तपासणी करण्याऐवजी आणि स्वयंचलित बिग-डेटा प्रोसेसिंग वर्कफ्लोमध्ये इनपुट स्वतः फीड करण्याऐवजी, संस्था डेटा मायनिंगच्या इनपुट टप्प्यावर स्वयंचलित करण्यासाठी OCR वापरू शकतात. OCR सॉफ्टवेअर इमेजमधील मजकूर ओळखू शकतो, चित्रांमधील मजकूर काढू शकतो, मजकूर फाइल सेव्ह करू शकतो आणि jpg, jpeg, png, bmp, tiff, pdf आणि इतर फॉरमॅटला सपोर्ट करू शकतो.
ह्याच्या बेसिक वर, हॅम्पोकडे आहेlचाचाed पासून कॅमेरा मॉड्यूल्सची मालिकाजे पासून5MP-16MP व्याख्या. हॅम्पो डेव्हलपमेंट स्टेजच्या सुरुवातीला, आमच्या टीमने हाय स्पीड डॉक्युमेंट स्कॅनरसाठी पहिले प्रकार 5MP usb कॅमेरा मॉड्यूल तयार केले;सहची मागणीबाजार, 8MP, 13MP, आणि अगदी 16MP USB कॅमेरा मॉड्यूल्स आहेतउत्पादित काय'अधिक म्हणजे, डॉक्युमेंट स्कॅनरवर एक कॅमेरा, 2 कॅमेरे आणि मल्टी कॅमेऱ्यांची मागणी आहे.
अधिक सानुकूलित आवश्यक आहे, कृपया आमच्याशी संपर्क साधा, आम्ही समाधानी डिझाइन करू शकतोकॅमेरा मॉड्यूलतुमच्या OCR/OCV दस्तऐवज स्कॅनरसाठी.
पोस्ट वेळ: फेब्रुवारी-23-2023