Le forbairt na huaire, tá obair éifeachtach ag éirí níos tábhachtaí agus níos mó inár saol laethúil. Mar atá i réimsí an airgeadais, an oideachais, an árachais, na hoifige leictreonaí rialtais agus fiontraíochta, leagann na táirgí OCR/scanóirí doiciméad ról an-tábhachtach air sin. Leis na táirgí OCR a tharlaíonn, a laghdaíonn go mór ualach oibre na foirne, feabhas a chur ar an éifeachtacht oibre.
Cad is Aitheantas Optúil Carachtair (OCR) ann?
Is próiseas éifeachtach gnó í an teicneolaíocht um aithint optúil carachtar (OCR) a shábhálann am, costas agus acmhainní eile trí leas a bhaint as acmhainní uathoibrithe asbhainte sonraí agus stórála.
Uaireanta tagraítear d’aitheantas optúil carachtar (OCR) mar aitheantas téacs. Déanann clár OCR sonraí a bhaint agus a athúsáid ó dhoiciméid scanta, íomhánna ceamara agus comhaid pdf íomhánna amháin. Singles bogearraí OCR litreacha ar an íomhá, cuireann sé i bhfocail iad agus ansin cuireann na focail in abairtí, rud a ligeann rochtain agus eagarthóireacht ar an ábhar bunaidh. Cuireann sé deireadh freisin leis an ngá atá le hiontráil sonraí láimhe.
Úsáideann córais OCR meascán de chrua-earraí agus de bhogearraí chun doiciméid chlóite fisiceacha a thiontú go téacs meaisín-inléite. Crua-earraí — amhail scanóir optúil nó clár ciorcaid speisialaithe — a chóipeáil nó a léann téacs; ansin, de ghnáth láimhseálann bogearraí an ardphróiseáil.
Is féidir le bogearraí OCR leas a bhaint as hintleachta saorga (AI) chun modhanna níos forbartha a chur i bhfeidhm maidir le haitheantas cliste carachtar (ICR), amhail teangacha nó stíleanna peannaireachta a shainaithint. Is é an próiseas OCR is coitianta a úsáidtear chun cóip chrua de dhoiciméid dhlíthiúla nó stairiúla a thiontú ina ndoiciméid pdf ionas gur féidir le húsáideoirí na doiciméid a chur in eagar, a fhormáidiú agus a chuardach amhail is gur cruthaíodh iad le próiseálaí focal.
Conas a oibríonn aithint optúil carachtar?
Úsáideann Aitheantas Optúil Carachtair (OCR) scanóir chun foirm fhisiciúil doiciméid a phróiseáil. Nuair a dhéantar gach leathanach a chóipeáil, déanann bogearraí OCR an doiciméad a thiontú ina leagan dhá dhath nó dubh-agus-bán. Déantar anailís ar an íomhá scanta isteach nó ar an léarscáil ghiotán le haghaidh réimsí solais agus dorcha, agus sainaithnítear na limistéir dorcha mar charachtair ar gá iad a aithint, agus sainaithnítear réimsí solais mar chúlra. Déantar na limistéir dorcha a phróiseáil ansin chun litreacha aibítre nó digití uimhriúla a aimsiú. Go hiondúil is éard atá i gceist leis an gcéim seo ná díriú ar charachtar, ar fhocal nó ar bhloc téacs amháin ag an am céanna. Aithnítear carachtair ansin trí úsáid a bhaint as ceann amháin de dhá algartam — aithint patrún nó aithint gné.
Úsáidtear aitheantas patrún nuair a chuirtear samplaí de théacs i gclónna agus i bhformáidí éagsúla leis an gclár OCR chun carachtair sa doiciméad scanta nó sa chomhad íomhá a chur i gcomparáid agus a aithint.
Tarlaíonn braite gné nuair a chuireann an OCR rialacha i bhfeidhm maidir le gnéithe litreach nó uimhreach ar leith chun carachtair sa doiciméad scanta a aithint. Áirítear ar na gnéithe líon na línte dronuilleacha, línte crosáilte nó cuair i gcarachtar. Mar shampla, stóráiltear an phríomhlitir “A” mar dhá líne trasnánach a bhuaileann le líne chothrománach trasna an lár. Nuair a shainaithnítear carachtar, déantar é a thiontú ina chód ASCII (Cód Caighdeánach Meiriceánach um Idirmhalartú Faisnéise) a úsáideann córais ríomhaireachta chun ionramhálacha breise a láimhseáil.
Déanann clár OCR anailís freisin ar struchtúr íomhá doiciméid. Roinneann sé an leathanach ina eilimintí cosúil le bloic téacsanna, táblaí nó íomhánna. Roinntear na línte i bhfocail agus ansin i gcarachtar. Nuair a bheidh na carachtair sainaitheanta, cuireann an clár i gcomparáid iad le sraith íomhánna patrún. Tar éis próiseáil a dhéanamh ar gach meaitseáil dhóchúil, cuireann an clár an téacs aitheanta i láthair tú.
Is minic a úsáidtear OCR mar theicneolaíocht fholaithe, a thugann cumhacht do go leor córas agus seirbhísí aitheanta inár saol laethúil. I measc na gcásanna úsáide tábhachtacha — ach nach bhfuil mórán aithne — le haghaidh teicneolaíochta OCR tá uathoibriú iontrála sonraí, cuidiú le daoine dalla agus lagamhairc agus doiciméid innéacsaithe d’innill chuardaigh, amhail pasanna, plátaí ceadúnais, sonraisc, ráitis bhainc, cártaí gnó agus aitheantas uimhirphlátaí uathoibríoch. .
Gnéithe i gcomparáid le scanóirí traidisiúnta:
1. Meáchan éadrom, éasca a iompar agus a shuiteáil;
2. Tá an t-am scanadh gearr, is é 1-2S an gnáth-am scanadh, agus is féidir leat é a fháil láithreach;
3. Costas íseal
4. Is féidir leis aitheantas OCR a dhéanamh ar na pictiúir a gabhadh, na pictiúir a thiontú go doiciméid in eagar WORD, agus iad a chlóscríobh go huathoibríoch;
5. Teicneolaíocht facs gan pháipéar a ionchorprú, fiú mura bhfuil meaisín facs ann, is féidir leat facsanna a sheoladh fós, rud a fheabhsaíonn éifeachtacht facs go mór;
Cásanna úsáide optúla aitheantais carachtar
Is é an cás úsáide is cáiliúla maidir le haithint optúil carachtar (OCR) ná doiciméid pháipéir chlóite a thiontú ina ndoiciméid téacs atá inléite ag meaisín. Nuair a théann doiciméad páipéir scanta trí phróiseáil OCR, is féidir téacs an doiciméid a chur in eagar le próiseálaí focal cosúil le Microsoft Word nó Google Docs.
Cumasaíonn OCR leas iomlán a bhaint as samhaltú mórshonraí trí dhoiciméid pháipéir agus íomhá scanta a thiontú ina gcomhaid pdf atá inléite ag meaisín. Ní féidir próiseáil agus aisghabháil faisnéise luachmhar a uathoibriú gan OCR a chur i bhfeidhm ar dtús i ndoiciméid nach bhfuil sraitheanna téacs iontu cheana féin.
Le haitheantas téacs OCR, is féidir doiciméid scanta a chomhtháthú i gcóras mórshonraí atá anois in ann sonraí cliant a léamh ó ráitis bhainc, conarthaí agus doiciméid chlóite tábhachtacha eile. In ionad fostaithe a bheith ag scrúdú doiciméad íomhá gan áireamh agus ionchuir a bheathú de láimh i sreabhadh oibre próiseála mórshonraí uathoibrithe, is féidir le heagraíochtaí OCR a úsáid chun uathoibriú ag an gcéim ionchuir den mhianadóireacht sonraí. Is féidir le bogearraí OCR an téacs san íomhá a aithint, téacs a bhaint as pictiúir, an comhad téacs a shábháil agus tacú le jpg, jpeg, png, bmp, tiff, pdf agus formáidí eile.
Ar an mbunús de seo, tá Hampolaunced sraith modúl ceamara óatá ó5MP-16MP de shainmhíniú. Ag tús chéim forbartha Hampo, tháirg ár bhfoireann modúl ceamara usb den chéad chineál 5MP le haghaidh scanóir doiciméad ardluais;Leis anéileamh armargadh, Tá modúil ceamara USB 8MP, 13MP, agus fiú 16MP curthatháirgtear. Cad's níos mó, an t-éileamh ar ceamara amháin, go 2 ceamaraí, agus ceamaraí il á gcur i bhfeidhm ar an scanóir doiciméad.
Níos mó saincheaptha ag teastáil, déan teagmháil linn, d'fhéadfadh muid a dhearadh sástamodúl ceamarado do scanóir doiciméad OCR/OCV.
Am poist: Feabhra-23-2023