Scan ac OCR

Prynhawn da

Mae'n debyg bod pob un ohonom yn wynebu'r dasg pan fydd angen i chi gyfieithu dogfen bapur yn ffurf electronig. Mae hyn yn arbennig o angenrheidiol i'r rhai sy'n astudio, gweithio gyda dogfennau, cyfieithu testunau gan ddefnyddio geiriaduron electronig, ac ati.

Yn yr erthygl hon hoffwn rannu rhai o hanfodion y broses hon. Yn gyffredinol, mae sganio a chydnabod testun yn cymryd llawer o amser, gan y bydd yn rhaid gwneud y rhan fwyaf o weithrediadau â llaw. Byddwn yn ceisio darganfod beth, sut a pham.

Nid yw pawb yn deall un peth ar unwaith. Ar ôl sganio (gosod yr holl daflenni ar y sganiwr) bydd gennych luniau o'r fformat BMP, JPG, PNG, GIF (gall fod fformatau eraill). Felly o'r llun hwn mae angen i chi gael y testun - gelwir y weithdrefn hon yn gydnabyddiaeth. Yn y drefn hon, caiff ei chyflwyno isod.

Y cynnwys

  • 1. Beth sydd ei angen ar gyfer sganio a chydnabod?
  • 2. Opsiynau sganio testun
  • 3. Cydnabod testun y ddogfen
    • 3.1 Testun
    • 3.2 Lluniau
    • 3.3 Tablau
    • 3.4 Eitemau Diangen
  • 4. Cydnabod ffeiliau PDF / DJVU
  • 5. Gwall wrth wirio ac arbed canlyniadau gwaith

1. Beth sydd ei angen ar gyfer sganio a chydnabod?

1) Sganiwr

I gyfieithu dogfennau printiedig i ffurf testun, bydd angen sganiwr arnoch chi yn gyntaf, ac, yn unol â hynny, rhaglenni "brodorol" a gyrwyr a aeth gydag ef. Gyda nhw gallwch sganio'r ddogfen a'i chadw i'w brosesu ymhellach.

Gallwch ddefnyddio analogau eraill, ond mae'r meddalwedd a ddaeth gyda'r sganiwr yn y pecyn fel arfer yn gweithio'n gyflymach ac mae ganddo fwy o ddewisiadau.

Yn dibynnu ar ba fath o sganiwr sydd gennych - gall cyflymder y gwaith amrywio'n sylweddol. Mae yna sganwyr sy'n gallu cael llun o ddalen mewn 10 eiliad, mae yna rai a fydd yn ei gael mewn 30 eiliad. Os ydych chi'n sganio llyfr ar 200-300 o daflenni - rwy'n credu nad yw'n anodd cyfrifo sawl gwaith y bydd gwahaniaeth mewn amser?

2) Rhaglen gydnabyddiaeth

Yn ein herthygl, byddaf yn dangos y gwaith i chi yn un o'r rhaglenni gorau ar gyfer sganio a chydnabod unrhyw ddogfennau - ABBYY FineReader. Ers hynny mae'r rhaglen yn cael ei thalu, yna byddaf ar unwaith yn rhoi dolen i un arall - ei analog am ddim o'r Ffurflen Cunei. Gwir, ni fyddwn yn eu cymharu, oherwydd y ffaith bod FineReader yn ennill ym mhob ffordd, rwy'n argymell rhoi cynnig arni i gyd.

ABBYY FineReader 11

Gwefan swyddogol: //www.abbyy.ru/

Un o'r rhaglenni gorau o'i fath. Mae wedi'i gynllunio i adnabod y testun yn y llun. Adeiladwyd nifer o opsiynau a nodweddion. Gall baratowch griw o ffontiau, hyd yn oed yn cefnogi fersiynau â llawysgrifen (er nad wyf wedi rhoi cynnig arni yn bersonol, rwy'n credu ei bod yn dda iawn i adnabod y fersiwn llawysgrifen, oni bai bod gennych lawysgrif caligraffeg berffaith). Trafodir isod fwy o wybodaeth am weithio gyda hi. Nodwn yma hefyd y bydd yr erthygl yn cwmpasu'r gwaith mewn rhaglenni rhaglen 11.

Fel rheol, nid yw fersiynau gwahanol o ABBYY FineReader yn wahanol iawn i'w gilydd. Gallwch yn hawdd wneud yr un peth yn y llall. Gallai'r prif wahaniaethau fod yn gyfleus, yn gyflym ac yn gyflym. Er enghraifft, mae fersiynau cynharach yn gwrthod agor dogfen PDF a DJVU ...

3) Dogfennau i'w sganio

Do, felly, penderfynais fynd â'r dogfennau allan mewn colofn ar wahân. Yn y rhan fwyaf o achosion, sganiwch unrhyw werslyfrau, papurau newydd, erthyglau, cylchgronau ac ati hy y llyfrau hynny a'r llenyddiaeth sydd ei hangen. Beth ydw i'n arwain ato? O brofiad personol, gallaf ddweud cymaint yr ydych am ei sganio - efallai eich bod chi ar y we yn barod! Sawl gwaith y gwnes i arbed amser yn bersonol pan gefais un llyfr neu un arall a sganiwyd eisoes ar y rhwydwaith. Roedd yn rhaid i mi gopïo'r testun yn y ddogfen a pharhau ag ef.

O'r cyngor syml hwn - cyn i chi sganio rhywbeth, gwiriwch a yw rhywun eisoes wedi ei sganio ac nid oes angen i chi wastraffu'ch amser.

2. Opsiynau sganio testun

Yma, ni fyddaf yn siarad am eich gyrwyr ar gyfer y sganiwr, y rhaglenni a aeth gydag ef, gan fod yr holl fodelau sganiwr yn wahanol, mae meddalwedd hefyd yn wahanol ym mhob man ac yn dyfalu ac mae hyd yn oed yn fwy eglur dangos sut i berfformio'r llawdriniaeth yn afrealistig.

Ond mae gan yr holl sganwyr yr un gosodiadau a all effeithio'n fawr ar gyflymder ac ansawdd eich gwaith. Yma, byddaf yn siarad yma. Byddaf yn rhestru mewn trefn.

1) Ansawdd sgan - DPI

Yn gyntaf, gosodwch ansawdd y sgan yn yr opsiynau nad ydynt yn llai na 300 DPI. Fe'ch cynghorir i roi ychydig mwy, os yn bosibl. Po uchaf yw'r dangosydd DPI, yr egluraf y bydd eich llun yn dod allan, ac felly, bydd prosesu pellach yn digwydd yn gynt. Yn ogystal, po uchaf yw ansawdd y sgan - y lleiaf o gamgymeriadau y mae'n rhaid i chi eu cywiro yn ddiweddarach.

Mae'r opsiwn gorau yn darparu, fel arfer 300-400 DPI.

2) cromatigrwydd

Mae'r paramedr hwn yn effeithio'n fawr ar amser y sgan (gyda llaw, mae DPI hefyd yn effeithio, ond maent mor gryf, a dim ond pan fydd y defnyddiwr yn gosod gwerthoedd uchel).

Fel arfer mae tri dull:

- du a gwyn (perffaith ar gyfer testun plaen);

- llwyd (addas ar gyfer testun gyda thablau a lluniau);

- lliw (ar gyfer cylchgronau lliw, llyfrau, yn gyffredinol, dogfennau, lle mae lliw yn bwysig).

Fel arfer mae amser y sgan yn dibynnu ar y dewis o liw. Wedi'r cyfan, os oes gennych ddogfen fawr, bydd hyd yn oed y 5-10 eiliad ychwanegol ar y dudalen gyfan yn arwain at amser gweddus ...

3) Lluniau

Gallwch gael y ddogfen nid yn unig trwy sganio, ond hefyd trwy dynnu llun ohoni. Fel rheol, yn yr achos hwn bydd gennych rai problemau eraill: afluniad delwedd, yn aneglur. Oherwydd hyn, efallai y bydd angen golygu a phrosesu'r testun a dderbynnir ymhellach. Yn bersonol, nid wyf yn argymell defnyddio camerâu ar gyfer y busnes hwn.

Mae'n bwysig nodi na fydd pob dogfen o'r fath yn cael ei chydnabod, oherwydd ansawdd sgan gall fod yn isel iawn ...

3. Cydnabod testun y ddogfen

Tybiwn fod y tudalennau annwyl a sganiwyd a gawsoch. Mae'r rhain yn aml yn fformatau: tif, bmb, jpg, png. Yn gyffredinol, ar gyfer ABBYY FineReader - nid yw hyn yn bwysig iawn ...

Ar ôl agor y llun yn ABBYY FineReader, mae'r rhaglen, fel rheol, ar y peiriant yn dechrau dewis ardaloedd a'u hadnabod. Ond weithiau mae'n anghywir. Ar gyfer hyn rydym yn ystyried dewis yr ardaloedd dymunol â llaw.

Mae'n bwysig! Nid yw pawb ar unwaith yn deall, ar ôl agor dogfen yn y rhaglen, bod y ddogfen ffynhonnell wedi'i harddangos ar y chwith yn y ffenestr, lle rydych chi'n amlygu gwahanol ardaloedd. Ar ôl clicio ar y botwm "cydnabyddiaeth", bydd y rhaglen yn y ffenestr ar y dde yn dod â'r testun gorffenedig i chi. Ar ôl ei gydnabod, gyda llaw, fe'ch cynghorir i wirio'r testun am wallau yn yr un FineReader.

3.1 Testun

Defnyddir yr ardal hon i amlygu testun. Dylid eithrio lluniau a thablau ohono. Bydd rhaid rhoi ffontiau prin ac anghyffredin i mewn â llaw ...

I ddewis ardal destun, rhowch sylw i'r panel ar frig y FineReader. Mae botwm "T" (gweler y sgrînlun isod, pwyntydd y llygoden ar y botwm hwn yn unig). Cliciwch arno, yna yn y llun isod dewiswch yr ardal hirsgwar daclus lle mae'r testun wedi'i leoli. Gyda llaw, mewn rhai achosion mae angen i chi greu blociau testun o 2-3, ac weithiau 10-12 y dudalen, oherwydd Gall fformatio testun fod yn wahanol ac nid ydynt yn dewis yr ardal gyfan gydag un petryal.

Mae'n bwysig nodi na ddylai delweddau syrthio i'r ardal destun! Yn y dyfodol, bydd yn arbed llawer o amser i chi ...

3.2 Lluniau

Fe'i defnyddir i amlygu delweddau a'r ardaloedd hynny sy'n anodd eu hadnabod oherwydd ffont o ansawdd gwael neu anarferol.

Yn y llun isod, mae pwyntydd y llygoden wedi'i leoli ar y botwm a ddefnyddir i ddewis yr ardal "llun". Gyda llaw, gellir dewis unrhyw ran o'r dudalen yn yr ardal hon, a bydd FineReader wedyn yn ei rhoi yn y ddogfen fel delwedd arferol. Hy dim ond "dwp" fydd yn copïo ...

Yn nodweddiadol, defnyddir yr ardal hon i dynnu sylw at dablau sydd wedi'u sganio'n wael, i amlygu testun a ffont ansafonol, y delweddau eu hunain.

3.3 Tablau

Mae'r llun isod yn dangos y botwm i dynnu sylw at y tablau. Yn gyffredinol, anaml iawn y byddaf yn ei ddefnyddio. Y ffaith yw bod yn rhaid i chi dynnu (yn wir) bob llinell ar y bwrdd yn rheolaidd a dangos beth a sut y mae'r rhaglen. Os yw'r tabl yn fach ac nad yw o ansawdd da iawn, argymhellaf ddefnyddio'r ardal "llun" at y dibenion hyn. O ganlyniad, arbed llawer o amser, ac yna gallwch wneud tabl yn Word yn gyflym ar sail llun.

3.4 Eitemau Diangen

Mae'n bwysig nodi. Weithiau mae elfennau diangen ar y dudalen sy'n ei gwneud yn anodd adnabod y testun, neu beidio â gadael i chi ddewis yr ardal a ddymunir o gwbl. Gellir eu symud gan ddefnyddio'r "rhwbiwr" o gwbl.

I wneud hyn, ewch i'r modd golygu delweddau.

Dewiswch yr offeryn rhwbio a dewiswch yr ardal nad oes ei heisiau. Bydd yn cael ei ddileu ac yn ei le bydd yn bapur gwyn.

Gyda llaw, rwy'n argymell defnyddio'r opsiwn hwn i chi mor aml â phosibl. Rhowch gynnig ar yr holl feysydd testun a ddewiswyd gennych, lle nad oes angen darn o destun arnoch chi, neu os oes unrhyw bwyntiau diangen, blinder, afluniadau - dilëwch gyda rhwbiwr. Bydd diolch i'r gydnabyddiaeth hon yn gyflymach!

4. Cydnabod ffeiliau PDF / DJVU

Yn gyffredinol, ni fydd y fformat cydnabyddiaeth hwn yn wahanol i'r lleill - ee. Gallwch weithio gydag ef fel lluniau. Yr unig beth na ddylai'r rhaglen fod yn rhy hen fersiwn, os nad ydych yn agor ffeiliau PDF / DJVU - diweddarwch y fersiwn i 11.

Ychydig o gyngor. Ar ôl agor y ddogfen yn FineReader - bydd yn dechrau adnabod y ddogfen yn awtomatig. Yn aml mewn ffeiliau PDF / DJVU, nid oes angen ardal benodol o'r dudalen drwy'r ddogfen gyfan! I gael gwared ar ardal o'r fath ar bob tudalen, gwnewch y canlynol:

1. Ewch i'r adran golygu delweddau.

2. Galluogi'r opsiwn "tocio".

3. Dewiswch yr ardal sydd ei hangen arnoch ar bob tudalen.

4. Cliciwch ar bob tudalen a thrim.

5. Gwall wrth wirio ac arbed canlyniadau gwaith

Ymddengys y gallai fod problemau o hyd pan ddewisir yr holl ardaloedd, yna eu cydnabod - cymerwch ef a'i achub ... Nid oedd yno!

Yn gyntaf, mae angen i ni wirio'r ddogfen!

Er mwyn ei alluogi, ar ôl ei gydnabod, yn y ffenestr ar y dde, bydd botwm "siec", gweler y llun isod. Ar ôl ei glicio, bydd rhaglen FineReader yn dangos yn awtomatig y meysydd hynny lle mae gan y rhaglen wallau ac ni allai bennu un neu symbol arall yn ddibynadwy. Bydd yn rhaid i chi ddewis, neu gytuno â barn y rhaglen, neu gofnodi'ch cymeriad.

Gyda llaw, mewn hanner yr achosion, tua, bydd y rhaglen yn cynnig gair cywir i chi - mae'n rhaid i chi ddefnyddio'r llygoden i ddewis yr opsiwn rydych ei eisiau.

Yn ail, ar ôl gwirio, mae angen i chi ddewis y fformat yr ydych yn cadw canlyniad eich gwaith ynddo.

Yma mae FineReader yn rhoi tro i chi i'r eithaf: gallwch yn syml drosglwyddo'r wybodaeth yn Word un-i-un, a gallwch ei chadw mewn un o ddwsinau o fformatau. Ond hoffwn dynnu sylw at agwedd bwysig arall. Pa fformat bynnag a ddewiswch, mae'n bwysicach dewis y math o gopi! Ystyriwch yr opsiynau mwyaf diddorol ...

Copi union

Bydd yr holl feysydd a ddewiswyd gennych ar y dudalen yn y ddogfen gydnabyddedig yn cyfateb yn union yn y ddogfen ffynhonnell. Dewis cyfleus iawn pan mae'n bwysig i chi beidio â cholli fformatio testun. Gyda llaw, bydd y ffontiau hefyd yn debyg iawn i'r gwreiddiol. Argymhellaf gyda'r opsiwn hwn i drosglwyddo'r ddogfen i Word, i barhau â gwaith pellach yno.

Copi y gellir ei olygu

Mae'r opsiwn hwn yn dda oherwydd eich bod yn cael fersiwn wedi'i fformatio o'r testun. Hy Treulio'r "cilomedr", a allai fod wedi bod yn y ddogfen wreiddiol - ni fyddwch yn cwrdd. Dewis defnyddiol pan fyddwch yn golygu'r wybodaeth yn sylweddol.

Gwir, ni ddylech ddewis a yw'n bwysig i chi gadw steil y dyluniad, ffontiau, mewnosodiadau. Weithiau, os nad yw'r gydnabyddiaeth yn llwyddiannus iawn - gall eich dogfen "wyro" oherwydd y newid fformat. Yn yr achos hwn, fe'ch cynghorir i ddewis copi union.

Testun plaen

Opsiwn i'r rhai sydd angen y testun o'r dudalen heb bopeth arall. Addas ar gyfer dogfennau heb luniau a thablau.

Daw hyn â'r casgliad sganio a chydnabod dogfennau i ben. Gobeithio, gyda chymorth yr awgrymiadau syml hyn, y gallwch ddatrys eich problemau ...

Pob lwc!