Adnabod y testun. Rhaglen am ddim - analog FineReader

Yn hwyr neu'n hwyrach, mae pawb sy'n aml yn gweithio gyda rhaglenni swyddfa yn wynebu tasg nodweddiadol - sganio'r testun o lyfr, cylchgrawn, papur newydd, taflenni yn unig, ac yna trosi'r lluniau hyn yn fformat testun, er enghraifft, i ddogfen Word.

I wneud hyn mae angen sganiwr a rhaglen arbennig ar gyfer adnabod testun. Bydd yr erthygl hon yn trafod analog am ddim FineReader -Cuneiform (am gydnabyddiaeth yn FineReader - gweler yr erthygl hon).

Gadewch i ni ddechrau ...

Y cynnwys

  • 1. Nodweddion rhaglen CuneiForm, nodweddion
  • 2. Enghraifft o gydnabyddiaeth testun
  • 3. Cydnabyddiaeth testun swp
  • 4. Casgliadau

1. Nodweddion rhaglen CuneiForm, nodweddion

Cuneiform

Gallwch lawrlwytho o wefan y datblygwr: //cognitiveforms.com/

Meddalwedd cydnabyddiaeth testun ffynhonnell agored. Yn ogystal, mae'n gweithio ym mhob fersiwn o Windows: XP, Vista, 7, 8, sy'n plesio. Hefyd, ychwanegwch gyfieithiad llawn Rwsia o'r rhaglen!

Manteision:

- cydnabyddiaeth testun yn yr 20 iaith fwyaf poblogaidd yn y byd (mae Saesneg a Rwseg ei hun wedi'i gynnwys yn y rhif hwn);

- cefnogaeth enfawr i amrywiol ffontiau print;

- edrych ar y testun a gydnabyddir gan y geiriadur;

- y gallu i arbed canlyniadau gwaith mewn sawl ffordd;

- cynnal strwythur y ddogfen;

- Tablau cymorth a chydnabyddiaeth ardderchog.

Anfanteision:

- nid yw'n cefnogi dogfennau a ffeiliau rhy fawr (mwy na 400 dpi);

- nid yw'n cefnogi rhai mathau o sganwyr yn uniongyrchol (wel, nid yw hyn yn frawychus, mae sganiwr arbennig wedi'i gynnwys gyda'r gyrwyr sganiwr);

- nid yw'r dyluniad yn disgleirio (ond pwy sydd ei angen os yw'r rhaglen yn datrys y broblem yn llawn).

2. Enghraifft o gydnabyddiaeth testun

Rydym yn cymryd yn ganiataol eich bod eisoes wedi derbyn y lluniau angenrheidiol ar gyfer cydnabyddiaeth (wedi'u sganio yno, neu wedi lawrlwytho'r llyfr ar fformat pdf / djvu ar y Rhyngrwyd ac wedi cael y lluniau angenrheidiol ganddynt. Sut i wneud hyn - gweler yr erthygl hon).

1) Agorwch y ddelwedd ofynnol yn y rhaglen CuineForm (ffeil / agored neu "Cntrl + O").

2) Dechrau cydnabyddiaeth - yn gyntaf rhaid i chi ddewis gwahanol ardaloedd: testun, lluniau, tablau, ac ati. Yn y rhaglen Cuneiform, gellir gwneud hyn nid yn unig â llaw, ond hefyd yn awtomatig! I wneud hyn, cliciwch ar y botwm "marcio" ar gornel uchaf y ffenestr.

3) Ar ôl 10-15 eiliad. bydd y rhaglen yn amlygu pob ardal â lliwiau gwahanol yn awtomatig. Er enghraifft, amlygir ardal destun mewn glas. Gyda llaw, tynnodd sylw at yr holl ardaloedd yn gywir ac yn hytrach yn gyflym. Yn onest, doeddwn i ddim yn disgwyl ymateb mor gyflym a chywir ganddi hi ...

4) I'r rhai nad ydynt yn ymddiried yn y marcio awtomatig, gallwch ddefnyddio'r llawlyfr. Ar gyfer hyn mae bar offer (gweler y llun isod), y gallwch ddewis: testun, tabl, llun. Symud, cynyddu / gostwng y ddelwedd gychwynnol, trimio'r ymylon. Yn gyffredinol, set dda.

5) Ar ôl i bob ardal gael ei marcio, gallwch symud ymlaen cydnabyddiaeth. I wneud hyn, cliciwch ar y botwm o'r un enw, fel yn y llun isod.

6) Yn llythrennol mewn 10-20 eiliad. Byddwch yn gweld dogfen yn Microsoft Word gyda'r testun cydnabyddedig. Beth sy'n ddiddorol, yn y testun ar gyfer yr enghraifft hon, wrth gwrs roedd yna gamgymeriadau, ond ychydig iawn ohonynt sydd! Yn enwedig, ystyried pa mor eglur oedd y deunydd gwreiddiol - y llun.

Mae cyflymder ac ansawdd yn eithaf tebyg i FineReader!

3. Cydnabyddiaeth testun swp

Gall y swyddogaeth hon o'r rhaglen fod yn ddefnyddiol pan fydd angen i chi adnabod nid un llun, ond sawl un ar unwaith. Mae'r llwybr byr i lansio cydnabyddiaeth swp fel arfer wedi'i guddio yn y ddewislen gychwynnol.

1) Ar ôl agor y rhaglen, mae angen i chi greu pecyn newydd, neu agor un a arbedwyd yn flaenorol. Yn ein hesiampl - creu un newydd.

2) Yn y cam nesaf rydym yn rhoi enw iddo, yn ddelfrydol fel bod chwe mis yn ddiweddarach byddwn yn cofio beth sy'n cael ei storio ynddo.

3) Nesaf, dewiswch iaith y ddogfen (Rwsieg-Saesneg), nodwch a oes lluniau a thablau yn eich deunydd wedi'i sganio.

4) Nawr mae angen i chi nodi'r ffolder lle mae'r ffeiliau ar gyfer cydnabyddiaeth wedi'u lleoli. Gyda llaw, yr hyn sy'n ddiddorol yw y bydd y rhaglen ei hun yn dod o hyd i'r holl luniau a ffeiliau graffig eraill y gall eu hadnabod a'u hychwanegu at y prosiect. Mae angen i chi hefyd gael gwared ar y swm ychwanegol.

5) Nid yw'r cam nesaf yn bwysig - dewiswch beth i'w wneud gyda'r ffeiliau ffynhonnell, ar ôl eu cydnabod. Argymhellaf ddewis y blwch gwirio "gwneud dim".

6) Dim ond dewis y fformat lle bydd y ddogfen gydnabyddedig yn cael ei chadw. Mae sawl opsiwn:

- rtf - mae'r ffeil o'r ddogfen Word yn cael ei hagor gan bob swyddfa boblogaidd (gan gynnwys rhai am ddim, dolen i raglenni);

- txt - fformat testun, gallwch arbed dim ond testun, lluniau a thablau ynddo;

- htm - Tudalen hyperdestun, yn gyfleus os ydych chi'n sganio ac yn adnabod ffeiliau ar gyfer y safle. Ei a dewis yn ein hesiampl.

7) Ar ôl clicio ar y botwm "Gorffen", bydd prosesu eich prosiect yn dechrau.

8) Mae'r rhaglen yn gweithio'n eithaf cyflym. Ar ôl cael eich cydnabod, byddwch yn gweld tab gyda ffeiliau htm. Os ydych chi'n clicio ar ffeil o'r fath, mae porwr yn dechrau lle gallwch weld y canlyniadau. Gyda llaw, gellir arbed y pecyn ar gyfer gwaith pellach gydag ef.

9) Fel y gwelwch y canlyniadau mae'r gwaith yn drawiadol iawn. Roedd y rhaglen yn cydnabod y darlun yn hawdd, ac roedd yn hawdd adnabod y testun oddi tano. Er bod y rhaglen yn rhad ac am ddim, yn gyffredinol mae'n wych!

4. Casgliadau

Os nad ydych yn aml yn sganio ac yn adnabod dogfennau, yna mae'n debyg nad yw prynu FineReader yn gwneud synnwyr. Mae CuneiForm yn hawdd delio â mwyafrif y tasgau.

Ar y llaw arall, mae ganddi anfanteision hefyd.

Yn gyntaf, nid oes digon o offer ar gyfer golygu a gwirio'r canlyniad canlyniadol. Yn ail, pan fydd yn rhaid i chi adnabod llawer o luniau, yna yn FineReader, mae'n fwy cyfleus gweld popeth a ychwanegir at y prosiect yn y golofn ar y dde ar unwaith: dileu'n ddiangen, gwneud golygiadau, ac ati. Yn drydydd, ar ddogfennau o ansawdd hollol wael, mae CuneiForm yn colli cydnabyddiaeth: mae'n rhaid i chi ddod â'r ddogfen i gof - cywiro camgymeriadau, rhoi marciau atalnodi, dyfyniadau, ac ati.

Dyna'r cyfan. A ydych chi'n adnabod unrhyw feddalwedd cydnabod testun rhydd arall?