Adnabod testun mewn ffeil PDF ar-lein.


Nid yw bob amser yn bosibl tynnu testun o ffeil PDF gan ddefnyddio copïo confensiynol. Yn aml, tudalennau'r dogfennau hyn yw cynnwys wedi'i sganio yn eu fersiynau papur. Er mwyn trosi ffeiliau o'r fath yn ddata testun y gellir ei olygu'n llawn, defnyddir rhaglenni arbennig gyda'r swyddogaeth Cydnabod Cymeriadau Optegol (OCR).

Mae atebion o'r fath yn anodd iawn eu gweithredu ac, felly, maent yn costio llawer o arian. Os oes angen i chi adnabod testun gyda PDF yn rheolaidd, fe'ch cynghorir i brynu'r rhaglen briodol. Ar gyfer achosion prin, byddai'n fwy rhesymegol defnyddio un o'r gwasanaethau ar-lein sydd ar gael gyda swyddogaethau tebyg.

Sut i adnabod testun o PDF ar-lein

Wrth gwrs, mae set nodwedd gwasanaethau ar-lein OCR yn fwy cyfyngedig o'i chymharu ag atebion bwrdd gwaith llawn. Ond gallwch weithio gydag adnoddau o'r fath naill ai am ddim, neu am ffi nominal. Y prif beth yw bod y cymwysiadau gwe cyfatebol yn ymdopi â'u prif dasg, sef cydnabyddiaeth testun, hefyd.

Dull 1: ABBYY FineReader Ar-lein

Mae'r cwmni datblygu gwasanaeth yn un o'r arweinwyr ym maes cydnabod dogfennau optegol. Mae ABBYY FineReader ar gyfer Windows a Mac yn ateb pwerus ar gyfer trosi PDF i destun a gweithio gydag ef.

Mae cymar gwe'r rhaglen, wrth gwrs, yn israddol iddo mewn ymarferoldeb. Serch hynny, gall y gwasanaeth adnabod testun o sganiau a lluniau mewn mwy na 190 o ieithoedd. Yn cefnogi trosi ffeiliau PDF yn ddogfennau Word, Excel, ac ati

ABBYY FineReader Gwasanaeth ar-lein ar-lein

  1. Cyn i chi ddechrau gweithio gyda'r offeryn, creu cyfrif ar y safle neu fewngofnodi gan ddefnyddio'ch cyfrif Facebook, Google neu Microsoft.

    I fynd i'r ffenestr mewngofnodi, cliciwch ar y botwm. "Mewngofnodi" yn y bar dewislen uchaf.
  2. Ar ôl mewngofnodi, mewnforiwch y ddogfen PDF ddymunol i mewn i'r FineReader gan ddefnyddio'r botwm "Llwytho Ffeiliau i Fyny".

    Yna cliciwch "Dewiswch rifau tudalennau" a nodi'r rhychwant a ddymunir ar gyfer cydnabod testun.
  3. Nesaf, dewiswch yr ieithoedd sy'n bresennol yn y ddogfen, fformat y ffeil ddilynol a chliciwch ar y botwm "Cydnabod".
  4. Ar ôl prosesu, mae hyd y broses yn dibynnu'n llwyr ar faint y ddogfen, gallwch lawrlwytho'r ffeil orffenedig gyda data testun trwy glicio ar ei enw.

    Neu ei allforio i un o'r gwasanaethau cwmwl sydd ar gael.

Mae'r gwasanaeth yn nodedig, yn ôl pob tebyg, gan yr algorithmau cydnabyddiaeth testun mwyaf cywir mewn delweddau a ffeiliau PDF. Ond, yn anffodus, mae ei ddefnydd am ddim wedi'i gyfyngu i bum tudalen sy'n cael eu prosesu bob mis. I weithio gyda dogfennau mwy swmpus, mae'n rhaid i chi brynu tanysgrifiad blwyddyn.

Fodd bynnag, os oes angen y swyddogaeth OCR yn anaml iawn, mae ABBYY FineReader Ar-lein yn ddewis gwych ar gyfer tynnu testun o ffeiliau PDF bach.

Dull 2: Am ddim OCR Ar-lein

Gwasanaeth syml a chyfleus ar gyfer digido testun. Heb yr angen i gofrestru, mae'r adnodd yn caniatáu i chi adnabod 15 tudalen PDF lawn yr awr. Ar-lein Mae OCR yn gweithio'n llawn gyda dogfennau mewn 46 iaith a heb awdurdodiad mae'n cefnogi tri fformat allforio testun - DOCX, XLSX a TXT.

Wrth gofrestru, mae'r defnyddiwr yn gallu prosesu dogfennau aml-dudalen, ond mae rhif rhydd y tudalennau hyn wedi'i gyfyngu i 50 uned.

Gwasanaeth ar-lein OCR ar-lein am ddim

  1. I adnabod y testun o'r PDF fel “gwestai”, heb awdurdodiad ar yr adnodd, defnyddiwch y ffurflen briodol ar brif dudalen y wefan.

    Dewiswch y ddogfen a ddymunir gan ddefnyddio'r botwm "Ffeil", nodwch brif iaith y testun, fformat allbwn, yna arhoswch i'r ffeil lwytho a chlicio "Trosi".
  2. Ar ddiwedd y broses ddigido, cliciwch “Lawrlwythwch y Ffeil Allbwn” i gadw'r ddogfen orffenedig gyda'r testun ar y cyfrifiadur.

Ar gyfer defnyddwyr awdurdodedig, mae dilyniant y gweithredoedd braidd yn wahanol.

  1. Defnyddiwch y botwm "Cofrestru" neu "Mewngofnodi" yn y bar dewislen uchaf i, yn eu tro, creu cyfrif OCR Ar-lein Ar-lein neu fynd i mewn iddo.
  2. Ar ôl awdurdodi yn y panel cydnabyddiaeth, daliwch yr allwedd i lawr "CTRL", dewiswch hyd at ddwy iaith o'r ddogfen ffynhonnell o'r rhestr a ddarperir.
  3. Nodwch opsiynau pellach ar gyfer echdynnu testun o PDF a chliciwch ar y botwm. "Dewis Ffeil" llwytho'r ddogfen i'r gwasanaeth.

    Yna, i ddechrau cydnabyddiaeth, cliciwch "Trosi".
  4. Ar ôl prosesu'r ddogfen, cliciwch ar y ddolen ag enw'r ffeil allbwn yn y golofn gyfatebol.

    Bydd y canlyniad cydnabod yn cael ei storio ar unwaith yng nghof eich cyfrifiadur.

Os oes angen i chi echdynnu testun o ddogfen PDF fach, gallwch fynd ati'n ddiogel i ddefnyddio'r teclyn a ddisgrifir uchod. I weithio gyda ffeiliau mawr, bydd yn rhaid i chi brynu symbolau ychwanegol yn Rhad ac am Ddim OCR neu droi at ateb arall.

Dull 3: NewOCR

Gwasanaeth OCR rhad ac am ddim sy'n caniatáu i chi dynnu testun o bron unrhyw ddogfennau graffig ac electronig fel DjVu a PDF. Nid yw'r adnodd yn gosod cyfyngiadau ar faint a nifer y ffeiliau y gellir eu hadnabod, nid oes angen ei gofrestru, ac mae'n cynnig ystod eang o swyddogaethau cysylltiedig.

Mae NewOCR yn cefnogi 106 o ieithoedd ac yn gallu ymdrin â hyd yn oed sganiau dogfen o ansawdd isel. Mae'n bosibl dewis yr ardal ar gyfer adnabod testun ar y dudalen ffeiliau.

NewOCR gwasanaeth ar-lein

  1. Felly, gallwch ddechrau gweithio gyda'r adnodd ar unwaith, heb yr angen i gyflawni gweithredoedd diangen.

    Yn uniongyrchol ar y brif dudalen mae ffurflen ar gyfer mewnforio'r ddogfen i'r safle. I lwytho ffeil i NewOCR, defnyddiwch y botwm "Dewis ffeil" yn yr adran "Dewiswch eich ffeil". Yna yn y maes "Iaith (au) cydnabyddiaeth" dewiswch un neu fwy o ieithoedd y ddogfen ffynhonnell, yna cliciwch “Llwytho + OCR”.
  2. Gosodwch eich gosodiadau cydnabyddiaeth dewisol, dewiswch y dudalen a ddymunir i dynnu'r testun, a chliciwch y botwm. "OCR".
  3. Sgroliwch i lawr ychydig a dod o hyd i'r botwm. Lawrlwytho.

    Cliciwch arno ac yn y gwymplen dewiswch y fformat dogfen gofynnol i'w lawrlwytho. Wedi hynny, bydd y ffeil orffenedig gyda'r testun a echdynnwyd yn cael ei lawrlwytho i'ch cyfrifiadur.

Mae'r offeryn yn gyfleus ac yn cydnabod yr holl gymeriadau o ansawdd digon uchel. Fodd bynnag, rhaid i brosesu pob tudalen o'r ddogfen PDF a fewnforiwyd gael ei lansio'n annibynnol a'i harddangos mewn ffeil ar wahân. Gallwch, wrth gwrs, gopïo'r canlyniadau cydnabyddiaeth ar unwaith i'r clipfwrdd a'u cyfuno ag eraill.

Serch hynny, o gofio'r naws uchod, mae llawer iawn o destun gan ddefnyddio NewOCR yn anodd iawn ei dynnu. Gyda'r un gwasanaeth ffeiliau bach yn ymdopi "â bang."

Dull 4: OCR.Space

Mae adnodd syml a dealladwy ar gyfer digido testun yn eich galluogi i adnabod dogfennau PDF ac allbynnu'r canlyniad mewn ffeil TXT. Nid oes unrhyw gyfyngiadau ar nifer y tudalennau. Yr unig gyfyngiad yw na ddylai maint y ddogfen fewnbwn fod yn fwy na 5 megabeit.

Gwasanaeth ar-lein OCR.Space

  1. Nid oes angen cofrestru i weithio gyda'r offeryn.

    Cliciwch ar y ddolen uchod a llwythwch y ddogfen PDF i'r wefan o'ch cyfrifiadur gan ddefnyddio'r botwm "Dewis ffeil" neu o'r rhwydwaith - trwy gyfeirio.
  2. Yn y rhestr gwympo "Dewis iaith OCR" dewiswch iaith y ddogfen a fewnforiwyd.

    Yna dechreuwch y broses adnabod testun trwy glicio ar y botwm. "Cychwyn OCR!".
  3. Ar ddiwedd prosesu ffeiliau, gweler y canlyniad yn y "Canlyniad OCR'ed" a chliciwch Lawrlwythoi lawrlwytho'r ddogfen TXT gorffenedig.

Os oes angen i chi echdynnu'r testun o'r PDF ac nad yw'r fformat terfynol yn bwysig o gwbl, mae OCR.Space yn ddewis da. Rhaid i'r unig ddogfen fod yn “uniaith”, gan nad yw cydnabod dwy iaith neu fwy ar yr un pryd yn y gwasanaeth yn cael ei darparu.

Gweler hefyd: analogau am ddim FineReader

Gwerthuso'r offer ar-lein a gyflwynir yn yr erthygl, dylid nodi bod y FineReader Ar-lein o ABBYY yn ymdrin â'r swyddogaeth OCR yn gywir ac yn gywir. Os yw cywirdeb mwyaf cydnabyddiaeth testun yn bwysig i chi, mae'n well ystyried yr opsiwn hwn yn benodol. Ond i dalu amdano, mae'n debyg y bydd yn rhaid iddo hefyd.

Os oes angen i chi ddigido dogfennau bach a'ch bod yn barod i gywiro gwallau yn y gwasanaeth eich hun, fe'ch cynghorir i ddefnyddio NewOCR, OCR.Space neu OCR am ddim ar-lein.