Gwasanaethau cydnabod testun ar-lein

Cyfarchion i holl ddarllenwyr y blog!

Credaf fod yn rhaid i'r rhai sy'n aml yn gweithio ar y cyfrifiadur (nid yw'n chwarae, ond ei fod yn gweithio) ddelio â chydnabod testun. Wel, er enghraifft, fe wnaethoch chi sganio dyfyniad o'r llyfr ac yn awr mae angen i chi gludo'r rhan hon yn eich dogfen. Ond llun yw'r ddogfen sydd wedi'i sganio, ac mae angen testun arnom - oherwydd mae angen rhaglenni arbennig a gwasanaethau ar-lein arnom i gydnabod testun o luniau.

Ynglŷn â rhaglenni cydnabyddiaeth, ysgrifennais eisoes mewn swyddi blaenorol:

- Sganio testun a chydnabyddiaeth yn FineReader (rhaglen â thâl);

- Gwaith mewn FineReader analog - CuneiForm (rhaglen am ddim).

Yn yr un erthygl hoffwn ganolbwyntio ar wasanaethau ar-lein ar gyfer cydnabod testun. Wedi'r cyfan, os oes angen i chi gael y testun gyda 1-2 lun yn gyflym - nid yw'n gwneud synnwyr i drafferthu gosod rhaglenni amrywiol ...

Mae'n bwysig! Mae ansawdd y gydnabyddiaeth (nifer y gwallau, y darllenadwyedd ac ati) yn dibynnu i raddau helaeth ar ansawdd y ddelwedd wreiddiol. Felly, wrth sganio (tynnu lluniau, ac ati), dewiswch yr ansawdd mor uchel â phosibl. Yn y rhan fwyaf o achosion, bydd ansawdd 300-400 dpi yn ddigon (dpi yw'r paramedr sy'n nodweddu ansawdd y llun. Yn y lleoliadau o bron pob sganiwr, fel arfer nodir y paramedr hwn).

Gwasanaethau ar-lein

Er mwyn dangos gwaith y gwasanaethau, fe wnes i lunlun o un o'm herthyglau. Bydd y sgrînlun hwn yn cael ei lanlwytho i bob gwasanaeth, a rhoddir y disgrifiad isod.

1) //www.ocrconvert.com/

Rwy'n hoffi'r gwasanaeth hwn oherwydd ei symlrwydd. Er mai Saesneg yw'r wefan, mae hefyd yn gweithio'n dda gyda'r iaith Rwseg. Nid oes angen i chi gofrestru. I ddechrau cydnabyddiaeth, mae angen i chi wneud 3 cham:

- lanlwytho eich delwedd;

- dewiswch iaith y testun, sydd yn y llun;

- pwyswch y botwm adnabod cydnabyddiaeth.

Cymorth fformat: PDF, GIF, BMP, JPEG.

Dangosir y canlyniad isod yn y llun. Rhaid i mi ddweud, mae'r testun yn cael ei gydnabod yn dda. Yn ogystal, yn gyflym iawn - roeddwn yn aros yn llythrennol 5-10 eiliad.

2) //www.i2ocr.com/

Mae'r gwasanaeth hwn yn gweithio yn yr un modd â'r uchod. Yma hefyd mae angen i chi lawrlwytho'r ffeil, dewis yr iaith adnabod a chlicio ar y botwm testun echdynnu. Mae'r gwasanaeth yn gweithio'n gyflym iawn: 5-6 eiliad. un dudalen.

Fformatau a gefnogir: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Mae canlyniad y gwasanaeth ar-lein hwn yn llawer mwy cyfleus: rydych chi'n gweld dwy ffenestr ar unwaith - yn yr un cyntaf y canlyniad cydnabyddiaeth, yn yr ail - y ddelwedd wreiddiol. Felly, mae'n ddigon hawdd gwneud golygiadau wrth olygu. Cofrestrwch ar y gwasanaeth, gyda llaw, nid oes angen ychwaith.

3) // www.newocr.com/

Mae'r gwasanaeth hwn yn unigryw mewn sawl ffordd. Yn gyntaf, mae'n cefnogi'r fformat "newydd-ffasiwn" DJVU (gyda llaw, y rhestr lawn o fformatau: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Yn ail, mae'n cefnogi dewis ardaloedd testun yn y llun. Mae hyn yn ddefnyddiol iawn pan fydd gennych yn y llun nid yn unig ardaloedd testun, ond hefyd rhai graffeg nad oes angen i chi eu hadnabod.

Mae ansawdd cydnabyddiaeth yn uwch na'r cyfartaledd, nid oes angen cofrestru.

4) //www.free-ocr.com/

Gwasanaeth syml iawn ar gyfer cydnabod: llwytho delwedd i fyny, nodi'r iaith, nodi captcha (gyda llaw, yr unig wasanaeth yn yr erthygl hon lle mae angen i chi ei wneud), a phwyso'r botwm i gyfieithu'r ddelwedd yn destun. A dweud y gwir popeth!

Fformatau a gefnogir: PDF, JPG, GIF, TIFF, BMP.

Mae'r canlyniad cydnabod yn ganolig. Mae yna gamgymeriadau, ond nid llawer. Fodd bynnag, pe byddai ansawdd y sgrînlun gwreiddiol yn uwch, byddai trefn o faint llai o wallau.

PS

Dyna i gyd heddiw. Os ydych chi'n gwybod am wasanaethau mwy diddorol ar gyfer cydnabod testun - rhannwch y sylwadau, byddaf yn ddiolchgar. Un amod: mae'n ddymunol nad oes angen cofrestru ac roedd y gwasanaeth yn rhad ac am ddim.

Cofion gorau!