Kako pretvoriti skenirane dokumente u Word - The Happy Android

Ako treba da digitalizujete knjigu u tekstualnom formatu, možda imate nekoliko pitanja. Može li se to uraditi?Šta je sa kvalitetom, da li je dobro? Ne samo da se to može učiniti, već postoji i nekoliko načina za pretvaranje skeniranog dokumenta u Word. Хајде да видимо:

  • Skeniranje dokumenta u PDF formatu i njegovo uređivanje kasnije sa Adobe Acrobat XI Pro da biste ga sačuvali u Word formatu. Pro verzija Acrobat-a se plaća, ali možete kupiti besplatnu probnu licencu od 30 dana.
  • Sa veb lokacije OnlineOCR.net. Ova veb aplikacija vam omogućava da konvertujete dokumente u PDF, JPG, TIFF i GIF formatima u Word, Excel i tekst. U besplatnoj verziji možemo da konvertujemo do 15 stranica na sat i dokumente ne više od jedne stranice.
  • Skeniranje dokumenta u (OCR) formatu i sačuvajte ga kao tekst. Zatim možemo otvoriti Word i urediti ili sačuvati u .doc formatu.
  • Korišćenje nekog programa za optičko prepoznavanje znakova:
    •  VueScan (dostupno za Windows, Mac OS X i Linux)
    • Kooka(za Linux)
    • Kancelarijski objektiv (za Android и ios)
    • CamScanner (za Android и ios)

Najefikasniji način od svega što možemo reći je preko Adobe Acrobat Pro, ali samo ako je skeniranje veoma, veoma čisto i visokog kvaliteta. Aplikacije za optičko prepoznavanje znakova su prešle dug put, ali i dalje pokazuju neke rupe sa stvarima kao što su podebljano ili kurziv, a transkripcija nekih reči u zavisnosti od tipa fonta originalnog dokumenta može biti pogrešna.

Pokušajte da skenirate i prosledite ovaj dokument u Word da vidite šta se dešava

Od samog skenera

Neki skeneri uključuju funkciju optičkog prepoznavanja (OCR) u okviru sopstvenog programa za skeniranje. Da biste skenirali dokument u tekst, potrebno je samo da podesite format digitalizacije i pogledate onaj koji se odnosi na OCR ili slično (zavisi od marke/modela skenera).

Pređite sa PDF-a na Word pomoću Adobe Acrobat XI Pro

Jednom Adobe Acrobat XI Pro (OVDE imate 30-dnevnu besplatnu probnu verziju) idite na „Alatke -> Prepoznavanje teksta -> U ovoj datoteci”.

U prozoru "Prepoznajte tekst"Кликните на"Уредити”I izaberite jezik teksta, stil izlaza i rezoluciju.

Da biste završili, vratite se na „Alatke -> Uređivanje sadržaja -> Izmeni tekst i slike„I izmenite tekst ako treba da ispravite reč. Da biste završili, kliknite na "File -> Sačuvaj kao„I sačuvajte ga u Word formatu.

OnlineOCR

OnlineOCR je veb aplikacija za prenos slika ili pdf-ova u Word i veoma je jednostavna za korišćenje. Objašnjavam kako to funkcioniše: Enter //www.onlineocr.net/ i kliknite na "Изаберите фајл”. Izaberite skenirani dokument, a zatim izaberite jezik i izlazni format iz 2 padajuća menija koja imate u centru ekrana.

Za završetak kliknite na "Convert”. Odmah ispod njega će se pojaviti pregled običnog teksta koji možete da izmenite ako treba da ispravite bilo koju reč. Na kraju kliknite na "Preuzmite izlaznu datoteku”I možete preuzeti datoteku u Word formatu. Evo primera PDF-a pretvorenog u Word pomoću OnlineOCR-a:

  • Original PDF:

  • Konvertovani dokument:

Ako vas ova veb aplikacija ne zadovoljava, možete isprobati druge slične alternative kao npr FreeOCR ili Free-Online-OCR.

Programi za optičko prepoznavanje znakova (OCR).

Ako ne želite da menjate svoje dokumente na mreži i potrebna vam je desktop aplikacija, možete koristiti aplikacije kao što su VueScan (koji je takođe dostupan za Mac i Linux pored sveprisutnog Windows-a).

Druga mogućnost je da koristite svoj Android ili iOS uređaj da skenirate dokument i direktno ga konvertujete u tekst. Postoje aplikacije poput Office Lens (за Android и ios) ili CamScanner (за Android и ios) koji sprovode ceo proces iz iste aplikacije. Preporučuje se u ovim slučajevima da očistite sliku pre pretvaranja u tekst. Ako želite da saznate više o ovoj metodi, pogledajte ОВАЈ ПОСТ.

Po mom mišljenju, tehnika optičkog prepoznavanja karaktera, iako je dosta poboljšana poslednjih godina, još uvek je svetlosnim godinama daleko od savršene tehnike. Mnogo detalja, mnogo reči koje „prevodi“ pogrešnim slovima i simbolima koji zasipaju tekst. I dalje mu nedostaje ta dodatna inteligencija to te čini da vidiš da «t &!$ olog1a»Ne može biti validan prevod nijedne reči u tekstu. Još uvek ne vidim razumevanje čitanja, već jednostavno vizuelno prepoznavanje pojedinačnih slova koja formiraju reči bez njihove integracije sa ostatkom teksta. Ipak, uveren sam da je trenutak kada ćemo napraviti taj poslednji veliki skok svakim danom sve bliži.

Имаш Telegram instaliran? Primite najbolji post svakog dana naš kanal. Ili, ako želite, saznajte sve od naših Фацебоок страница.

Рецент Постс

$config[zx-auto] not found$config[zx-overlay] not found