Hva skjer

gImageReader – Trekk ut tekst fra bilder og PDF-er i Linux

Anonim

gImageReader er en gratis og åpen kildekode PDF-leser med muligheten til å trekke ut tekst fra bilder og PDF-er. Den er bygget som en enkel Gtk/Qt-frontend til Tesseract-OCR, en åpen kildekode OCR-motor for å gjenkjenne tekster og mønstre i dokumenter og bilder ved hjelp avKunstig intelligens

Tesseract er i seg selv et kommandolinjeverktøy som er begrenset til bruk av Linux-brukere som er kjent nok med terminalene deres. Takket være gImageReader kan alle nå dra nytte av motorens OCR-effektivitet.

… . Den har et enkelt, godt organisert brukergrensesnitt som kan tilpasses og du kan utføre stavekontroll og oversettelsesoppgaver.

Funksjoner i gImageReader

gImageReader er enkel å bruke og støtter arbeid med myke kopidokumenter samt øyeblikksbilder av opplastede medier, f.eks. skjermbilder. Du har til og med muligheten til å velge tekstområdet du er interessert i og ekstra bare teksten du trenger. Til syvende og sist fungerer gImagereader både som en PDF-leser og et tekstuttrekksverktøy. Tøffe greier.

Installer gImageReader på Linux

For å bruke gImageReader fullt ut, må du installere Tesseract manuelt språkpakker slik at du kan analysere bilder og filer på riktig måte.Pakken heter 'Tesseract-ocr-eng' og den er tilgjengelig fra programvarebehandleren i Debianog Fedora distros.

Hvis du kjører Ubuntu, kan du ganske enkelt legge til PPAog kjør installeringskommandoen ved å bruke kommandoene nedenfor:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt oppdatering
$ sudo apt installer gimagereader

On Debian, Fedora, og OpenSUSE installer det fra pakkebehandlingen.

$ sudo apt installer gimagereader
$ sudo dnf installer gimagereader
$ sudo zypper installer gimagereader

Ikke føl deg utenfor hvis du kjører Arch Linux eller noen av dets derivater. AUR har dekket deg. Og hvis du heller vil gjenoppbygge appen fra kilden, finner du instruksjoner i Wiki-lenken til GitHub-depotet.

Er du en som trekker ut trykt tekst fra bilder? Du kan til og med ta øyeblikksbilder av utvalgte områder med telefonen og laste dem opp til den bærbare datamaskinen. Det som er enda kulere er støtten for flere språk – som selv om den ikke er perfekt, allerede er et av de beste alternativene i samfunnet akkurat nå.

gImageReader er blant de beste PDF-leserne i åpen kildekode-verden, spesielt med sin OCR-funksjon, så prøv den og se bare hvordan liker du det.

Som vanlig er du velkommen til å dele dine erfaringer med appen med oss ​​hvis du har noen. Og for å legge til andre forslag i kommentarfeltet nedenfor.