Über eine Texterkennung für das KDE-Screenshot-Tool Spectacle diskutieren die KDE-Entwickler schon länger. Ein Script kann diese Funktion mit Hilfe des OCR-Programms Tesseract jetzt schon erfüllen.
Auf https://github.com/kbkozlev/spectacle-ocr findet sich ein Installations-Script für Kubuntu, KDE Neon, Debian, Fedora und Arch Linux, welches eine Texterkennung für Spectacle mit vertretbarem Aufwand einrichtet – auch in Deutsch.
1. Zunächst holt der Befehl
git clone https://github.com/kbkozlev/spectacle-ocr.git
das Script auf den Rechner und
cd spectacle-ocr
./setup.sh
startet die Installation.
2. Die Sprachdateien für Tesseract muss man manuell installieren, in Debian/Ubuntu und Co. mit diesem Befehl:
sudo apt install tesseract-ocr-eng tesseract-ocr-deu
3. Nach einer Neuanmeldung ist die Texterkennung schon einsatzbereit: Im Screenshot-Tool gibt es nun im Drop-Down-Menü „Exportieren“ den neuen Eintrag „Extract Text“, welcher Text im angefertigten Screenshot erkennt und dann in die Zwischenablage legt.
4. Soll das Script vornehmlich Deutsch erkennen, so öffnet man das hinterlegte Script
„~/.local/bin/ocr.sh“ in einem Texteditor und definiert
LANG="deu"
in der sechsten Zeile.

