跳至內容。

使用 Tesseract OCR 的 GUI 和其他專案

1. GUI

名稱 Linux Mac Windows 授權 描述
Scribe OCR X X X AGPL-3.0 授權 Scribe OCR 是一個免費開源的網頁應用程式,用於辨識文字、校對 OCR 資料以及建立完全數位化的文件。網站:scribeocr.com
Rescribe X X X GPL v3 易於使用的 Tesseract 前端,無需安裝,包括 PDF 處理、Google Book 下載以及額外的預處理和後處理功能。
normcap X X X GPL v3 螢幕截圖工具,使用 OCR 技術來擷取資訊而不是圖片。
gImageReader X   X GPL v3 Tesseract-ocr 的圖形 GTK 前端
VietOCR X X X Apache 2.0 Tesseract OCR 引擎的 GUI 前端。支援越南語和 Tesseract 支援的其他語言的光學字元辨識。
NeOCR     X 免費軟體 Tesseract 4.0 OCR 引擎的 GUI 前端。
Free-Ocr-Windows-Desktop     X GNU AGPL v3 適用於 Windows 桌面的免費 OCR 應用程式 - 本質上是 Tesseract OCR 引擎的圖形使用者介面 (GUI)。該應用程式還支援讀取和掃描的 PDF 檔案
YAGF X     GPL v3 cuneiform 和 tesseract 的圖形前端
OCR2Text X X X MIT 用於批次處理 PDF 到 TXT 的 CLI 工具
OCRFeeder X     GPL v3 OCRFeeder 是一個文件版面分析和光學字元辨識系統
Lector X   X GPL v2 基於 Python、Qt4 和 Tesseract OCR 的 GNU/Linux 圖形化 ocr 解決方案
Tesseract-OCR QT4 gui X     Apache 2.0 Tesseract-OCR QT4 gui 是 tesseract 的簡單 GUI
Lime OCR     X GPL v3 一個簡單、免費的 Windows OCR 軟體,使用 tesseract-ocr 引擎
Ocrivist X     GPL v3 Ocrivist 是一個實用程式,可將書籍和其他印刷文件掃描並進行 OCR,以轉換為 PDF 或 Djvu 格式
Tesseract-GUI X     GPL v2 Tessract-GUI 不是 tesseract-ocr 的前端,它只是一種透過 ImageMagick 進行簡單影像處理的圖形化使用方式
QTesseract X     LGPL v3 Tesseract OCR 的 QT GUI
dpScreenOCR X   X zlib 用於辨識螢幕上文字的程式
pmOCR X     BSD 批次 OCR 工具,也可用於 tesseract 的檔案監控事件 OCR
tesseract4java X X X GPLv3 一個跨平台的 GUI,用於訓練和執行 Tesseract,具有批次辨識和準確度評估等進階功能
Linux-Intelligent-OCR-Solution(lios) X     GPLv3 一個 GUI,用於掃描、執行和訓練 Tesseract,完全為視覺障礙人士提供輔助功能,並具有掃描器亮度優化器、文字清理器等進階功能
SunnyPages OCR     X 專有軟體 Tesseract OCR 引擎的 GUI 前端,具有影像亮度的自動調整、影像處理和 PDF 支援。
PDF OCR X   X X 專有軟體 PDF OCR 是一個簡單的拖放式工具,適用於 Mac OS X 和 Windows,可將您的 PDF 和影像轉換為文字文件或可搜尋的 PDF 檔案
TaxWorkFlow     X 專有軟體 TaxWorkFlow 是一個會計實務管理應用程式,其中包括 Tesseract OCR 引擎的 GUI 前端。該應用程式支援 AVX,並允許從 PDF 檔案和 100 多種影像檔案格式建立選定解析度和壓縮的 OCR PDF 檔案。
AmhOCR     X GPLv3 具有多個預處理/後處理 GUI 的 Tesseract 驅動的 Windows 桌面 OCR 應用程式
TesseractStudio.Net Github     X 專有軟體 (無法使用 Exe、原始碼,網站網址已失效) tesseract 4.0 的圖形介面
TesseractStudio.Net     X 專有軟體 tesseract 4.0 的圖形介面
ImageTrans X X X 專有軟體 一個影像翻譯工具,可以使用 Tesseract 對整頁、選定的影像區域或螢幕截圖進行 OCR
NAPS2 X X X GLP2 盡可能簡單地將文件掃描為 PDF 等格式。
Ave React OCR     X MIT 一個由 avernakis react 驅動的簡單 ocr 應用程式。

2. 線上 OCR 服務

3. 行動裝置

4. 其他 (實用程式、工具、命令列介面 [CLI] 等)

A. PDF 轉為可搜尋 PDF 的工具

(例如:任何也可以將無法搜尋的 PDF 作為輸入的工具)

  1. OCRmyPDF - 將 OCR 文字層新增至掃描的 PDF 檔案和影像,使其可被搜尋。在多核心 CPU 上平行處理頁面。盡可能保持原始嵌入影像的精確解析度,而不會重新壓縮 JPEG。包含多個影像預處理選項、詳細文件,以及支援許多特殊的 PDF。
  2. pdf2pdfocr 是一個 OCR PDF(或支援的影像)的工具,並在原始檔案中新增文字層,使其成為可搜尋的 PDF。這是一個使用 tesseract 和其他開源工具的 python 腳本。支援 Linux、macOS 和 Windows。
  3. pdf2searchablepdf - 一個工具,允許將任何無法搜尋的 PDF 或任何整個影像目錄轉換為可搜尋的 PDF

B. 其他

  1. Scantools - 一個函式庫和一組匹配的命令列應用程式,用於圖形處理,旨在處理掃描的文件並產生高品質的 PDF 檔案。image2pdf 將影像轉換為 PDF。由光學字元辨識程式(例如 Tesseract)產生的 HOCR 檔案,可以選擇性地指定以使 PDF 檔案可搜尋。產生的檔案符合 ISO PDF/A 標準,用於長期歸檔數位文件。hocr2any 將 HOCR 檔案轉換為文字,或將其渲染為點陣圖或 PDF 檔案 ocrPDF 使用 Tesseract OCR 引擎來偵測文字並在 PDF 檔案中產生文字層。
  2. ocr-fileformat - 驗證和轉換 OCR 檔案格式 (hOCR、ALTO、PAGE、FineReader)
  3. Tess4J - 用於 Tesseract OCR API 的 Java JNA 包裝器。
  4. Traineddata 檢查器 - 檢查 traineddata 檔案的一些內部結構
  5. TopOCR - 適用於相機的高品質 OCR,支援 tesseract-ocr (付費產品)
  6. 簡單的 OCR 網頁伺服器 使用 python、flask、tesseract-ocr 和 leptonica
  7. Display OCR 是 OpenCV-Python + python-tesseract 即時影像預處理和 7 段字型的 OCR。
  8. OpenOCR 使託管您自己的 OCR REST API 變得簡單。
  9. https://github.com/guitarmind/tesseract-web-service 是使用 tornado 的 tesseract-OCR 的 RESTful 網頁服務實作
  10. RasterEdge .NET 影像 SDK - OCR 辨識 是一個強大、高效能的免授權發行辨識應用程式,適用於桌面或伺服器應用程式。
  11. DevScope OCR SDK 是一個基於 Tesseract OCR v3 的光學字元辨識工具組引擎,可使用 Microsoft .NET Framework 開發應用程式
  12. Paperwork - 使用 OCR 以輕鬆的方式抓取實體文件(需要 pyocr)
  13. Aletheia - 用於生產環境的進階文件版面和文字 Ground-Truthing 系統
  14. gscan2pdf 一個從掃描的文件產生 PDF 或 DjVu 的 GUI
  15. Audiveris 是一個開放原始碼的光學音樂辨識軟體,可處理樂譜的影像,以自動提供 MusicXML 標準的符號音樂資訊。
  16. Ocrivist 是一個實用程式,可將書籍和其他印刷文件掃描並進行 OCR,以轉換為 PDF 或 Djvu 格式。
  17. thu-ipv6-login 一個用於清華大學 IPv6 驗證的 python 腳本,支援驗證碼的 OCR
  18. Wolfram Mathematica 9.0 使用 tesseract 進行辨識文字
  19. node-dv 是一個用於處理和理解掃描文件的 node.js 函式庫
  20. hocr-tools - python 工具,用於操作和評估 hOCR 格式,以透過將其嵌入 HTML 中來表示多語言 OCR 結果。它們包括用於建立可搜尋 pdf 的 hocr-pdf 工具。
  21. PyPDFOCR - 基於 Tesseract-OCR 的 PDF 歸檔
  22. ChronoScan 是一套完整的文件掃描與資料輸入套件
  23. speedy-ocr 實用程式,可簡化掃描和 OCR 焦點,以協助盲人和視覺障礙群體。它是 Vinux 專案的一部分。
  24. Project VIRAL Varico 發票辨識與輔助學習
  25. Bindery:一個簡單的 GUI,用於將後處理的掃描頁面綁定到數位文件中
  26. Clarify:Clarify 可協助您 OCR「僅影像」PDF。您的輸入是一個通常無法從中提取文字的 PDF。輸出是文字。Clarify 是一個包裝 tesseract-ocr、xpdf 和 netpbm 的 python 模組。要求: python、tesseract-ocr、xpdf、netpbm
  27. hOcr2Pdf.NET:hOcr2Pdf.NET 是一個函式庫,程式設計師可以用它來為應用程式建立高度壓縮、可搜尋的 pdf。要求: .NET 2.0 或更高版本、Tesseract 3.0、JBig2.exe
  28. PDFBeads:根據 hOCR 檔案將掃描的影像轉換為單一可搜尋的 PDF 檔案。要求: ruby、RMagick、hpricot
  29. ExactImage/hocr2pdf:從 hOCR 輸入建立可搜尋的 PDF。要求: libagg
  30. HocrConverter:從 hOCR 文件建立 PDF 和純文字。要求: python、reportlab
  31. HocrToPdf.java:java 來源,用於非常基本的 hOCR 到 PDF 轉換器。編譯版本可在專案 modi2hocr 中找到。要求: java、jericho、iText2
  32. hOcr2Pdf.NET:是一個 .NET 函式庫,可使用 HtmlAgilityPack 和 iTextSharp 將 Tesseract 或 Cuneiform 產生的 .hocr html 轉換為可搜尋的 PDF。需求: C#。
  33. Tally-Ho:Tally-Ho 是一個螢幕閱讀器,適用於像 Google 圖書這類的網站。
  34. Mayan EDMS:以 Tesseract 為基礎的文件管理系統。
  35. Olena:一個通用且高效的影像處理平台(Tesseract 用於其名為 scribo 的部分)。
  36. ocrodjvu 是一個 OCR 系統的封裝器,可讓您對 DjVu 檔案執行 OCR。
  37. PaRADIIT(文件影像索引和轉錄的模式冗餘分析)是一個由 Google DH 連續兩次獎項贊助的專案。其目標是將古代書籍,特別是文藝復興時期的書籍,轉變為可訪問的數位圖書館。
  38. ISRI 分析工具包含 17 個工具,用於測量和實驗 OCR 輸出的效能。
  39. Indic Messenger:一個 Facebook 聊天機器人,可以 OCR 包含印度/英文文字的圖像,並將其音譯為其他印度文字。
  40. LibreOCR:一個 LibreOffice 擴充功能,可以將圖像轉換為 OCT 並在 Writer 應用程式中開啟。
  41. hertzg/tesseract-server:一個輕量級、基於 Docker、多架構、無狀態的 Tesseract JSON HTTP API 服務。

有關 IMPACT 專案的更多資訊,請參閱 tesseract 論壇中的討論