使用 Tesseract OCR 的 GUI 和其他專案
1. GUI
名稱 | Linux | Mac | Windows | 授權 | 描述 |
---|---|---|---|---|---|
Scribe OCR | X | X | X | AGPL-3.0 授權 | Scribe OCR 是一個免費開源的網頁應用程式,用於辨識文字、校對 OCR 資料以及建立完全數位化的文件。網站:scribeocr.com。 |
Rescribe | X | X | X | GPL v3 | 易於使用的 Tesseract 前端,無需安裝,包括 PDF 處理、Google Book 下載以及額外的預處理和後處理功能。 |
normcap | X | X | X | GPL v3 | 螢幕截圖工具,使用 OCR 技術來擷取資訊而不是圖片。 |
gImageReader | X | X | GPL v3 | Tesseract-ocr 的圖形 GTK 前端 | |
VietOCR | X | X | X | Apache 2.0 | Tesseract OCR 引擎的 GUI 前端。支援越南語和 Tesseract 支援的其他語言的光學字元辨識。 |
NeOCR | X | 免費軟體 | Tesseract 4.0 OCR 引擎的 GUI 前端。 | ||
Free-Ocr-Windows-Desktop | X | GNU AGPL v3 | 適用於 Windows 桌面的免費 OCR 應用程式 - 本質上是 Tesseract OCR 引擎的圖形使用者介面 (GUI)。該應用程式還支援讀取和掃描的 PDF 檔案 | ||
YAGF | X | GPL v3 | cuneiform 和 tesseract 的圖形前端 | ||
OCR2Text | X | X | X | MIT | 用於批次處理 PDF 到 TXT 的 CLI 工具 |
OCRFeeder | X | GPL v3 | OCRFeeder 是一個文件版面分析和光學字元辨識系統 | ||
Lector | X | X | GPL v2 | 基於 Python、Qt4 和 Tesseract OCR 的 GNU/Linux 圖形化 ocr 解決方案 | |
Tesseract-OCR QT4 gui | X | Apache 2.0 | Tesseract-OCR QT4 gui 是 tesseract 的簡單 GUI | ||
Lime OCR | X | GPL v3 | 一個簡單、免費的 Windows OCR 軟體,使用 tesseract-ocr 引擎 | ||
Ocrivist | X | GPL v3 | Ocrivist 是一個實用程式,可將書籍和其他印刷文件掃描並進行 OCR,以轉換為 PDF 或 Djvu 格式 | ||
Tesseract-GUI | X | GPL v2 | Tessract-GUI 不是 tesseract-ocr 的前端,它只是一種透過 ImageMagick 進行簡單影像處理的圖形化使用方式 | ||
QTesseract | X | LGPL v3 | Tesseract OCR 的 QT GUI | ||
dpScreenOCR | X | X | zlib | 用於辨識螢幕上文字的程式 | |
pmOCR | X | BSD | 批次 OCR 工具,也可用於 tesseract 的檔案監控事件 OCR | ||
tesseract4java | X | X | X | GPLv3 | 一個跨平台的 GUI,用於訓練和執行 Tesseract,具有批次辨識和準確度評估等進階功能 |
Linux-Intelligent-OCR-Solution(lios) | X | GPLv3 | 一個 GUI,用於掃描、執行和訓練 Tesseract,完全為視覺障礙人士提供輔助功能,並具有掃描器亮度優化器、文字清理器等進階功能 | ||
SunnyPages OCR | X | 專有軟體 | Tesseract OCR 引擎的 GUI 前端,具有影像亮度的自動調整、影像處理和 PDF 支援。 | ||
PDF OCR X | X | X | 專有軟體 | PDF OCR 是一個簡單的拖放式工具,適用於 Mac OS X 和 Windows,可將您的 PDF 和影像轉換為文字文件或可搜尋的 PDF 檔案 | |
TaxWorkFlow | X | 專有軟體 | TaxWorkFlow 是一個會計實務管理應用程式,其中包括 Tesseract OCR 引擎的 GUI 前端。該應用程式支援 AVX,並允許從 PDF 檔案和 100 多種影像檔案格式建立選定解析度和壓縮的 OCR PDF 檔案。 | ||
AmhOCR | X | GPLv3 | 具有多個預處理/後處理 GUI 的 Tesseract 驅動的 Windows 桌面 OCR 應用程式 | ||
TesseractStudio.Net Github | X | 專有軟體 | (無法使用 Exe、原始碼,網站網址已失效) tesseract 4.0 的圖形介面 | ||
TesseractStudio.Net | X | 專有軟體 | tesseract 4.0 的圖形介面 | ||
ImageTrans | X | X | X | 專有軟體 | 一個影像翻譯工具,可以使用 Tesseract 對整頁、選定的影像區域或螢幕截圖進行 OCR |
NAPS2 | X | X | X | GLP2 | 盡可能簡單地將文件掃描為 PDF 等格式。 |
Ave React OCR | X | MIT | 一個由 avernakis react 驅動的簡單 ocr 應用程式。 |
2. 線上 OCR 服務
- OCR.net:由後端的 PDF OCR X 提供支援。將 PDF 和影像轉換為文字或可搜尋的 PDF。
- Free OCR
- i2OCR
- Indic-OCR OCR 服務 一個印度語言的線上 OCR 服務
3. 行動裝置
- Android:
- tess-two - Android 版 Tesseract 工具的 Fork tesseract-android-tools,新增了一些額外功能。
- Tesseract4Android - tess-two 的 Fork,從頭開始重寫以支援最新版本的 Tesseract OCR。
- textfairy Android OCR 應用程式,原始碼位於 github.com
- 字元辨識 Android OCR 應用程式,原始碼位於 gitorious.org
- tesseract-android-tools:Android API 集合(於 2013-01-28 封存於 Google Code Archive)
- Mobile OCR:Mobile OCR 的目標是為 Android 平台建立一個應用程式,該應用程式將從手機相機拍攝的影像中辨識文字。該應用程式將完全可供弱視和失明的使用者使用
- Across India:一個應用程式,允許使用者拍攝印度語言或英文的招牌照片,並將其轉譯為他們可以閱讀的語言。
- iOS:
- Tesseract-OCR-iOS - Tesseract OCR iOS 是適用於 iOS7+ 的框架,也為 armv7s 和 arm64 編譯。
- OCR-iOS-Example - 一個關於如何在 iOS 上進行光學字元辨識 (OCR) 的簡單範例。
- Tesseract-iPhone-Demo - 基於 tesseract 2.04 的範例。
- 更多作業系統:
- ScanBizCards:用於名片掃描的行動解決方案。要求: iPhone 4/iPhone 3/Android 2.0
- macOS:
- Tesseract macOS - 適用於 macOS 的 Tesseract OCR 框架,同時支援 Objective C 和 swift。為 x86 和 arm64 編譯。
4. 其他 (實用程式、工具、命令列介面 [CLI] 等)
A. PDF 轉為可搜尋 PDF 的工具
(例如:任何也可以將無法搜尋的 PDF 作為輸入的工具)
- OCRmyPDF - 將 OCR 文字層新增至掃描的 PDF 檔案和影像,使其可被搜尋。在多核心 CPU 上平行處理頁面。盡可能保持原始嵌入影像的精確解析度,而不會重新壓縮 JPEG。包含多個影像預處理選項、詳細文件,以及支援許多特殊的 PDF。
- pdf2pdfocr 是一個 OCR PDF(或支援的影像)的工具,並在原始檔案中新增文字層,使其成為可搜尋的 PDF。這是一個使用 tesseract 和其他開源工具的 python 腳本。支援 Linux、macOS 和 Windows。
- pdf2searchablepdf - 一個工具,允許將任何無法搜尋的 PDF 或任何整個影像目錄轉換為可搜尋的 PDF
B. 其他
- Scantools - 一個函式庫和一組匹配的命令列應用程式,用於圖形處理,旨在處理掃描的文件並產生高品質的 PDF 檔案。image2pdf 將影像轉換為 PDF。由光學字元辨識程式(例如 Tesseract)產生的 HOCR 檔案,可以選擇性地指定以使 PDF 檔案可搜尋。產生的檔案符合 ISO PDF/A 標準,用於長期歸檔數位文件。hocr2any 將 HOCR 檔案轉換為文字,或將其渲染為點陣圖或 PDF 檔案 ocrPDF 使用 Tesseract OCR 引擎來偵測文字並在 PDF 檔案中產生文字層。
- ocr-fileformat - 驗證和轉換 OCR 檔案格式 (hOCR、ALTO、PAGE、FineReader)
- Tess4J - 用於 Tesseract OCR API 的 Java JNA 包裝器。
- Traineddata 檢查器 - 檢查 traineddata 檔案的一些內部結構
- TopOCR - 適用於相機的高品質 OCR,支援 tesseract-ocr (付費產品)
- 簡單的 OCR 網頁伺服器 使用 python、flask、tesseract-ocr 和 leptonica
- Display OCR 是 OpenCV-Python + python-tesseract 即時影像預處理和 7 段字型的 OCR。
- OpenOCR 使託管您自己的 OCR REST API 變得簡單。
- https://github.com/guitarmind/tesseract-web-service 是使用 tornado 的 tesseract-OCR 的 RESTful 網頁服務實作
- RasterEdge .NET 影像 SDK - OCR 辨識 是一個強大、高效能的免授權發行辨識應用程式,適用於桌面或伺服器應用程式。
- DevScope OCR SDK 是一個基於 Tesseract OCR v3 的光學字元辨識工具組引擎,可使用 Microsoft .NET Framework 開發應用程式
- Paperwork - 使用 OCR 以輕鬆的方式抓取實體文件(需要 pyocr)
- Aletheia - 用於生產環境的進階文件版面和文字 Ground-Truthing 系統
- gscan2pdf 一個從掃描的文件產生 PDF 或 DjVu 的 GUI
- Audiveris 是一個開放原始碼的光學音樂辨識軟體,可處理樂譜的影像,以自動提供 MusicXML 標準的符號音樂資訊。
- Ocrivist 是一個實用程式,可將書籍和其他印刷文件掃描並進行 OCR,以轉換為 PDF 或 Djvu 格式。
- thu-ipv6-login 一個用於清華大學 IPv6 驗證的 python 腳本,支援驗證碼的 OCR
- Wolfram Mathematica 9.0 使用 tesseract 進行辨識文字
- node-dv 是一個用於處理和理解掃描文件的 node.js 函式庫
- hocr-tools - python 工具,用於操作和評估 hOCR 格式,以透過將其嵌入 HTML 中來表示多語言 OCR 結果。它們包括用於建立可搜尋 pdf 的 hocr-pdf 工具。
- PyPDFOCR - 基於 Tesseract-OCR 的 PDF 歸檔
- ChronoScan 是一套完整的文件掃描與資料輸入套件
- speedy-ocr 實用程式,可簡化掃描和 OCR 焦點,以協助盲人和視覺障礙群體。它是 Vinux 專案的一部分。
- Project VIRAL Varico 發票辨識與輔助學習
- Bindery:一個簡單的 GUI,用於將後處理的掃描頁面綁定到數位文件中
- Clarify:Clarify 可協助您 OCR「僅影像」PDF。您的輸入是一個通常無法從中提取文字的 PDF。輸出是文字。Clarify 是一個包裝 tesseract-ocr、xpdf 和 netpbm 的 python 模組。要求: python、tesseract-ocr、xpdf、netpbm
- hOcr2Pdf.NET:hOcr2Pdf.NET 是一個函式庫,程式設計師可以用它來為應用程式建立高度壓縮、可搜尋的 pdf。要求: .NET 2.0 或更高版本、Tesseract 3.0、JBig2.exe
- PDFBeads:根據 hOCR 檔案將掃描的影像轉換為單一可搜尋的 PDF 檔案。要求: ruby、RMagick、hpricot
- ExactImage/hocr2pdf:從 hOCR 輸入建立可搜尋的 PDF。要求: libagg
- HocrConverter:從 hOCR 文件建立 PDF 和純文字。要求: python、reportlab
- HocrToPdf.java:java 來源,用於非常基本的 hOCR 到 PDF 轉換器。編譯版本可在專案 modi2hocr 中找到。要求: java、jericho、iText2
- hOcr2Pdf.NET:是一個 .NET 函式庫,可使用 HtmlAgilityPack 和 iTextSharp 將 Tesseract 或 Cuneiform 產生的 .hocr html 轉換為可搜尋的 PDF。需求: C#。
- Tally-Ho:Tally-Ho 是一個螢幕閱讀器,適用於像 Google 圖書這類的網站。
- Mayan EDMS:以 Tesseract 為基礎的文件管理系統。
- Olena:一個通用且高效的影像處理平台(Tesseract 用於其名為 scribo 的部分)。
- ocrodjvu 是一個 OCR 系統的封裝器,可讓您對 DjVu 檔案執行 OCR。
- PaRADIIT(文件影像索引和轉錄的模式冗餘分析)是一個由 Google DH 連續兩次獎項贊助的專案。其目標是將古代書籍,特別是文藝復興時期的書籍,轉變為可訪問的數位圖書館。
- ISRI 分析工具包含 17 個工具,用於測量和實驗 OCR 輸出的效能。
- Indic Messenger:一個 Facebook 聊天機器人,可以 OCR 包含印度/英文文字的圖像,並將其音譯為其他印度文字。
- LibreOCR:一個 LibreOffice 擴充功能,可以將圖像轉換為 OCT 並在 Writer 應用程式中開啟。
- hertzg/tesseract-server:一個輕量級、基於 Docker、多架構、無狀態的 Tesseract JSON HTTP API 服務。
與 IMPACT 相關
- IMPACT 中心 - 一個非營利組織,成立的目的是為了延續 IMPACT 的成果並促進社群建設。
- IMPACT 數據
- IMPACT 工具
- IMPACT 互操作性框架 - 互操作性層,支援在 IMPACT 專案期間開發的軟體組件的鬆散耦合。
- 庫存提取工具原型 是一個具有圖形使用者介面 (GUI) 的原型,允許從文件中提取完整的字元列表,而無需參考特定的語言字典或字體庫。
- 後校正工具 是 OCR 文件的互動式後校正。使用文字和錯誤分析器獲得的資訊,整個校正過程可以根據正在處理的文件進行調整。通過這種方式,通常只需幾次按鍵即可糾正大量的系統性錯誤。
- OCR 評估工具.
- BlackLab 是一個基於 Apache Lucene 构建的語料庫檢索引擎。它允許對大型、已標記和註釋的文本主體進行快速、複雜的搜索,並具有精確的命中突出顯示。它由荷蘭語詞彙研究所 (INL) 開發,旨在為我們的歷史和當代文本語料庫提供快速且功能豐富的搜尋介面。
有關 IMPACT 專案的更多資訊,請參閱 tesseract 論壇中的討論。