描述 Tesseract 各個面向的技術論文

版權聲明

此處發布的資料受版權保護，未經各版權持有者許可，不得銷售或散布。

點擊以下連結將下載 PDF 文件。

以下資料曾刊載於 IEEE 出版物，並且每篇都帶有 IEEE 版權標示。未經 IEEE 書面許可，不得銷售或進一步散布論文。

©ACM, 2009。這是作者們的版本。經 ACM 許可在此發布，供您個人使用。請勿再散布。最終版本發表於 2009 年 7 月 25 日在西班牙巴塞隆納舉行的 2009 年國際多語 OCR 工作坊會議論文集。https://dl.acm.org/citation.cfm?id=1577804

影片 PhotoTechEDU 第 11 天：使用 Leptonica 進行文件影像分析
訓練 Tesseract 進行古希臘文 OCR，作者：Nick White
整合 Tesseract OCR 引擎的 Shirorekha 切割技術以增強印地語辨識，作者：Nitin Mishra、C. Patvardhan、C. Vasantha Lakshmi、Sarika Singh
Tesseract 和 ABBYY FineReader OCR 引擎的比較報告，作者：Heliński、Kmieciak 和 Parkoła
hOCR 嵌入式 OCR 工作流程和輸出格式 (hOCR 規格)
在 Nokia N900 上使用筆畫寬度轉換進行文字偵測 (含原始碼)
使用長短期記憶網路進行通用文字辨識 - 博士論文
使用電腦視覺和深度學習建立現代 OCR 管線
受翻譯啟發的 OCR，作者：Dmitriy Genzel、Ashok C. Popat、Nemanja Spasojevic、Michael Jahr、Andrew Senior、Eugene le、Frank … 關鍵字-光學字元辨識；統計機器… (字元) 在阿拉伯語、英語和印地語 PRAN 資料範例中的位置。
在 Google 開發多語 OCR 和手寫辨識，作者：Ashok Popat。Google Inc. 研究科學家。IAPR 夏季學校，齋浦爾：2017 年 1 月 23 日。
透過圖卷積神經網路進行通用 OCR 段落識別，作者：Renshen Wang、Yasuhisa Fujii、Ashok C. Popat，2021 年 1 月