描述 Tesseract 各個面向的技術論文
版權聲明
此處發布的資料受版權保護,未經各版權持有者許可,不得銷售或散布。
閱讀論文
點擊以下連結將下載 PDF 文件。
IEEE 版權資料
以下資料曾刊載於 IEEE 出版物,並且每篇都帶有 IEEE 版權標示。未經 IEEE 書面許可,不得銷售或進一步散布論文。
ACM 版權資料
調整 Tesseract 開源 OCR 引擎以用於多語 OCR
©ACM, 2009。這是作者們的版本。經 ACM 許可在此發布,供您個人使用。請勿再散布。最終版本發表於 2009 年 7 月 25 日在西班牙巴塞隆納舉行的 2009 年國際多語 OCR 工作坊會議論文集。https://dl.acm.org/citation.cfm?id=1577804
Ray Smith 的其他出版物
- Ray Smith 出版物
- 從多媒體文件影像中擷取和辨識文字,作者:Smith, R.W. (博士論文),1987
- DAS2014 上發表的 Tesseract 教學投影片
- DAS2016 上發表的 Tesseract 教學投影片
其他
- 影片 PhotoTechEDU 第 11 天:使用 Leptonica 進行文件影像分析
- 訓練 Tesseract 進行古希臘文 OCR,作者:Nick White
- 整合 Tesseract OCR 引擎的 Shirorekha 切割技術以增強印地語辨識,作者:Nitin Mishra、C. Patvardhan、C. Vasantha Lakshmi、Sarika Singh
- Tesseract 和 ABBYY FineReader OCR 引擎的比較報告,作者:Heliński、Kmieciak 和 Parkoła
- hOCR 嵌入式 OCR 工作流程和輸出格式 (hOCR 規格)
- 在 Nokia N900 上使用筆畫寬度轉換進行文字偵測 (含原始碼)
- 使用長短期記憶網路進行通用文字辨識 - 博士論文
- 使用電腦視覺和深度學習建立現代 OCR 管線
- 受翻譯啟發的 OCR,作者:Dmitriy Genzel、Ashok C. Popat、Nemanja Spasojevic、Michael Jahr、Andrew Senior、Eugene le、Frank … 關鍵字-光學字元辨識;統計機器… (字元) 在阿拉伯語、英語和印地語 PRAN 資料範例中的位置。
- 在 Google 開發多語 OCR 和手寫辨識,作者:Ashok Popat。Google Inc. 研究科學家。IAPR 夏季學校,齋浦爾:2017 年 1 月 23 日。
- 透過圖卷積神經網路進行通用 OCR 段落識別,作者:Renshen Wang、Yasuhisa Fujii、Ashok C. Popat,2021 年 1 月