跳至內容。

此頁面列出 Tesseract 社群提供的,與 Tesseract4 相容的 tessdata(用於 –oem 1 - LSTM)的儲存庫。

此類 tessdata 貢獻應理想地記錄重現訓練過程所需的一切(字型、影像、真實標註、文字、腳本、文件等)。


語言代碼 語言 資料檔案 貢獻者 資訊
khmLimon 高棉語 best OpenInstituteCambodia/phyrumsk 在 tessdata_best 中的 PR
cop 科普特語 best shreeshrii/tessdata_coptic tesseract-ocr 論壇文章
jpn_vert 日文直式 best zodiac3539/jpn_vert tesseract-ocr 論壇文章
ocrb_plus MRZ best shreeshrii/tessdata_ocrb tesseract-ocr 論壇文章
jav_java 爪哇字母 best Shreeshrii/tessdata_jav_java tesseract-ocr 論壇文章
mrz MRZ best DoubangoTelecom/tesseractMRZ tesseract-ocr 論壇文章
dot_matrix MRZ best ameera3/OCR_Expiration_Date tesseract-ocr 論壇文章
e13b E13B (或 MICR) best ElMagoElGato/tess_e13b_training tesseract-ocr 論壇文章
e13b E13B (或 MICR) best DoubangoTelecom/tesseractMICR tesseract-ocr 論壇文章
frak 德文尖角體 best bib.uni-mannheim.de/~stweil tesstrain wiki