此頁面列出 Tesseract 社群提供的,與 Tesseract4 相容的 tessdata(用於 –oem 1 - LSTM)的儲存庫。
此類 tessdata 貢獻應理想地記錄重現訓練過程所需的一切(字型、影像、真實標註、文字、腳本、文件等)。
語言代碼 | 語言 | 資料檔案 | 貢獻者 | 資訊 |
---|---|---|---|---|
khmLimon | 高棉語 | best | OpenInstituteCambodia/phyrumsk | 在 tessdata_best 中的 PR |
cop | 科普特語 | best | shreeshrii/tessdata_coptic | tesseract-ocr 論壇文章 |
jpn_vert | 日文直式 | best | zodiac3539/jpn_vert | tesseract-ocr 論壇文章 |
ocrb_plus | MRZ | best | shreeshrii/tessdata_ocrb | tesseract-ocr 論壇文章 |
jav_java | 爪哇字母 | best | Shreeshrii/tessdata_jav_java | tesseract-ocr 論壇文章 |
mrz | MRZ | best | DoubangoTelecom/tesseractMRZ | tesseract-ocr 論壇文章 |
dot_matrix | MRZ | best | ameera3/OCR_Expiration_Date | tesseract-ocr 論壇文章 |
e13b | E13B (或 MICR) | best | ElMagoElGato/tess_e13b_training | tesseract-ocr 論壇文章 |
e13b | E13B (或 MICR) | best | DoubangoTelecom/tesseractMICR | tesseract-ocr 論壇文章 |
frak | 德文尖角體 | best | bib.uni-mannheim.de/~stweil | tesstrain wiki |