跳至內容。

Tesseract 不同版本支援的語言/文字

語言

語言代碼 語言 3.02 3.04 4.00 4.0.0 4.0.0 4.0.0
        2016 年 11 月 tessdata tessdata_best tessdata_fast
               
afr 南非語 x x x x x x
amh 阿姆哈拉語   x x x x x
ara 阿拉伯語 x x x x x x
asm 阿薩姆語   x x x x x
aze 亞塞拜然語   x x x x x
aze_cyrl 亞塞拜然語 - 西里爾字母 x x x x x x
bel 白俄羅斯語 x x x x x x
ben 孟加拉語 x x x x x x
bod 藏語   x x x x x
bos 波士尼亞語   x x x x x
bre 布列塔尼語     x x x x
bul 保加利亞語 x x x x x x
cat 加泰隆尼亞語;瓦倫西亞語 x x x x x x
ceb 宿霧語   x x x x x
ces 捷克語 x x x x x x
chi_sim 中文 - 簡體 x x x x x x
chi_tra 中文 - 繁體 x x x x x x
chr 切羅基語 x x x x x x
cos 科西嘉語       x x x
cym 威爾斯語   x x x x x
dan 丹麥語 x x x x x x
dan_frak 丹麥語 - Fraktur 字體 (貢獻) x x        
deu 德語 x x x x x x
deu_frak 德語 - Fraktur 字體 (貢獻) x x        
deu_latf 德語 (Fraktur 拉丁字母)     x x x x
dzo 宗喀語   x x x x x
ell 希臘語,現代 (1453-) x x x x x x
eng 英語 x x x x x x
enm 英語,中古 (1100-1500) x x x x x x
epo 世界語 x x x x x x
equ 數學/方程式偵測模組 x x   x x x
est 愛沙尼亞語 x x x x x x
eus 巴斯克語 x x x x x x
fao 法羅語       x x x
fas 波斯語   x x x x x
fil 菲律賓語 (舊 - 他加祿語)       x x x
fin 芬蘭語 x x x x x x
fra 法語 x x x x x x
frk 德語 - Fraktur 字體 (現在為 deu_latf) x x x x x x
frm 法語,中古 (約 1400-1600) x x x x x x
fry 西弗里斯蘭語       x x x
gla 蘇格蘭蓋爾語       x x x
gle 愛爾蘭語   x x x x x
glg 加利西亞語 x x x x x x
grc 希臘語,古代 (至 1453) (貢獻) x x x x x x
guj 古吉拉特語   x x x x x
hat 海地語;海地克里奧爾語   x x x x x
heb 希伯來語 x x x x x x
hin 印地語 x x x x x x
hrv 克羅埃西亞語 x x x x x x
hun 匈牙利語 x x x x x x
hye 亞美尼亞語       x x x
iku 因紐特語   x x x x x
ind 印尼語 x x x x x x
isl 冰島語 x x x x x x
ita 義大利語 x x x x x x
ita_old 義大利語 - 古 x x x x x x
jav 爪哇語   x x x x x
jpn 日語 x x x x x x
kan 卡納達語 x x x x x x
kat 喬治亞語   x x x x x
kat_old 喬治亞語 - 古   x x x x x
kaz 哈薩克語   x x x x x
khm 高棉語   x x x x x
kir 吉爾吉斯語   x x x x x
kmr 庫爾曼吉語(庫德語 - 拉丁文字)     x x x x
kor 韓語 x x x x x x
kor_vert 韓語 (直式)     x x x x
kur 庫德語 (阿拉伯文字)   x        
lao 寮語   x x x x x
lat 拉丁語   x x x x x
lav 拉脫維亞語 x x x x x x
lit 立陶宛語 x x x x x x
ltz 盧森堡語     x x x x
mal 馬拉雅拉姆語 x x x x x x
mar 馬拉提語   x x x x x
mkd 馬其頓語 x x x x x x
mlt 馬爾他語 x x x x x x
mon 蒙古語     x x x x
mri 毛利語     x x x x
msa 馬來語 x x x x x x
mya 緬甸語   x x x x x
nep 尼泊爾語   x x x x x
nld 荷蘭語;弗拉芒語 x x x x x x
nor 挪威語 x   x x x x
oci 奧克語 (1500 年後)   x x x x x
ori 奧里亞語   x x x x x
osd 方向和文字偵測模組 x x x x x x
pan 旁遮普語   x x x x x
pol 波蘭語 x x x x x x
por 葡萄牙語 x x x x x x
pus 普什圖語   x x x x x
que 蓋丘亞語     x x x x
ron 羅馬尼亞語;摩爾多瓦語 x x x x x x
rus 俄語 x x x x x x
san 梵語   x x x x x
sin 僧伽羅語   x x x x x
slk 斯洛伐克語 x x x x x x
slk_frak 斯洛伐克語 - Fraktur 字體 (貢獻) x x        
slv 斯洛維尼亞語 x x x x x x
snd 信德語     x x x x
spa 西班牙語;卡斯提爾語 x x x x x x
spa_old 西班牙語;卡斯提爾語 - 古 x x x x x x
sqi 阿爾巴尼亞語 x x x x x x
srp 塞爾維亞語 x x x x x x
srp_latn 塞爾維亞語 - 拉丁字母   x x x x x
sun 巽他語     x x x x
swa 斯瓦希里語 x x x x x x
swe 瑞典語 x x x x x x
syr 敘利亞語   x x x x x
tam 坦米爾語 x x x x x x
tat 韃靼語     x x x x
tel 泰盧固語 x x x x x x
tgk 塔吉克語   x x x x x
tgl 他加祿語 (新 - 菲律賓語) x x x      
tha 泰語 x x x x x x
tir 提格里尼亞語   x x x x x
ton 東加語     x x x x
tur 土耳其語 x x x x x x
uig 維吾爾語   x x x x x
ukr 烏克蘭語 x x x x x x
urd 烏爾都語   x x x x x
uzb 烏茲別克語   x x x x x
uzb_cyrl 烏茲別克語 - 西里爾字母   x x x x x
vie 越南語 x x x x x x
yid 意第緒語   x x x x x
yor 約魯巴語     x x x x

文字

  文字 3.02 3.04 4.00 4.0.0 4.0.0 4.0.0
        2016 年 11 月 tessdata tessdata_best tessdata_fast
arab 阿拉伯語       x x x
armn 亞美尼亞語       x x x
beng 孟加拉語       x x x
cans 加拿大原住民       x x x
cher 切羅基語       x x x
cyrl 西里爾字母       x x x
deva 天城文       x x x
ethi 衣索比亞文       x x x
frak Fraktur 字體       x x x
geor 喬治亞語       x x x
grek 希臘文       x x x
gujr 古吉拉特語       x x x
guru 古木基文       x x x
hans HanS (簡體中文)       x x x
hans-vert HanS_vert (簡體中文直式)       x x x
hant HanT (繁體中文)       x x x
hant-vert HanT_vert (繁體中文直式)       x x x
hang 韓文       x x x
hang-vert Hangul_vert (韓文直式)       x x x
hebr 希伯來語       x x x
jpan 日語       x x x
jpan-vert Japanese_vert (日文直式)       x x x
knda 卡納達語       x x x
khmr 高棉文       x x x
laoo 寮語       x x x
latn 拉丁語       x x x
mlym 馬拉雅拉姆語       x x x
mymr 緬甸文       x x x
orya 奧里亞文 (奧迪亞文)       x x x
sinh 僧伽羅文       x x x
syrc 敘利亞語       x x x
taml 坦米爾語       x x x
telu 泰盧固語       x x x
thaa 塔納文       x x x
thai 泰語       x x x
tibt 藏語       x x x
viet 越南語       x x x

關於每個 Script.traindata 檔案支援的語言的詳細資訊,請參閱以 langs.txt 結尾的檔案 (例如 Latin.langs.txt) 此處