跳至內容。

發行說明

此頁面提供最新的發行說明。

目錄

開發中

Tesseract 的 API/ABI 變更審查

API/ABI changes graph

api_abi_changes.png

V5.5.0

2024 年 11 月 10 日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.5.0

V5.4.1

2024 年 6 月 11 日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.4.1

V5.4.0

2024 年 6 月 6 日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.4.0

V5.3.4

2024 年 1 月 18 日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.3.4

V5.3.3

2023 年 10 月 5 日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.3.3

V5.3.2

2023 年 7 月 11 日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.3.2

V5.3.1

2023 年 4 月 1 日

稍微調整格式,改善 DebugDump 輸出。由 @GerHobbelt 在 PR #4022 中提供。

錯誤修復

CMake 建置系統

編譯器支援

我們已停止支援 GCC 和 libstdc++ 8.x。

V5.3.0

2022 年 12 月 22 日

LSTM 訓練:擴展函式 BoxFileName 以處理另一個圖片名稱副檔名,.raw.png。由 @bertsky 在 PR #3962 中提供。

錯誤修復

建置系統

V5.2.0

2022 年 7 月 6 日

V5.1.0

2022 年 3 月 1 日

V5.0.1

2022 年 1 月 7 日

CMake 建置

V5.0.0

2021 年 11 月 30 日

V4.1.3

2021 年 11 月 15 日

修正損壞的 autotools 建置。

V4.1.2

2021 年 11 月 14 日

Autotools 建置的變更

V4.1.1

2019 年 12 月 26 日

V4.1.0

2019 年 7 月 7 日

V4.0.0

2018 年 10 月 29 日

V3.05.02

2018 年 6 月 19 日

此版本修正了一些錯誤,這些錯誤是從 4.0.0 版本回溯移植的。

V3.05.01

2017 年 6 月 1 日

V3.05.00

2017 年 2 月 16 日

V3.04.01

2016 年 2 月 16 日

V3.04.00

2015 年 7 月 11 日

V3.03(rc1)

2014 年 2 月 4 日

V3.02.02

2012 年 10 月 23 日

V3.01

2011 年 10 月 21 日

V3.00

2010 年 9 月 30 日

V2.04

2009年6月30日

V2.03

2008年4月22日

2.02 版本由於最後一刻的「簡單」變更而無法執行。2.03 版本修正了這個問題。它還新增了對 leptonica 的包含檢查,使其更易於使用。

V2.02

2008年4月21日

V2.01

2007年8月30日

(有關使用資訊,另請參閱下方 2.00 的發行說明)

沒有主要功能變更。只是一堆錯誤修正。

原始的 6 種語言沒有新的資料檔案。請使用 v2.00 的檔案。德語 Fraktur (deu-f) 和巴西葡萄牙語 (por) 有新的資料檔案。

最新消息 unicharset_extractor 中有一個小錯誤。由於這僅適用於訓練,因此除非您需要執行訓練,否則主要的 tarball 是正常的,在這種情況下,請將您的 unicharset_extractor.cpp 和 unicharset_extractor.exe 覆蓋為 tesseract-2.01.patch1.tar.gz 中的檔案。

V2.00

2007年7月18日

(有關其他使用資訊,另請參閱下方 1.04 的發行說明)

國際版本的第一個發行版本。此版本可辨識以下語言:

語言代碼遵循 ISO 639-2。預設語言為英文。若要辨識其他語言

tesseract inputimage outputbase -l langcode

若要在新語言上進行訓練,請參閱 TrainingTesseract2。隨著時間的推移,將會出現更多語言。

此版本中的變更清單

警告: Tesseract 2.00 版本經過比以往任何版本都多的相容性測試。甚至還進行了一些修正,以使跨平台的準確性更加一致。話雖如此,程式碼進行了許多變更,可攜性可能會被破壞,因此 64 位元和 Mac 平台可能無法像以前一樣運作或甚至建置。

V1.04

2007年5月15日

Tesseract 的開發現在使用 Subversion 進行,並託管在 code.google.com 上(之前我們使用 CVS 作為 VCS,並使用 sourceforge.net 進行託管)。

僅限 Windows 使用者

新增了 Windows 的 dll 介面。感謝 Jetsoft 的 Glen 提供此介面。若要使用 dll,請包含 tessdll.h、匯入 tessdll.lib,並將 tessdll.dll 放在系統可以找到的位置。還有一個小的 dlltest 程式來測試 dll。使用以下方式執行:

dlltest phototest.tif phototest.txt

它將輸出 phototest.tif 的文字以及邊界框資訊。

Windows 的新功能

此發行版本現在包含 tesseract.exe 和 tessdll.dll,它們**可能**可以直接使用!由於您需要 VC++6 版本的 MFC 和 CRT(至少),才能使其運作,因此沒有任何保證。(不包含電池,當然也沒有 installshield。)

使用 make 建置的任何人的重要注意事項:也就是說,除了 devstudio 使用者之外的任何人

此發行版本包含資料目錄的新標準。若要讓 Tesseract 找到其資料檔案,您必須

./configure
make
make install

將資料檔案移動到標準位置,或

export TESSDATA_PREFIX="directory in which your tessdata resides/"

(或等效)在您的 .profile 或其他檔案中,或設定環境變數 setenv。請注意,目錄必須以 / 結尾

將 tesseract 和 tessdata 放在同一個目錄中已不再有效。

所有使用者

修復了一堆名稱衝突 - 主要與 STL 發生衝突。針對 Unicode 相容性進行了一些初步變更。包含一個新的資料檔案 (unicharset),並將其他資料檔案重新命名為 eng.,以支援不同的語言。還有一些其他次要的錯誤修正和 針對 64 位元、最新的 Visual Studio 編譯器等的移植性改進

感謝所有貢獻這些修正的人。

注意:這很可能是最後一個僅限英文的版本!對於因為 Windows 可執行檔而導致發行版本膨脹的非 Windows 使用者,在此先表示歉意。這很可能會在下一個包含多語言功能的版本中得到修復,因為這也會使發行版本膨脹。

V1.03

2007年2月3日

V1.02

2006年10月4日

V1.01

2006年9月7日

V1.00

2006年6月17日

Tesseract 的第一個開源版本!

託管於 sourceforge.net。CVS 用於版本控制。