Trước tiên cần tải những cái sau về (ko cần cài đặt gì cả). Lưu ý là hướng dẫn này chỉ dành cho Windows. Tên nào xài Mac OS thì cũng tương tự thôi, cách cài còn dễ hơn.
- Tesseract: https://www.dropbox.com/s/8t54mz39i58qslh/tesseract-3.05.00dev-win32-vc19.zip?dl=1 Tải xong giải nén zip ra thành một thư mục.
- Tải file data ngôn ngữ tiếng Việt cho Tesseract: https://github.com/tesseract-ocr/tessdata/blob/master/vie.traineddata
- Nếu chạy file thực thi
tesseract.exe
bị lỗi thì mới tải và cài cái này (VS2005 redist): https://www.microsoft.com/en-us/download/details.aspx?id=3387 - Xem cái video bên dưới.
Have fun!
-
admin ·
có j mà k hiểu, cứ vậy làm theo thôi
-
BạchHổ ·
Em ko hỉu sao làm theo ạ, em gà lắm
-
admin ·
quan trọng ko phải là xuất phát điểm, mà chính là tinh thần cầu tiến của ngươi.
-
xem song hiểu luôn nhưng làm theo thì toàn sai
Hổ chả hỉu tý nào về công nghệ thông tin, nên khó nhai bản hướng dẫn của Lão Đại quá.
làm cái này phải đc exp cao cao nha lão ( 20xp/1c chẳng hạn ) : ta định làm mấy bộ như đế bá ( khoảng 70 chục chương file ảnh), chân linh cửu biến
-
admin ·
ngươi làm xong thì ta sẽ thưởng xp. Đảm bảo ngươi ko thiệt.
-
ta đâu có biết là đc bao nhiêu đâu
-
admin ·
trời, còn trả treo nữa... 70x20 = 1400xp chịu chưa
-
Hắc hắc, hợp tác vui vẻ
Cái này rắc rối quá hổ chịu, đành để mấy thánh rành về vụ này làm vậy
-
TiênHồ ·
cho cái link chuyển đi đạo hữu chứ cop từng chương qua nản quá
Ta hiểu được gần hết cái đống đó vấn đề chỉ là ta khá lười khi ngồi chỉnh lài
Cái này hay, anh em có thể dùng phần mềm ABBYY FineReader 12 cũng được, khá chuẩn cho tiếng việt đó!
mở cái windows command processor làm sao vậy??? hiểu hết còn mỗi cái này là không biết làm sao
-
Đệch, alt+r xong gõ cmd rồi enter
-
infinite ·
huynh xài win 8 thì alt Q rồi gõ commamnd là nó ra rồi mà
cho hỏi nếu lỗi thì làm sao ạ? đệ làm tới khúc cuối rồi mà bị lỗi
-
admin ·
ta nói rõ trong video r mà. Nếu báo lỗi thì phải cài thêm phầm mềm (có link ở trên).
Có cái nào cần chuyển không để tại hạ nhận chuyển sang text thử coi sao.
thư mục của ta là tesseract-ocr vậy ta viết thế này: tesseract-ocr\tesseract.exe c11 -l vie --tessdata-dir ./tessdata Ta viết sai ở đâu hay thế nào mà nó cứ báo là "lỗi mở file vie.traineddata làm ơn làm đúng biến tessdata_prefix. lão đại xem thế nào hướng dẫn cho em cái
-
admin ·
tải file vie.traineddata về hay chưa? Để file đó đúng thư thử mục ta noi trong video.
-
sekai92 ·
có file đó rồi và đúng ở thư mục đó rồi
ơn giời có thể đọc đc Thiên tài đọa lạc r, toàn file ảnh đọc căng cả mắt
-
Muốn chuyển cũng là cả một quá trình đó!
-
hmm thấy có mấy cách dễ làm hơn mà chưa biết hiệu quả ntn, thử mới đc
-
admin ·
tương tự như trên nhưng thay bằng file data khác, https://github.com/tesseract-ocr/tessdata/ chọn `chi_sim.traineddata`