VietOCR - Optical Character Recognition for Vietnamese language là phần mềm nguồn mở, miễn phí. Một giải pháp hoàn toàn không tồi cho nhu cầu nhận dạng ký tự tiếng Việt.
Ver. mới nhất là 1.5, hỗ trợ quét và nhận dạng tiếng Việt từ các file ảnh (.jpg, .png, .tiff, .bmp nhưng chưa hỗ trợ .gif); hỗ trợ file ảnh nhiều trang; hỗ trợ công cụ chỉnh sửa hậu kỳ về ngữ nghĩa và chính tả. Có 2 phiên bản, 01phiên bản GUI form chạy trên nền .NET, có cả bản 32 và 64 bit; 01 phiên bản chạy trên nền Java, hỗ trợ nhiều hệ điều hành như Windows, Linux ...
Bạn có thể xem chi tiết tại trang chủ của dự án
http://vietocr.sourceforge.net/
và download tại
http://sourceforge.net/projects/vietocr/files/
nhớ chọn đúng phiên bản mình cần
daithanhxk
15-08-2012, 04:48 PM
anh mod ơi ! em đang xài cái phần mềm này này, nhưng có một vấn đề là ko biết font chữ của hình ảnh thì sao chọn cho đúng font để xuất ra word được ah?
anh giúp em với !
làm cách nào để nhận biết font của hình ảnh !
Em đang cần gấp lắm !
Mong anh chỉ bảo !
Cảm ơn anh trước :003:
tanphuco
15-08-2012, 04:49 PM
Bạn đọc hướng dẫn sử dụng ở đây nè
http://vietocr.sourceforge.net/usage_vi.html
Không cần biết kiểu font và cỡ của các chữ trong hình ảnh đâu.
Trong phần mềm có mục Settings để bạn cài đặt kiểu font và cỡ cho chữ trong văn bản kết quả. VietOCR tích hợp sẵn các font Times New Roman, Arial, Verdana, và Courier New. Nếu bạn cần font VNI & TCVN3 (ABC) thì tham khảo cách cài thêm ở đây
http://vietunicode.sourceforge.net/forum/viewtopic.php?t=1183
Trong hướng dẫn sử dụng có nói nếu chọn kiểu font cho văn bản ra giống với kiễu font của các chữ trên hình ảnh thì kết quả có độ chính xác cao hơn! Cái này thì tùy hoàn toàn vào kinh nghiệm nhìn chữ đoán font gòi ...
longdatautovol
15-08-2012, 04:49 PM
Số hoá tài liệu tiếng Việt, nhận dạng ký tự tiếng Việt, chuyển đổi từ ảnh quét sang văn bản text. Hỗ trợ hơn 200 ngôn ngữ từ tiếng Việt đến Anh, Trung, Hàn, Nhật, Nga, Đức, Tây Ban Nha, Ả rập, …. Chính xác trên 99%, giải pháp chuyên nghiệp hàng đầu thế giới, sản phẩm và công nghệ của Mỹ. Giữ nguyên chính xác cấu trúc, style, bảng biểu, đồ thị, hình ảnh… của tài liệu gốc, không phải dàn trang căn chỉnh lại. Hỗ trợ mọi loại ảnh đầu vào phổ biến (màu, đen trắng, xám): TIFF, BMP, JPEG, PDF, PNG. Kết xuất đầu ra đa dạng: PDF, WORD, RTF, EXCEL, TXT, CSV, XML, HTML…
Liên hệ: 0985938585
(Tag: Nhận dạng ký tự, Nhận dạng ký tự tiếng Việt, Ảnh thành văn bản, Nhận dạng ký tự tiếng Trung, Nhận dạng ký tự tiếng Hàn, Nhận dạng ký tự tiếng Đức, Nhận dạng ký tự tiếng Nga, Nhận dạng ký tự tiếng Nhật, Số hoá tài liệu, Nhận dạng chữ viết, Nhận dạng ảnh quét, Nhận dạng chữ in)
vBulletin v3.6.1, Copyright ©2000-2024, Jelsoft Enterprises Ltd.