The NHẬN DẠNG ÂM TIẾT TRONG SÁCH GIÁO KHOA TIẾNG VIỆT VỚI CNN
RECOGNIZING SYLLABLES IN VIETNAMESE TEXTBOOKS WITH CNN
Keywords:
Deep Learning, Convolutional Neural Networks (CNN), letter recognitionAbstract
Tóm tắt: Bài báo này sẽ trình bày chi tiết các bước xây dựng mô hình CNN trong bài toán nhận dạng kí tự tiếng Việt, huấn luyện và đánh giá mô hình. Từ đó xây dựng ứng dụng trên thiết bị di động cho việc trích rút nội dung hình ảnh văn bản trong sách giáo khoa tiếng Việt. Trong tiếng Việt có dấu có tới 178 lớp kí tự, tuy nhiên trong phạm vi bài báo là nhận diện chữ tiếng Việt trong sách giáo khoa nên sẽ có một số lớp kí tự chỉ khác nhau về mặt kích thước thực, ví dụ như “c” và “C”, “o” và “O”, … Bởi vậy, nhóm tác giả chỉ xây dựng mô hình nhận diện đối với 138 lớp kí tự sau khi đã tiến hành lọc bớt các lớp giống nhau nhằm tăng tính hiệu quả của mô hình. Bên cạnh đó, để phục vụ cho quá trình tiền xử lý ảnh, nhóm tác giả có xây dựng một số hàm kết hợp với thư viện OpenCV [10] phục vụ cho việc tìm đường bao của các ảnh âm tiết và ảnh kí tự bằng thuật toán Canny[13,14].