LICENSE PLATE RECOGNITION BASED ON MULTI-ANGLE VIEW MODEL
Keywords:
deep learning, license plate recognition and detectionAbstract
Trong lĩnh vực nghiên cứu, việc phát hiện/nhận dạng văn bản trong hình ảnh/video được ghi lại bằng camera là một vấn đề đầy thách thức đối với các nhà nghiên cứu. Mặc dù có những tiến bộ nhất định đạt được độ chính xác cao, các phương pháp hiện tại vẫn cần những cải tiến đáng kể để có thể áp dụng trong các tình huống thực tế. Khác với việc phát hiện văn bản trong hình ảnh/video, bài viết này đề cập đến vấn đề phát hiện văn bản trong biển số xe bằng cách hợp nhất nhiều khung hình có các góc nhìn khác nhau. Đối với mỗi góc nhìn, phương pháp đề xuất trích xuất các đặc điểm mô tả đặc trưng cho các thành phần chữ của biển số xe, cụ thể là các điểm góc, diện tích. Cụ thể, chúng tôi trình bày ba quan điểm: view-1, view-2 và view-3, để xác định các thành phần lân cận gần nhất tạo điều kiện thuận lợi cho việc khôi phục các thành phần văn bản từ cùng một dòng biển số xe dựa trên ước tính mức độ tương tự và số liệu khoảng cách. Sau đó, chúng tôi sử dụng phương pháp CnOCR để nhận dạng văn bản trong biển số xe. Kết quả thử nghiệm trên bộ dữ liệu tự thu thập (PTITPlates), bao gồm các cặp hình ảnh trong nhiều tình huống khác nhau và Bộ dữ liệu ô tô Stanford có sẵn công khai, chứng minh tính ưu việt của phương pháp được đề xuất so với các phương pháp hiện có.
Downloads
Published
Versions
- 2024-05-04 (2)
- 2024-05-04 (1)