NHẬN DẠNG HÌNH TRẠNG BÀN TAY SỬ DỤNG THUẬT TOÁN YOLOv7
Keywords:
Tương tác người-máy, Thị giác máy tính, Nhận dạng cử chỉ, Học sâu, YOLOAbstract
Bên cạnh lời nói, cử chỉ nói chung và cử chỉ tay nói riêng là một trong những hình thức giao tiếp phổ biến nhất. Cử chỉ tay có thể truyền đạt nhiều nội dung một cách trực quan. Bài toán nhận dạng cử chỉ tay đã thu hút sự quan tâm nghiên cứu trong lĩnh vực thị giác máy tính những năm gần đây. Tuy nhiên, bài toán này vẫn còn một số thách thức bởi tương tác người-máy dùng cử chỉ tay cần tự nhiên, độ chính xác nhận dạng cao và thời gian đáp ứng nhanh. Trong bài báo này, chúng tôi đề xuất sử dụng thuật toán You Only Look Once phiên bản 7 (YOLOv7) cho bài toán nhận dạng hình trạng bàn tay (còn gọi là cử chỉ tĩnh). Thực nghiệm được tiến hành với tập hình trạng bàn tay trong trò chơi oẳn tù tì. Kết quả thực nghiệm cho thấy phương pháp nhận dạng hình trạng bàn tay sử dụng thuật toán YOLOv7 cho hiệu suất tốt hơn cả về tốc độ tính toán và độ chính xác so với phương pháp sử dụng thuật toán YOLOv5.