NGHIÊN CỨU HIỆU NĂNG CỦA CÁC PHƯƠNG PHÁP ĐÁNH GIÁ CHỦ QUAN VỚI DỮ LIỆU ẢNH VÀ VIDEO
Keywords:
Phương pháp đánh giá chủ quan, chất lượng ảnh và video, chất lượng trải nghiệm người dùng, MOSAbstract
Đối với lĩnh vực nghiên cứu về chất lượng ảnh video hiện nay, có nhiều phương pháp đánh giá chủ quan khác nhau, tùy thuộc vào mục đích. Các phương pháp đánh giá chủ quan được khuyến nghị bởi ITU-T và ITU-R. Tuy nhiên, theo khảo sát chưa có một nghiên cứu toàn diện về việc lựa chọn một phương pháp đánh giá chủ quan phù hợp và chính xác nhất. Do đó, bài báo này sẽ cung cấp một nghiên cứu toàn diện, dựa trên việc so sánh các phương pháp đánh giá chủ quan phổ biến nhất hiện nay. Trong bài báo này, tám phương pháp đánh giá chủ quan, bao gồm phương pháp đánh giá Thang đo liên tục (Double-Stimulus Continuos Quality-Scale (DSCQS)), phương pháp Thang đo suy giảm (Double-Stimulus Impairment Scale (DSIS)), phương pháp Xếp loại danh mục tuyệt đối với thang điểm 5 (ACR5), phương pháp Xếp loại danh mục tuyệt đối thang điểm 5 với tham chiếu ẩn (ACR5-HR), phương pháp Thang đo 11 mức độ ACR (ACR11), phương pháp Thang đo ACR11 với tham chiếu ẩn (ACR11-HR), phương pháp Đánh giá chủ quan chất lượng đa dạng của video (Subjective Assement of Multimedia Video Quality (SAMVIQ)), và phương pháp SAMVIQ với tham chiếu ẩn (SAMVIQ-HR). Các phương pháp này được so sánh và kiểm thử theo từng tình huống, để xác định khả năng áp dụng của từng phương pháp đối với đánh giá ảnh và video. Các cách đánh giá bao gồm, đánh giá tổng thời gian và độ khó/dễ trong việc đánh giá đối với người tham gia, cũng như các đặc trưng của các thang đo khác nhau và độ tin cậy thống kê của từng phương pháp. Kết quả cho thấy hệ số tương quan và sự phân bổ sự tương quan của điểm số bình quân (MOS) giữa các phương pháp là cao. Đồng thời, kết quả cũng thể hiện rõ các tham số độ tin cậy thống kê của từng phương pháp đánh giá như DSIS, ACR5, và SAMVIQ đã vượt trội hơn các phương pháp khác. Hơn nữa, kết quả khảo sát từ người tham gia cho thấy ACR5 là một phương pháp phù hợp nhất dựa trên tiêu chí về tổng thời gian đánh giá và độ dễ dàng trong việc đánh giá.