Đề Xuất Thuật Toán Khuyến Nghị Theo Phân Bố Dựa Trên Mô Hình Hỗn Hợp Gaussian

Authors

  • Ta Minh Thanh MTA
  • Nguyễn Văn Đạt

Keywords:

Hệ thống khuyến nghị, Content-Based, Mô hình hỗn hợp Gaussian

Abstract

Ngày nay, các hệ thống khuyến nghị đã len lỏi vào hầu hết các trang thương mai điện tử giúp tăng cường năng suất bán hàng cho các doanh nghiệp bằng cách hỗ trợ người tiêu dùng tìm được những sản phẩm phù hợp, chất lượng nhất. Hiện nay, có khá nhiều thuật toán khuyến nghị tốt và hiệu quả, tuy nhiên, thuật toán content-based recommendation vẫn là thuật toán phổ biến nhất được sử dụng trong giai đoạn đầu của các dự án. Trong một số trường hợp, độ chính xác của kết quả từ thuật toán content-based vẫn là một điều lo ngại khi bài toán liên quan đến độ tương tự về phân phối giữa các thành phần. Thêm nữa, các phương pháp để đo độ tương đồng cũng là một vấn đề quan trọng ảnh hưởng đến độ chính xác của các thuật toán content-based trong các bài toán về độ tương đồng giữa các phân phối. Để giải quyết hai vấn đề này, chúng tôi đề xuất một thuật toán content-based mới dựa trên mô hình hỗn hợp gaussian giúp tăng độ chính xác cho kết quả đầu ra. Mô hình đề xuất được thực nghiệm trên một bộ dữ liệu về rượu bao gồm 6 chỉ số về mùi vị, dữ liệu tag mô tả về vị của rượu và một số trường thông tin khác. Thuật toán này sẽ gom $n$ bản ghi dựa trên $n$ vectors 6 chiều thành $k$ nhóm $(k<n)$ trước khi áp dụng một công thức để sắp xếp các kết quả trả về. So sánh kết quả mô hình đề xuất với 2 thuật toán phổ biến khác trên bộ dữ liệu trên, kết quả thực nghiệm thu được không chỉ đạt được độ chính xác tốt hơn, mà thời gian thực thi của mô hình cũng vượt qua điều kiện cho việc áp dụng vào các ứng dụng thực tế.

Downloads

Published

2020-09-09