Khai Thác Tập Hữu Ích Cao Tương Quan Trên Cơ Sở Dữ Liệu Giao Dịch Có Lợi Nhuận Âm

  • Van Le Nguyen TPHCM
  • Nguyễn Thị Thanh Thủy HUFI
  • Mạnh Thiên Lý
Keywords: Tập hữu ích cao, Tính tương quan, Khai thác dữ liệu, cơ sở dữ liệu giao dịch, tập hữu ích cao tương quan

Abstract

Việc khai thác tập hữu ích cao có tính tương quan (Correlated Hight Utility Itemset) trong cơ sở dữ liệu giao dịch đã được nghiên cứu rộng rãi để khám phá hành vi mua hàng của người dùng. Từ đó, các nhà quản lý doanh nghiệp có thể điều chỉnh chiến lược bán hàng một cách phù hợp để tăng lợi nhuận. Các cách tiếp cận khai thác tập hữu ích cao có tương quan trước đây chỉ thực hiện trên cơ sở dữ liệu có lợi nhuận dương mà ít khi quan tâm đến các giá trị lợi nhuận âm. Trên thực tế, các doanh nghiệp có thể giảm lợi nhuận của các mặt hàng tồn kho lâu ngày để kích thích người mua, thậm chí có thể giảm lợi nhuận đến mức âm để tiêu thụ hết lượng hàng tồn kho. Để khai thác tập hữu ích cao có tương quan hiệu quả trên cơ sở dữ liệu giao dịch có lợi nhuận âm, chúng tôi đề xuất thuật toán CHN (Correlated High utility itemset with Negative profit). Đánh giá thử nghiệm trên cả năm cơ sở dữ liệu Chess, Mushroom, Pumsb, Retail và Kosarak và cho thấy thuật toán CHN có hiệu suất thực thi một cách hiệu quả.

Published
2021-07-15