PHÂN LOẠI TÍNH CHẤT BÀI BÁO MẠNG SỬ DỤNG MÔ HÌNH PhoBERT

Authors

  • Duc Tran Duong
  • An Le Ngoc
  • Toan Nguyen Dinh
  • Thien Le Truong

Keywords:

phân loại bài báo mạng, quản lý thông tin mạng, mô hình bert

Abstract

Quản lý thông tin mạng là một vấn đề cấp thiết hiện nay khi các nội dung truyền thông ngày càng được số hóa và phổ biến. Nhờ tính chất thuận tiện của truyền thông, báo chí số, thông tin về các vụ việc được truyền tải một cách nhanh chóng và người đọc có thể dễ dàng tiếp cận. Cùng với sự phát triển này, các cơ quan quản lý cũng phải có khả năng nhanh chóng nắm bắt được thông tin để có các xử lý kịp thời. Trong đó, việc nhanh chóng thu thập và xác định tính chất vụ việc đang xảy ra trên truyền thông là một công việc quan trọng đối với các cơ quan quản lý thông tin. Bài báo này đề xuất một hệ thống và phương pháp tự động thu thập, đánh giá phân loại tính chất vụ việc qua nội dung bài báo mạng sử dụng mô hình PhoBERT. Các thực nghiệm được tiến hành trên tập dữ liệu gồm hơn 6.000 bài báo được thu thập tự động và hỗ trợ gán nhãn bởi các chuyên viên trong lĩnh vực quản lý thông tin mạng. Kết quả phân loại cao nhất theo độ đo F1 đến 93.1% theo tính chất vụ việc với ba nhãn tích cực, tiêu cực, bình thường cho thấy phương pháp là khả thi và có thể áp dụng vào thực tế.

Downloads

Published

2024-05-06