Bộ dữ liệu dạng netflow dùng trong phát hiện xâm nhập trái phép và ứng dụng
Abstract
Các bộ dữ liệu mẫu về xâm nhập trái phép trong mạng máy tính hiện đã và đang được ứng dụng rất rộng rãi trong việc nghiên cứu phát hiện xâm nhập mạng trái phép. Trên thế giới đã có nhiều bộ dữ liệu khác nhau, mỗi bộ dữ liệu có ưu, nhược điểm khác nhau. Bộ dữ liệu dạng Netflow có nhiều ưu điểm trong việc phát hiện xâm nhập trái phép, đặc biệt trong mạng có lưu lượng dữ liệu lớn. Hiện tại, bộ dữ liệu của DARPA vẫn đang được các nhà khoa học sử dụng trong nghiên cứu phát hiện xâm nhập trái phép, tuy nhiên bộ dữ liệu DARPA không ở dạng Netflow. Mục tiêu của bài báo này trình bày một phương thức xây dựng bộ dữ liệu dạng Netflow từ nguồn dữ liệu DARPA; và ứng dụng bộ dữ liệu này trong phát hiện xâm nhập trái phép bằng phương pháp học máy. Bộ dữ liệu này có thể được sử dụng rộng rãi trong nghiên cứu phát hiện xâm nhập trái phép dựa trên Netflow.