Tên đề tài luận án: Thuật toán di truyền cho bài toán nhận dạng thống kê và ứng dụng
Ngành: Lý thuyết xác suất và thống kê toán học
Mã số ngành: 9460106
Họ tên nghiên cứu sinh: Phạm Toàn Định
Khóa đào tạo: 2019-2022
Người hướng dẫn khoa học: 1. PGS.TS. Võ Văn Tài, 2. TS. Lê Thị Xuân Mai
Cơ sở đào tạo: Trường Đại học Khoa học Tự nhiên, ĐHQG.HCM
1. Tóm tắt nội dung luận án
Luận án được trình bày trong 5 chương.
Chương đầu tiên đề nghị thuật toán di truyền trong phân tích chùm cho các phần tử rời rạc. Trong thuật toán này, việc xác định số chùm thích hợp, những phần tử trong mỗi chùm và xác suất thuộc vào mỗi chùm của mỗi phần tử được thực hiện cùng lúc. Một đóng góp quan trọng của chương này là sự vận dụng thuật toán phân tích chùm đề nghị để xây dựng mô hình chuỗi thời gian mờ. Mô hình đề nghị đã cho những kết quả nổi bật trong so sánh với nhiều mô hình trước đó, qua nhiều tập dữ liệu đối chứng. Thuật toán phân tích chùm và mô hình chuỗi thời gian đề nghị đã được xây dựng trên phần mềm Matlab nên có thể áp dụng được cho số liệu thực. Nội dung chính của chương này được lấy từ nghiên cứu [CT1] trong danh mục công trình của tác giả.
Chương 2 trình bày thuật toán di truyền mờ trong phân tích chùm cho các hàm mật độ xác suất. Thuật toán đề nghị có ba đóng góp chính trong bài toán phân tích chùm cho đối tượng này. Thứ nhất, đề xuất một chỉ số mới làm hàm mục tiêu có hiệu quả trong xây dựng chùm. Thứ hai, xây dựng các bước tìm xác suất thuộc vào các chùm đã thiết lập của mỗi hàm mật độ xác suất. Cuối cùng là ứng dụng của thuật toán đề nghị trong phân tích dữ liệu ảnh. Thuật toán đề nghị có ưu điểm hơn các thuật toán trước đó khi so sánh trên nhiều tập dữ liệu đối chứng và qua nhiều tham số đánh giá. Nội dung chính trình bày trong chương này dựa vào nghiên cứu [CT2] đã được công bố trong danh mục công trình của tác giả.
Chương 3 đề nghị thuật toán di truyền trong xây dựng chùm cho các khoảng dữ liệu. Dựa vào khoảng cách chồng lấp trong trường hợp một chiều và được cải tiến trong trường hợp nhiều chiều, luận án đã đề xuất một thuật toán mới hiệu quả cho dữ liệu khoảng. Thuật toán đề nghị có những đóng góp chính như sau: (i) Phát triển khoảng cách chồng lấp cho trường hợp nhiều chiều từ trường hợp một chiều và sử dụng nó làm độ đo đánh giá sự tương tự của các khoảng. (ii) Xây dựng thuật toán xác định số lượng chùm thích hợp cho mỗi tập dữ liệu khoảng. (iii) Tìm xác suất thuộc vào các chùm của mỗi khoảng và ứng dụng thuật toán đề nghị trong phân tích chùm cho dữ liệu ảnh khi đặc trưng của nó được trích xuất thành khoảng hai chiều. Kết quả của phần trình bày của chương này được lấy từ nghiên cứu [CT3] trong danh mục công trình của tác giả.
Chương 4 trình bày mô hình phân loại dựa trên phương pháp Bayes và thuật toán di truyền cải tiến (BGA). Mô hình đề xuất có một số đóng góp như: Xác định xác suất tiên nghiệm, lựa chọn hàm mục tiêu và tối ưu sai số Bayes. Trong BGA, tập dữ liệu huấn luyện được lựa chọn một cách tự động cho mỗi lớp đối tượng để tối ưu hóa sai số. Ví dụ số thể hiện tiềm năng và thuận lợi của mô hình BGA trong khi so sánh với các mô hình khác. Ngoài ra, mô hình đề nghị còn được ứng dụng trong một số vấn đề còn rất nhiều thách thức hiện nay. Các ví dụ số và ứng dụng đã cho thấy tính hợp lý và những ưu điểm của mô hình đề nghị so với mô hình hiện có. Nghiên cứu này đã được chỉnh sửa để đăng trên tạp chí “Annals of Operations Research”.
Chương 5 là kết luận về tính mới của luận án và hướng phát triển cho các nghiên cứu trong tương lai.
2. Những kết quả mới của luận án
Luận án đã đạt được những kết quả sau đây:
Đề xuất tiêu chuẩn đánh giá cho sự tương tự của từng đối tượng như phần tử rời rạc, hàm mật độ xác suất và khoảng dữ liệu.
Xây dựng thuật toán xác định số chùm thích hợp cho các đối tượng khác nhau của bài toán phân tích chùm.
Phát triển thuật toán di truyền cho bài toán phân tích chùm mờ và không mờ cho phần tử rời rạc, dữ liệu khoảng và hàm mật độ xác suất.
Xây dựng mô hình mờ hóa chuỗi thời gian dựa vào thuật toán di truyền và bài toán phân tích chùm mờ.
Đề xuất phương pháp phân loại mới dựa vào thuật toán di truyền và phương pháp Bayes.
Đề xuất phương pháp trích xuất dữ liệu ảnh thành các đối tượng như khoảng, hàm mật độ, để từ đó áp dụng hiệu quả trong bài toán phân tích chùm và phân loại.
3. Các ứng dụng/ khả năng ứng dụng trong thực tiễn hay những vấn đề còn bỏ ngỏ cần tiếp tục nghiên cứu
Trong thời gian tới, chúng tôi sẽ tiếp tục nghiên cứu các vấn đề sau đây:
Phát triển thuật toán di truyền cho bài toán phân tích chùm đa mục tiêu.
Phát triển thuật toán di truyền trong phát hiện dữ liệu bất thường, trong xây dựng mô hình dự báo khoảng cho chuỗi thời gian.
Xem xét cải tiến và tối ưu các code được thiết lập nhằm giảm thời gian thực hiện cho các thuật toán.
So sánh hiệu quả phân loại của mô hình đề nghị với các thuật toán trí tuệ nhân tạo như kỹ thuật học sâu.
Ứng dụng những thuật toán phân tích chùm và phân loại đề nghị cho nhiều vấn đề thực tế, đặc biệt liên quan đến dữ liệu ảnh và dự báo.
Hãy là người bình luận đầu tiên