Đề tài nghiên cứu: Phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu dự trên độ đo LT-MHD
Chuyên ngành: Kỹ thuật viễn thông
Mã số chuyên ngành: 62.52.02.08
Họ và tên NCS: Đặng Nguyên Châu
Tập thể hướng dẫn: PGS. TS. Đỗ Hồng Tuấn
Cơ sở đào tạo: Trường Đại học Bách Khoa, Đại học Quốc gia Thành phố Hồ Chí Minh.
Mục tiêu của Luận án
Với sự phát triển của khoa học và công nghệ, các hệ thống xác thực dựa trên nhận dạng khuôn mặt đang ngày càng quan trọng. Trong nhiều ứng dụng thực tế, nhận dạng khuôn mặt trong điều kiện đơn mẫu (single sample per person - SSPP) là một bài toán mà các phương pháp nhận dạng khuôn mặt cần phải giải quyết. Nhận dạng khuôn mặt trong điều kiện đơn mẫu có thể được mô tả như sau: Cho một hệ thống có cơ sở dữ liệu chỉ chứa ảnh của mỗi người cần nhận dạng, mục tiêu của hệ thống là cần xác định danh tính của một người dựa vào ảnh chụp của người đó trong những thời gian khác nhau, trong các điều kiện khác nhau về ánh sáng và góc chụp. Đã có rất nhiều phương pháp nhận dạng khuôn mặt được đề xuất để giải quyết bài toán đơn mẫu. Các phương pháp này có thể được chia thành bốn nhóm chính: nhóm phương pháp dựa trên đặc trưng toàn cục, nhóm phương pháp dựa trên đặc trưng cục bộ, nhóm phương pháp tạo thêm ảnh ảo và nhóm phương pháp sử dụng thêm một tập dữ liệu chung. Các nghiên cứu đều chỉ ra rằng mỗi nhóm đều có những hạn chế riêng cần được khắc phục. Vì vậy một nghiên cứu nhằm khắc phục những hạn chế của một nhóm phương pháp là rất cần thiết.
Trong nhóm các phương pháp nhận dạng khuôn mặt dựa trên đặc trưng cục bộ, có một nhóm nhỏ hơn các phương pháp nhận dạng sử dụng đặc trưng cục bộ là các pixel cạnh của ảnh khuôn mặt và sử dụng khoảng cách Hausdorff trung bình để đo khoảng cách giữa hai tập hợp đặc trưng. Nhóm phương pháp này có ưu điểm là đơn giản và dễ triển khai trong thực tế. Tuy nhiên nhược điểm của nhóm phương pháp này là tỷ lệ nhận dạng chưa được tốt và có độ phức tạp tính toán rất cao. Nghiên cứu ở luận án này hướng đến mục tiêu là đưa ra giải pháp để giúp tăng tỷ lệ nhận dạng cũng như giảm độ phức tạp tính toán cho các phương pháp trong nhóm này.
Những đóng góp chính của Luận án
Trong nghiên cứu này, chúng tôi đã đề xuất một phép đo khoảng cách mới thay cho khoảng cách Hausdorff trung bình, đó là khoảng cách Least trimmed Modified Hausdorff distance – LT-MHD. Các kết quả mô phỏng cho thấy khoảng cách LT-MHD đã đề xuất rất hiệu quả trong việc đo sự khác nhau giữa hai tập hợp đặc trưng với các loại đặc trưng khác nhau của ảnh, như tập hợp pixel hay tập hợp các đường cạnh. Điều này cho thấy khoảng cách LT-MHD có thể thích hợp với nhiều phương pháp nhận dạng khác nhau.
Dựa trên khoảng cách LT-MHD, hai phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu đã được đề xuất, phương pháp LT-MMHD và phương pháp LT-LHD. Hai phương pháp LT-MMHD và LT-LHD lần lượt là các cải tiến của các phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu MMHD và LHD. Hai tập dữ liệu chuẩn là tập dữ liệu BERN và AR được sử dụng để đánh giá tỷ lệ nhận dạng của hai phương pháp LT-MMHD và LT-LHD trong các điều kiện khác nhau của ảnh khuôn mặt. Các kết quả mô phỏng của hai phương pháp LT-MMHD và LT-LHD đều cho thấy sự hiệu quả của việc dùng khoảng cách LT-MHD để đo sự khác nhau giữa hai tập hợp đặc trưng. Cụ thể, tùy theo từng điều kiện khác nhau của ảnh đầu vào, việc dùng khoảng cách LT-MHD để đo sự khác nhau giữa hai tập hợp đặc trưng mang đến sự cải thiện tỷ lệ nhận dạng khoảng 2-10% so với việc sự dụng khoảng cách Hausdorff trung bình truyền thống. Điều này cho thấy đây có thể là giải pháp cho các phương pháp nhận dạng khuôn mặt sử dụng khoảng cách Hausdorff trung bình khác để nâng cao tỷ lệ nhận dạng.
Ngoài ra, tỷ lệ nhận dạng của các phương pháp LT-MMHD và LT-LHD cũng được so sánh với một số phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu khác. Tập dữ liệu khuôn mặt chuẩn ORL được sử dụng để so sánh tỷ lệ nhận dạng của hai phương pháp LT-MMHD và LT-LHD và các phương pháp khác. Việc mô phỏng của các phương pháp được thực hiện theo cùng cách thức: Một ảnh ngẫu nhiên của mỗi người trong tập dữ liệu ORL được sử dụng để làm tập mẫu, các ảnh còn lại trong tập dữ liệu ORL được sử dụng để làm tập kiểm tra. Kết quả mô phỏng cho thấy hai phương pháp LT-MMHD và LT-LHD có tỷ lệ nhận dạng khá tốt khi so sánh với các phương pháp khác. Đặc biệt, phương pháp LT-LHD có tỷ lệ nhận dạng cao hơn khoảng 2-11% so với các phương pháp được đề xuất trong khoảng 5 năm gần đây.
Cùng với nâng cao tỷ lệ nhận dạng, nghiên cứu trong luận án cũng hướng đến việc giảm độ phức tạp tính toán cho các phương pháp LT-MMHD và LT-LHD. Để thực hiện việc giảm độ phức tạp tính toán cho các phương pháp LT-MMHD và LT-LHD, nghiên cứu đã thực hiện khảo sát một số các phương pháp trong lĩnh vực CAD/CAM/CAE nhằm làm giảm độ phức tạp phép tính khoảng cách Hausdorff. Qua phân tích các phương pháp này, nghiên cứu kết luận hai phương pháp EARLYBREAK và LSS là thích hợp nhất để áp dụng cho việc giảm độ phức tạp tính toán của các phương pháp nhận dạng khuôn mặt sử dụng khoảng cách Hausdorff nói chung. Trong nghiên cứu này, phương pháp EARLYBREAK được áp dụng để giảm độ phức tạp tính toán cho phương pháp LT-LHD và phương pháp LSS được áp dụng để giảm độ phức tạp tính toán cho phương pháp LT-MMHD. Các kết quả mô phỏng đã cho thấy rằng việc áp dụng phương pháp EARLYBREAK đã làm giảm độ phức tạp tính toán cũng như thời gian tính toán của phương pháp LT-LHD lần lượt là 67% và 66%. Tương tự, việc áp dụng phương pháp LSS cũng giúp làm giảm độ phức tạp tính toán và thời gian tính toán của phương pháp LT-MMHD lần lượt là 17% và 16%. Các kết quả mô phỏng này cũng phù hợp với các chứng minh toán học được thực hiện trong nghiên cứu. Các kết quả này cho thấy sự hiệu quả của việc áp dụng các phương pháp như EARLYBREAK hay LSS để làm giảm độ phức tạp của các phương pháp nhận dạng khuôn mặt dựa trên khoảng cách Hausdorff.
Với các kết quả thành công từ việc sử dụng khoảng cách LT-MHD để đo khoảng cách giữa các tập đặc trưng trong các phương pháp nhận dạng truyền thống, nghiên cứu này cũng tiếp tục mở rộng để có thể áp dụng khoảng cách LT-MHD cho các phương pháp học sâu. Trong nghiên cứu này, chúng tôi chỉ dừng lại ở việc đề xuất một mô hình trích đặc trưng ảnh khuôn mặt bằng cách sử dụng khoảng cách LT-MHD làm hàm mất mát cho một mô hình học sâu. Mô hình học sâu sử dụng khoảng cách LT-MHD làm hàm mất mát được huấn luyện với tập dữ liệu ORL. Các kết quả mô phỏng cho thấy việc sử dụng khoảng cách LT-MHD làm hàm mất mát cho mô hình học sâu thay cho hàm cross-entropy có thể đem đến sự cải thiện về tỷ lệ nhận dạng của mô hình khoảng 43%. Mô hình được huấn luyện với một tập dữ liệu hạn chế nên các kết quả vẫn chưa mang tính tổng quát. Tuy nhiên đây cũng là một kết quả triển vọng để làm tiền đề cho các nghiên cứu đang được chúng tôi tiếp tục thực hiện.
Hãy là người bình luận đầu tiên