Khoa học công nghệ

Sinh viên Trường ĐH Bách Khoa có bài báo đăng tạp chí hội nghị Xử lý ngôn ngữ tự nhiên lớn nhất thế giới

  • 28/08/2021
  • Hai sinh viên Nguyễn Thành Thông và Lữ Ngọc Thiên Trúc - cùng là sinh viên năm cuối khoa Khoa học và Kỹ thuật Máy tính - Trường ĐH Bách Khoa ĐHQG-HCM, đã có bài báo được chấp thuận tại hội nghị Empirical Methods in Natural Language Processing (EMNLP) 2021.

    Sinh viên Nguyễn Thành Thông và Lữ Ngọc Thiên Trúc.

    Bài báo mang tên “Enriching and Controlling Global Semantics for Text Summarization” (tạm dịch: “Làm giàu và Điều khiển ngữ nghĩa toàn cục để tóm tắt văn bản”). Nội dung bài báo hướng đến vấn đề tự động tóm tắt văn bản bằng trí tuệ nhân tạo (AI). Đây là công cụ hỗ trợ thiết thực cho những ai làm việc ở môi trường học thuật khi cần phải đọc và nắm bắt các thông tin chính yếu trong một lượng lớn tài liệu.

    “Hệ thống AI được đề xuất từ phương pháp của bài báo có thể tóm tắt một đoạn văn bản dài thành một nội dung cô đọng nhưng vẫn đầy đủ các thông tin chính yếu nhất” - Nguyễn Thành Thông chia sẻ về kết quả nghiên cứu.

    Nội dung bài báo này là một phần trong luận văn tốt nghiệp đại học của hai sinh viên, dưới sự hướng dẫn của PGS.TS Quản Thành Thơ - Phó trưởng khoa Khoa học và Kỹ thuật Máy tính và PGS.TS Lưu Anh Tuấn - Trường ĐH Công nghệ Nanyang (Singapore), cựu sinh viên Trường ĐH Bách Khoa ĐHQG-HCM.

    Theo PGS.TS Quản Thành Thơ, các thành tựu mới nhất trong lĩnh vực này thường dựa trên Transformer, một trong những mô hình học sâu tiên tiến nhất trong lĩnh vực Xử lý Ngôn ngữ Tự nhiên. Tuy nhiên các phương pháp hiện nay thường bị thiếu những từ khóa và thông tin quan trọng nhất khi tóm tắt các văn bản dài.

    “Hệ thống được đề cập trong bài báo của hai sinh viên Thông và Trúc sẽ tìm cách hệ thống hóa thông tin toàn cục của bài báo gốc trước khi tích hợp vào kết quả tóm tắt. Nhờ vậy, bản tóm tắt của nhóm được đánh giá là có đầy đủ thông tin nhất trong số các phương pháp tóm tắt văn bản tự động hiện nay” - PGS.TS Quản Thành Thơ nhận xét.

    Hội nghị EMNLP là một trong hai hội nghị lớn nhất thế giới về lĩnh vực Xử lý Ngôn ngữ Tự nhiên. Tạp chí của hội nghị được xếp hạng A1 do bảng xếp hạng hội nghị Qualis công nhận và xếp hạng A do bảng xếp hạng hội nghị ERA đánh giá, tức kết quả xếp loại cao nhất của hai bảng xếp hạng này. Đây là các bảng xếp hạng chuyên dùng đánh giá hội nghị, tương tự như bảng xếp hạng bằng chỉ số SJR của SCImago dành cho tạp chí.

    PHAN ANH