Tin tức - Sự kiện

Các yếu tố ngôn ngữ ảnh hưởng đến độ khó của văn bản tiếng Việt (đối chiếu với tiếng Anh) - NCS. Nguyễn Thị Như Điệp

  • 11/11/2020
  • Tên đề tài: Các yếu tố ngôn ngữ ảnh hưởng đến độ khó của văn bản tiếng Việt (đối chiếu với tiếng Anh)
    Chuyên ngành: Ngôn ngữ học so sánh đối chiếu
    Mã số: 9222024
    Họ và tên nghiên cứu sinh: Nguyễn Thị Như Điệp
    Người hướng dẫn khoa học: PGS.TS. Đinh Điền
    Tên cơ sở đào tạo: Trường Đại học KHXH&NV – ĐHQG-HCM
    - Tóm tắt nội dung luận án (abstract) 
    Dựa trên nền tảng nghiên cứu về độ khó của văn bản (ĐKVB) tiếng Anh; các yếu tố ngôn ngữ (YTNN) liên quan đến ĐKVB; việc khảo sát bộ ngữ liệu 555 văn bản (VB) được tổng hợp từ sách giáo khoa bậc tiểu học, trung học cơ sở, trung học phổ thông, một số VB tiếng Việt và tiếng Anh từ sách báo; đồng thời kết hợp với kết quả ngữ liệu của các nghiên cứu, các công cụ hỗ trợ tự động, luận án đi sâu tìm hiểu và xác định các YTNN có ảnh hưởng đến ĐKVB tiếng Việt (đối chiếu với tiếng Anh) ở ba cấp độ Từ, Câu và Văn bản. Kết quả luận án bước đầu có thể được ứng dụng vào việc phân loại ĐKVB tiếng Việt và là cơ sở trợ giúp ngành tin học xây dựng công cụ đo ĐKVB tiếng Việt.   
    - Những kết quả của luận án
    1. Ở cấp độ từ, luận án xác định được tần suất từ là YTNN có ảnh hưởng lớn nhất đối với ĐKVB trong cả tiếng Việt và tiếng Anh; khác biệt liên quan đến yếu tố độ dài trung bình của từ tính bằng chữ và độ dài trung bình của từ tính bằng ký tự chỉ ảnh hướng đến ĐKVB tiếng Anh; ngược lại, yếu tố từ Hán-Việt lại chỉ ảnh hưởng đến ĐKVB tiếng Việt; và trường từ vựng tuy có ảnh hưởng đến ĐKVB của cả hai ngôn ngữ nhưng cùng một chủ đề trong mỗi ngôn ngữ số lượng từ phổ biến dựa vào tần suất từ chắc chắn sẽ khác nhau. Luận án đã trích xuất danh sách 3000 từ cơ bản nhất trong ngữ liệu từ sách giáo khoa (SGK) Tiếng Việt bậc tiểu học, SGK Ngữ văn bậc trung học cơ sở và trung học phổ thông để bước đầu có thể sử dụng cho việc đánh giá ĐKVB tiếng Việt.
    2. Ở cấp độ câu, luận án xác định yếu tố trung bình số lượng từ trong một câu là YTNN bề mặt quan trọng nhất để đánh giá ĐKVB tiếng Việt; độ sâu của cây cú pháp là YTNN bề sâu có ảnh hưởng lớn nhất đối với ĐKVB trong cả tiếng Việt và tiếng Anh; yếu tố từ loại, trật tự từ và câu nhập nhằng cũng là YTNN ảnh hưởng đến ĐKVB.
    3. Ở cấp độ văn bản, luận án xác định được tổng số câu trong văn bản, yếu tố kết từ, sở chỉ, phép nối, phép lặp, phép thế, thể loại văn bản, kiểu văn bản và văn cảnh là các YTNN ảnh hưởng đến ĐKVB. 
    4. Với mục đích và nhiệm vụ đề ra, luận án xác định được 31 YTNN, bao gồm 16 YTNN bề mặt và 15 YTNN bề sâu ảnh hưởng đến ĐKVB tiếng Việt, có đối chiếu với tiếng Anh. Trong đó, toàn bộ các YTNN bề mặt và phần lớn các YTNN bề sâu được khảo sát, xem xét, phân tích và xác định theo hướng định lượng trên ba cấp độ: Từ – Câu – Văn bản, để ta có thể chọn lọc, phân loại ĐKVB ở một cấp độ đọc cụ thể bằng các con số cụ thể, phần nhỏ còn lại là theo hướng định tính. 5. Trong 31 YTNN được xác định là có ảnh hưởng đến ĐKVB tiếng Việt, luận án xác định được 6 YTNN, cụ thể hơn là 3 YTNN bề mặt và 3 YTNN bề sâu có mức độ ảnh hưởng cao nhất đối với ĐKVB tiếng Việt như sau: (i) yếu tố trung bình số lượng từ trong VB; (ii) yếu tố trung bình số lượng câu trong VB; (iii) yếu tố số lượng kết từ trong VB; (iv) yếu tố tần suất từ; (v) yếu tố độ sâu của cây cú pháp; và (vi) yếu tố lặp thực từ. 
    - Các ứng dụng/ khả năng ứng dụng trong thực tiễn hoặc những vấn đề còn bỏ ngỏ cần tiếp tục nghiên cứu:
    1. Kết quả của luận án có thể trợ giúp người soạn thảo văn bản, các nhà biên soạn và cải tiến sách, báo, giáo trình làm việc hiệu quả, tiết kiệm thời gian và công sức. Đồng thời, việc xác định được các YTNN ảnh hưởng đến ĐKVB tiếng Việt cũng sẽ được ứng dụng trong nhiều lĩnh vực khác nhau của xã hội như: biên soạn sách giáo khoa, chọn lọc VB tương ứng với cấp độ đọc, giảng dạy tiếng Việt theo khung năng lực 6 bậc, xây dựng chương trình dạy học tiếng Việt, chương đào tạo, bồi dưỡng có sử dụng tiếng Việt, truyền đạt thông tin hiệu quả trong kỹ thuật, chăm sóc y tế, kinh doanh, xuất bản, huấn luyện, tuyển dụng, du lịch, quảng cáo, dịch vụ, báo chí, pháp luật, bảo hiểm, ngành công nghiệp, nông nghiệp và cả quân đội, nhằm đáp ứng nhu cầu thực tiễn của người sử dụng tiếng Việt tại Việt Nam cũng như các nước khác trên thế giới.
    2. Trên phương diện liên ngành, kết quả luận án góp phần đưa ra các tiêu chí để đánh giá ĐKVB, đây là cơ sở lý thuyết trợ giúp việc mô hình hóa các công cụ đo ĐKVB tiếng Việt tự động bên tin học.
    3. Nghiên cứu ĐKVB tiếng Việt còn rất ít và nghèo tài nguyên nên kết quả của luận án là những bước đầu khảo sát và đưa ra một cơ sở lý thuyết cho việc đo độ khó văn bản cho tiếng Việt; hy vọng rằng kết quả luận án hy vọng sẽ mở ra những hướng nghiên cứu mới về ĐKVB tiếng Việt trong tương lai, chẳng hạn xác định thêm về các YTNN, đặc biệt là các YTNN nằm ẩn bên trong VB; nghiên cứu định tính chuyên sâu về ĐKVB với ngữ liệu lớn hơn; hoặc so sánh đối chiếu ĐKVB tiếng Việt với nhiều ngôn ngữ khác.  
     

    Tệp đính kèm:

    Vui lòng nhập nội dung
    Vui lòng nhập mã xác nhận

    Hãy là người bình luận đầu tiên