Phân tích cảm xúc trên cơ sở trị cảm xúc chuyển dịch theo ngữ cảnh cho tiếng Việt
Abstract
Luận án nghiên cứu các đặc trưng ngôn ngữ của các hiện tượng dịch chuyển cảm xúc trong văn bản tiếng Việt, từ đó đề xuất các phương pháp nhằm cải thiện hiệu suất của bài toán phân lớp cảm xúc. Để phục vụ cho mục đích này, có hai mục tiêu mà nghiên cứu cần đạt được: Thứ nhất, xây dựng từ điển cảm xúc cho tiếng Việt để phục vụ phân tích cảm xúc. Điểm đặc biệt của từ điển này là các từ, cụm từ tiếng Việt được xác định giá trị cảm xúc dựa trên cơ sở kết hợp từ điển cảm xúc tiếng Anh SentiWordnet, phương pháp hồi quy và phương pháp tính toán hiệu quả do luận án đề xuất. Phương pháp đề xuất xác định giá trị cảm xúc cho các cụm từ dựa vào luật mờ, các đặc trưng ngôn ngữ, và các trường hợp gây dịch chuyển cảm xúc trong ngôn ngữ tiếng Việt. Mục tiêu này trả lời cho vấn đề nghiên cứu đầu tiên. Thứ hai, xây dựng, khai thác và phát triển phương pháp hướng đến ngữ nghĩa kết hợp với kỹ thuật học máy, và mô hình học sâu cho bài toán phân tích cảm xúc. Trong đó phương pháp hướng đến ngữ nghĩa được sử dụng để tính toán giá trị cảm xúc dựa trên các tình huống dịch chuyển cảm xúc do ngữ cảnh trong văn bản tiếng Việt. Tiếp cận học máy tận dụng sức mạnh của các mô hình tính toán, thống kê trong việc tìm ra các đặc trưng tốt nhất. Mô hình học sâu nhằm trích xuất tự động các đặc trưng trong dữ liệu ngôn ngữ. Việc khai thác và kết hợp những điểm mạnh của các phương pháp là chìa khóa để hệ thống có được kết quả chính xác hơn. Mục tiêu này giải quyết vấn đề nghiên cứu thứ hai.