Đang tải...
Xem mô tả
48
Xem & Tải
0
Tác giả/ Nhà nghiên cứu
PGS.TS. Đinh Điền
Thống kê ấn phẩm đóng góp
Xem mô tả
3241
Xem & Tải
650
Thống kê nội dung
Quốc gia truy cập
Kết quả tìm kiếm ấn phẩm
- Ấn phẩmKhám phá mối quan hệ giữa các biến cố trong văn bản Lịch sử Việt Nam(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2025) Hoàng, Thủy Trúc; Đinh, Điền; Nguyễn, Hồng Bửu LongLuận văn nghiên cứu huấn luyện mô hình trích xuất tự động các biến cố (hay còn gọi là sự kiện) và dự đoán mối quan hệ giữa các sự kiện đó trong văn bản Lịch sử Việt Nam. Đầu tiên, nghiên cứu áp dụng các kỹ thuật gợi ý vào các mô hình ngôn ngữ lớn để xây dựng tập dữ liệu có nhãn cho các văn bản lịch sử. Sau đó nghiên cứu huấn luyện mô hình trích xuất sự kiện và mô hình trích xuất mối quan hệ giữa các sự kiện dựa trên tập dữ liệu đã gán nhãn. Nghiên cứu này đặt nền tảng cho các hệ thống trích xuất tự động thông tin sau này b ằng cách tự động trích xuất các sự kiện trong các văn bản lịch sử một cách trung thực và chính xác, sau đó tự động phân tích mối quan hệ giữa các sự kiện. Phạm vi nghiên cứu bao gồm tiền xử lý dữ liệu, thiết kế hệ thống phân loại sự kiện và mối quan hệ giữa các sự kiện, huấn luyện mô hình trích xuất sự kiện và mô hình trích xuất mối quan hệ giữa các sự kiện.
- Ấn phẩmSử dụng phương pháp dựa trên Metric Learning cho bài toán liên kết thực thể trong văn bản y khoa(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2025) Lê, Đình Ngọc; Đinh, ĐiềnLuận văn này cung cấp một giải pháp mới cho bài toán Liên kết thực thể, đồng thời giải quyết vấn đề mất cân bằng dữ liệu cho bài toán Liên kết thực thể, đặc biệt là dữ liệu trong lĩnh vực y khoa. Kết quả thực nghiệm trên hai bộ dữ liệu đánh giá là MedMention và BC5CDR đã chứng minh hiệu quả của phương pháp đề xuất của tác giả, cụ thể đem lại hiệu suất tương tự các phương pháp SOTA khác trong khi vượt trội hơn về tốc độ huấn luyện cũng như thực hiện truy vấn, cụ thể là gấp 3 đến 10 lần.
- Ấn phẩmKhai thác đặc trưng ngôn ngữ trong nhận dạng quang học văn bản Hán - Nôm(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2024) Nguyễn, Gia Phúc; Đinh, Điền; Nguyễn, Vinh TiệpTrong phạm vi luận văn này, tác giả áp dụng và đánh giá các mô hình học sâu trong việc phát hiện và nhận dạng văn bản Hán Nôm trên tập dữ liệu tự thu thập. Bên cạnh đó, chúng tôi cũng khai thác các đặc trưng của văn bản Hán Nôm nhằm cải thiện khả năng nhận dạng của mô hình. Luận văn cũng áp dụng các phương pháp tăng cường dữ liệu huấn luyện để giải quyết vấn đề gán nhãn thủ công tốn nhiều chi phí, từ đó giúp mô hình nhận dạng văn bản Hán Nôm hiệu quả hơn và rút ngắn thời gian gán nhãn cho dữ liệu huấn luyện mô hình. Qua đó, luận văn đóng góp bộ dữ liệu huấn luyện cho hai giai đoạn phát hiện và nhận dạng văn bản Hán Nôm.
- Ấn phẩmDịch nghĩa tự động thơ văn chữ Hán của Việt Nam sang tiếng Việt hiện đại(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2024) Thái, Hoàng Lâm; Đinh, ĐiềnLuận văn đã nghiên cứu các mô hình dịch nghĩa tự động thơ văn chữ Hán của Việt Nam sang tiếng Việt hiện đại với hướng tiếp cận tập trung vào dữ liệu. Đây là đề tài nghiên cứu đầu tiên về miền văn bản Hán văn Việt Nam nên cần xây dựng những bộ ngữ liệu song song cho cặp ngôn ngữ này. Luận văn đã xây dựng 2 bộ ngữ liệu song song thơ văn chữ Hán Việt Nam – tiếng Việt hiện đại ở thể loại văn vần và văn xuôi. Sau khi đã có những bộ ngữ liệu song song này, luận văn đã tiến hành huấn luyện các mô hình dịch nghĩa tự động bằng cách sử dụng 2 mô hình phổ biến là Dịch máy thống kê và mô hình Transformer mã hoá – giải mã làm các mô hình cơ sở đầu tiên. Tiếp đến, luận văn đã nghiên cứu các phương pháp tích hợp tri thức ngôn ngữ để tăng chất lượng ngữ liệu huấn luyện dẫn đến tăng chất lượng mô hình dịch nghĩa tự động. Các tri thức ngôn ngữ luận văn đã tích hợp bao gồm: hình thái (chuẩn hoá dị thể chữ Hán), ngữ âm Hán Việt, từ vựng Hán Việt, nhịp thơ (đối với văn vần), dấu câu (đối với văn xuôi) và tính tổng hợp của phong cách ngôn ngữ nghệ thuật. Luận văn thực hiện tích hợp trên thể loại văn vần trước, sau đó rút kinh nghiệm để chọn các tri thức ngôn ngữ phù hợp cho thể loại văn xuôi. Kết quả nghiên cứu cho thấy các phương pháp tiếp cận của luận văn hiệu quả khi mô hình dịch nghĩa thơ văn chữ Hán miền văn vần và văn xuôi đều cao hơn mô hình cơ sở, đồng thời cũng vượt qua các mô hình ngôn ngữ lớn như ChatGPT 4o và Gemini 1.5 pro.
- Ấn phẩmSử dụng chủ đề trong tóm tắt văn bản tiếng Việt(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2024) Diêu, Tiến Đạt; Đinh, ĐiềnLuận văn đã phát triển một mô hình tóm tắt văn bản theo chủ đề, được gọi là LDA-ViBERTSum, tích hợp mô hình chủ đề Latent Dirichlet Allo cation (LDA) vào mô hình ngôn ngữ tiên tiến như BERT và các biến thể của BERT. LDA-ViBERTSum đã chứng tỏ khả năng tạo ra các bản tóm tắt ngắn gọn và có liên quan đến nội dung chính của văn bản gốc, đặc biệt hiệu quả với các văn bản tiếng Việt. Kết quả thực nghiệm cho thấy LDA-ViBERTSum vượt trội hơn các mô hình khác khi được áp dụng trên tập dữ liệu chuẩn VNDS, với các chỉ số đánh giá chất lượng tóm tắt như ROUGE-1, ROUGE-2 và ROUGE-L đều đạt mức cao. Phương pháp kết hợp giữa LDA và BERT đã cải thiện đáng kể khả năng tóm tắt, giúp duy trì tính mạch lạc, giảm sự dư thừa thông tin và đảm bảo bản tóm tắt có nhận thức về chủ đề và liên quan đến ngữ cảnh của văn bản gốc.
- Ấn phẩmXây dựng mô hình tích hợp tri thứ ngôn ngữ trong dịch máy mạng neural Anh-Việt(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2023) Nguyễn, Hồng Bửu Long; Đinh, Điền
- Ấn phẩmTóm tắt văn bản tiếng việt sử dụng mạng học sâu(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2023) Nguyễn, Duy Hiếu; Đinh, Điền
- Ấn phẩmXây dựng mô hình đánh giá độ khó của văn bản tiếng Việt(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2023) Lương, An Vinh; Đinh, Điền
- Ấn phẩmƯớc lượng tương đồng xuyên ngữ Anh-Việt theo hướng tiếp cận học sâu(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Lê, Thị Thúy Hằng; Đinh, Điền
- Ấn phẩmMô hình dóng hàng cặp câu song ngữ Việt-Nhật dựa trên mạng nơ ron hồi quy(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Lê, Thanh Tùng; Đinh, Điền
- Ấn phẩmNhận dạng chữ Nôm sử dụng mô hình học sâu(Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Hồ, Tấn Lộc; Đinh, Điền; Trần, Thái Sơn
- Ấn phẩmTích hợp khối dịch tự động trong hệ hỗ trợ dịch trực tuyến(Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2021) Hoàng, Trung Chính; Đinh, Điền
- 1 (current)
- 2
- 3
- 4
- 5