Đang tải...
Xem mô tả
7
Xem & Tải
0
Tác giả/ Nhà nghiên cứu
PGS.TS. Lý Quốc Ngọc
Thống kê ấn phẩm đóng góp
Xem mô tả
1927
Xem & Tải
602
Thống kê nội dung
Quốc gia truy cập
Kết quả tìm kiếm ấn phẩm
- Ấn phẩmPhát hiện đối tượng ba chiều trong môi trường ngoài trời(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2025) Phạm, Thành; Lý, Quốc NgọcLuận văn nghiên cứu và đề xuất một quy trình phát hiện đối tượng ba chiều dựa vào dữ liệu đa phương thức (ảnh RGB và đám mây điểm ba chiều Lidar). Quy trình này gồm 3 công đoạn chính: rút trích đặc trưng, phát sinh đặc trưng ứng viên, dự đoán hộp bao ba chiều và tên lớp. Luận văn đề xuất cải tiến ở công đoạn phát sinh đặc trưng ứng viên, tránh đề xuất sai và sót.
- Ấn phẩmTăng cường khả năng hiểu ảnh của hệ thống truy vấn ảnh(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2025) Phùng, Thái Thiên Trang; Lý, Quốc Ngọc; Fukuzawa, MasayukiĐề tài là một nghiên cứu nhằm cải thiện hiệu quả cho hệ thống truy vấn ảnh với các tiêu chí như chính xác, tiện dụng và thông minh hơn thông qua việc cải tiến một số công đoạn trong quy trình truy vấn ảnh như: (1) biểu diễn đặc trưng ảnh có tính ngữ nghĩa cao giúp tăng độ chính xác của hệ thống; (2) tích hợp hình ảnh và văn bản giúp người dùng thuận tiện khi truy vấn và giúp hệ thống thông minh hơn trong việc biểu diễn và xử lý các yêu cầu truy vấn; (3) phân cấp dữ liệu giúp tăng hiệu quả truy vấn và tăng hiệu năng cho hệ thống. Với các mục tiêu trên, luận án mong muốn đóng góp một phần công sức vào quá trình phát triển hệ thống truy vấn ảnh nhằm hỗ trợ cho các ứng dụng trong thực tế như công tác giám sát, an ninh và thương mại điện tử ngày càng tốt hơn.
- Ấn phẩmOpenHuman: Hệ thống tổng hợp cử chỉ hội thoại dựa trên cảm xúc và ngữ nghĩa(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2024) Hoàng, Minh Thanh; Lý, Quốc NgọcCùng với sự bùng nổ của phần cứng, các mô hình ngôn ngữ lớn, sự bùng nổ của các hệ thống trí tuệ nhân tạo dựa trên văn bản như ChatGPT, CharacterAI, Gemini,.. và sự phát triển của đồ họa máy tính thì nút nghẽn cổ chai hiện nay để phát triển người kỹ thuật số (digital human) chính là khả năng tạo ra chuyển động của nhân vật tương ứng với văn bản hoặc giọng nói. Một trong những khó khăn trong quá trình sinh cử chỉ là dữ liệu cử chỉ không đủ nhiều và chất lượng, cũng như sự thiếu thông nhất về ngữ cảnh trong cử chỉ là một trong những khó khăn trong việc xây dựng các hệ thống. Trong các phương pháp hiện nay, mô hình diffusion đạt kết quả tốt nhất do có khả năng tổng quát hóa và phủ được ở những vùng thiếu cân xứng giữa các đặc trưng, và các vùng có mật độ dữ liệu thấp. Để có thể sinh cử chỉ tương ứng với giọng nói, và thông tin về cảm xúc cần học, luận văn sử dụng mô hình diffusion có điều kiện. Với điều kiện ở đây chính là cử chỉ khởi tạo, cảm xúc, giọng nói và văn bản tương ứng. Luận văn kế thừa từ mô hình DiffuseStyleGesture để xây dựng mô hình đề xuất OHGesture, trong luận văn giọng nói được chuyển thành văn bản, như một đặc trưng về ngữ nghĩa bổ sung trong quá trình học. Luận văn kế thừa mã nguồn Unity của mô hình DeepPhase để kết xuất, và trực quan hóa các chuyển động của nhân vật, cuối cùng các mã nguồn và mã nguồn chương trình được luận văn công khai để cộng đồng nghiên cứu về sinh cử chỉ tiếp tục phát triển các hệ thông sinh cử chỉ tối ưu hơn trong tương lai.
- Ấn phẩmPhát hiện chất thải rắn sinh hoạt dựa trên mô hình học sâu(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2023) Lê, Minh Hưng; Lý, Quốc NgọcLuận văn trình bày mô hình học sâu cũng như bộ dữ liệu để giải quyết bài toán phát hiện chất thải rắn sinh hoạt. Thực nghiệm mô hình DETR, mà thay mô hình cơ sở dùng mạng nơ-ron tích chập ResNet sang mô hình Pyramid Vision Transformer. Từ đó, loại bỏ hoàn toàn việc dùng mạng nơ-ron tích chập trong mô hình phát hiện chất thải rắn sinh hoạt của chúng tôi. Hơn nữa, kết hợp chuyển đổi hàm mất mát Cross Entropy sang dùng Focal Loss. Và bên cạnh đó, tổng hợp bộ dữ liệu mới bằng cách tổng hợp bộ dữ liệu TACO và Drinking Waste Classification, để có được bộ dữ liệu cho chất thải rắn sinh hoạt phong phú về chủng loại hơn. Mô hình DETR cùng với Pyramid Vision Transformer và Focal Loss được đánh giá thực nghiệm trên bộ dữ liệu mới này, và thu được kết quả cao hơn so với sử dụng mô hình DETR gốc.
- Ấn phẩmPhát hiện hành vi bất thường của người(Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Nguyễn, Trường An; Lý, Quốc Ngọc
- Ấn phẩmGiám sát và thống kê người dựa vào y phục(Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Nguyễn, Thanh Thi; Lý, Quốc Ngọc
- Ấn phẩmXây dựng hệ thống tái nhận dạng nhân vật thông minh(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Nguyễn, Quốc Thái; Lý, Quốc Ngọc
- Ấn phẩmGiám sát và thống kê người dựa vào khuôn mặt(Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Lê, Đức Toàn; Lý, Quốc Ngọc
- Ấn phẩmPhát hiện tương tác người - đối tượng dựa vào mạng học sâu(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Lê, Thanh Ngọc; Lý, Quốc Ngọc
- Ấn phẩmXây dựng hệ thống thông minh làm giàu dữ liệu dựa vào mô hình tạo sinh dữ liệu đối kháng(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Lê, Minh Đường; Lý, Quốc Ngọc
- Ấn phẩmNhận dạng phông và kiểu chữ trên ảnh chụp màn hình của trang web(Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Phạm, Quốc Huy; Lý, Quốc Ngọc
- Ấn phẩmƯớc lượng mật độ và đếm số người trong cảnh đông người(Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2020) Thái, Thiện; Lý, Quốc Ngọc