Đang tải...
Ảnh hồ sơ

Xem mô tả

7

Xem & Tải

0

Tác giả/ Nhà nghiên cứu

PGS.TS. Lý Quốc Ngọc

Thống kê ấn phẩm đóng góp

Xem mô tả

1927

Xem & Tải

602

Thống kê nội dung

Quốc gia truy cập

Kết quả tìm kiếm ấn phẩm

Đang hiển thị 1 - 12 của tổng số 35 kết quả
Hiển thị
  • Ấn phẩm
    Phát hiện đối tượng ba chiều trong môi trường ngoài trời
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2025) Phạm, Thành; Lý, Quốc Ngọc
    Luận văn nghiên cứu và đề xuất một quy trình phát hiện đối tượng ba chiều dựa vào dữ liệu đa phương thức (ảnh RGB và đám mây điểm ba chiều Lidar). Quy trình này gồm 3 công đoạn chính: rút trích đặc trưng, phát sinh đặc trưng ứng viên, dự đoán hộp bao ba chiều và tên lớp. Luận văn đề xuất cải tiến ở công đoạn phát sinh đặc trưng ứng viên, tránh đề xuất sai và sót.
  • Ấn phẩm
    Tăng cường khả năng hiểu ảnh của hệ thống truy vấn ảnh
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2025) Phùng, Thái Thiên Trang; Lý, Quốc Ngọc; Fukuzawa, Masayuki
    Đề tài là một nghiên cứu nhằm cải thiện hiệu quả cho hệ thống truy vấn ảnh với các tiêu chí như chính xác, tiện dụng và thông minh hơn thông qua việc cải tiến một số công đoạn trong quy trình truy vấn ảnh như: (1) biểu diễn đặc trưng ảnh có tính ngữ nghĩa cao giúp tăng độ chính xác của hệ thống; (2) tích hợp hình ảnh và văn bản giúp người dùng thuận tiện khi truy vấn và giúp hệ thống thông minh hơn trong việc biểu diễn và xử lý các yêu cầu truy vấn; (3) phân cấp dữ liệu giúp tăng hiệu quả truy vấn và tăng hiệu năng cho hệ thống. Với các mục tiêu trên, luận án mong muốn đóng góp một phần công sức vào quá trình phát triển hệ thống truy vấn ảnh nhằm hỗ trợ cho các ứng dụng trong thực tế như công tác giám sát, an ninh và thương mại điện tử ngày càng tốt hơn.
  • Ấn phẩm
    OpenHuman: Hệ thống tổng hợp cử chỉ hội thoại dựa trên cảm xúc và ngữ nghĩa
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2024) Hoàng, Minh Thanh; Lý, Quốc Ngọc
    Cùng với sự bùng nổ của phần cứng, các mô hình ngôn ngữ lớn, sự bùng nổ của các hệ thống trí tuệ nhân tạo dựa trên văn bản như ChatGPT, CharacterAI, Gemini,.. và sự phát triển của đồ họa máy tính thì nút nghẽn cổ chai hiện nay để phát triển người kỹ thuật số (digital human) chính là khả năng tạo ra chuyển động của nhân vật tương ứng với văn bản hoặc giọng nói. Một trong những khó khăn trong quá trình sinh cử chỉ là dữ liệu cử chỉ không đủ nhiều và chất lượng, cũng như sự thiếu thông nhất về ngữ cảnh trong cử chỉ là một trong những khó khăn trong việc xây dựng các hệ thống. Trong các phương pháp hiện nay, mô hình diffusion đạt kết quả tốt nhất do có khả năng tổng quát hóa và phủ được ở những vùng thiếu cân xứng giữa các đặc trưng, và các vùng có mật độ dữ liệu thấp. Để có thể sinh cử chỉ tương ứng với giọng nói, và thông tin về cảm xúc cần học, luận văn sử dụng mô hình diffusion có điều kiện. Với điều kiện ở đây chính là cử chỉ khởi tạo, cảm xúc, giọng nói và văn bản tương ứng. Luận văn kế thừa từ mô hình DiffuseStyleGesture để xây dựng mô hình đề xuất OHGesture, trong luận văn giọng nói được chuyển thành văn bản, như một đặc trưng về ngữ nghĩa bổ sung trong quá trình học. Luận văn kế thừa mã nguồn Unity của mô hình DeepPhase để kết xuất, và trực quan hóa các chuyển động của nhân vật, cuối cùng các mã nguồn và mã nguồn chương trình được luận văn công khai để cộng đồng nghiên cứu về sinh cử chỉ tiếp tục phát triển các hệ thông sinh cử chỉ tối ưu hơn trong tương lai.
  • Ấn phẩm
    Phát hiện chất thải rắn sinh hoạt dựa trên mô hình học sâu
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2023) Lê, Minh Hưng; Lý, Quốc Ngọc
    Luận văn trình bày mô hình học sâu cũng như bộ dữ liệu để giải quyết bài toán phát hiện chất thải rắn sinh hoạt. Thực nghiệm mô hình DETR, mà thay mô hình cơ sở dùng mạng nơ-ron tích chập ResNet sang mô hình Pyramid Vision Transformer. Từ đó, loại bỏ hoàn toàn việc dùng mạng nơ-ron tích chập trong mô hình phát hiện chất thải rắn sinh hoạt của chúng tôi. Hơn nữa, kết hợp chuyển đổi hàm mất mát Cross Entropy sang dùng Focal Loss. Và bên cạnh đó, tổng hợp bộ dữ liệu mới bằng cách tổng hợp bộ dữ liệu TACO và Drinking Waste Classification, để có được bộ dữ liệu cho chất thải rắn sinh hoạt phong phú về chủng loại hơn. Mô hình DETR cùng với Pyramid Vision Transformer và Focal Loss được đánh giá thực nghiệm trên bộ dữ liệu mới này, và thu được kết quả cao hơn so với sử dụng mô hình DETR gốc.
  • Ấn phẩm
    Phát hiện hành vi bất thường của người
    (Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Nguyễn, Trường An; Lý, Quốc Ngọc
  • Ấn phẩm
    Giám sát và thống kê người dựa vào y phục
    (Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Nguyễn, Thanh Thi; Lý, Quốc Ngọc
  • Ấn phẩm
    Xây dựng hệ thống tái nhận dạng nhân vật thông minh
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Nguyễn, Quốc Thái; Lý, Quốc Ngọc
  • Ấn phẩm
    Giám sát và thống kê người dựa vào khuôn mặt
    (Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2022) Lê, Đức Toàn; Lý, Quốc Ngọc
  • Ấn phẩm
    Phát hiện tương tác người - đối tượng dựa vào mạng học sâu
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Lê, Thanh Ngọc; Lý, Quốc Ngọc
  • Ấn phẩm
    Xây dựng hệ thống thông minh làm giàu dữ liệu dựa vào mô hình tạo sinh dữ liệu đối kháng
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Lê, Minh Đường; Lý, Quốc Ngọc
  • Ấn phẩm
    Nhận dạng phông và kiểu chữ trên ảnh chụp màn hình của trang web
    (Trường Đại học Khoa học tự nhiên, ĐHQG-HCM, 2022) Phạm, Quốc Huy; Lý, Quốc Ngọc
  • Ấn phẩm
    Ước lượng mật độ và đếm số người trong cảnh đông người
    (Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, 2020) Thái, Thiện; Lý, Quốc Ngọc