Nghiên cứu phương pháp nhận diện vật thể 3D: SV OISP được duyệt đăng bài báo quốc tế

Mới đây, bài báo “GAC3D: Improving monocular 3D object detection with ground-guide model and adaptive convolution” của bạn Ngô Đức Tuấn (sinh viên K2017 chương trình Chất lượng cao ngành Kỹ thuật Máy tính) và bạn Bùi Việt Minh Quân (sinh viên K2017 chương trình Tài năng ngành Khoa học Máy tính) đã được tạp chí PeerJ Computer Science (*) chấp nhận.

Suốt bốn năm đại học, Đức Tuấn luôn là chàng trai nổi bật của Khoa Khoa học Máy tính với hàng loạt thành tích siêu “khủng” như: học bổng khuyến khích học tập OISP 7 học kỳ, danh hiệu Sinh viên OISP xuất sắc năm 2017-2018, 2018-2019, 2019-2020, giải Ba vòng chung kết cuộc thi Cuộc đua số năm 2020, giải Nhất Hội nghị Nghiên cứu khoa học sinh viên OISP lần VI, giải Nhì Hội nghị Nghiên cứu khoa học sinh viên OISP lần VIII, học bổng Honda Award 2020

Nào, cùng OISP phỏng vấn nhanh anh chàng “học bá” này nhé!

* Chào Đức Tuấn. Chúc mừng bài báo khoa học của nhóm bạn đã được tạp chí PeerJ Computer Science chấp thuận. Hãy chia sẻ một chút về đề tài đặc biệt này!

Hiện nay, trong lĩnh vực xe tự lái và robotics, việc nhận diện vật thể không gian ba chiều (vị trí, kích thước và hướng di chuyển của vật) trở nên vô cùng cần thiết. Các ô tô hiện đại luôn được trang bị camera. Do đó, nhóm bạn đã tận dụng hình ảnh thu được từ các thiết bị này để phát triển hệ thống nhận diện vật thể không gian 3D, cụ thể là nhận diện những phương tiện giao thông phổ biến như: ô tô, xe máy và người đi bộ.

Với bài báo “GAC3D: Improving monocular 3D object detection with ground-guide model and adaptive convolution” (tạm dịch “GAC3D: Cải tiến phương pháp nhận diện vật thể 3D trên ảnh đơn bằng mô hình ‘ground-guide’ và phép tích chập ‘adaptive’”), nhóm mình đề xuất phép tích chập mới mang tên “adaptive convolution” thay thế phép tích chập thông thường trong mô hình học sâu. 

Bên cạnh đó, tụi mình còn sử dụng một số ràng buộc về hình học trong phép biến đổi từ ảnh sang không gian 3D để cải thiện độ chính xác của thuật toán. Hệ thống này cũng được tích hợp trên thiết bị nhúng (mạch Jetson), có thể nhận diện trong thời gian thực và mang tính ứng dụng cao đối với lĩnh vực xe tự lái.

* Ý tưởng nghiên cứu bắt nguồn từ đâu? Cơ duyên nào đã kết nối bạn với bạn Bùi Việt Minh Quân trong dự án này?

Tụi mình có cơ hội tiếp cận lĩnh vực xe tự hành (autonomous driving) khi cùng nhau tham gia cuộc thi Cuộc đua số năm 2020 do tập đoàn FPT tổ chức. Hai đứa nhận thấy một trong những thách thức của xe tự lái là phát hiện vật cản (object detection), đặc biệt là người đi bộ qua đường. 

Đây là một đề tài vô cùng thú vị và đang nhận được sự quan tâm sâu sắc từ giới học thuật cũng như các công ty phát triển xe tự hành. Vì vậy, tụi em quyết định tìm hiểu và lựa chọn đề tài này làm luận văn tốt nghiệp. Mình và Quân là bạn học từ thời cấp Ba. Tụi mình đã cùng nhau tham gia nhiều cuộc thi nghiên cứu từ thời trung học. Do đó, hai đứa làm việc khá ăn ý.

Bạn Ngô Đức Tuấn (thứ ba từ trái qua) và bạn Bùi Việt Minh Quân (thứ hai từ trái qua) cùng đồng đội giành được giải Ba cuộc thi Cuộc đua số năm 2020.

* Trong quá trình nghiên cứu, nhóm bạn đã gặp phải những khó khăn nào?

Ban đầu, tụi mình gặp khá nhiều khó khăn vì vừa tìm hiểu kiến thức nền tảng vừa bao quát ý tưởng từ những bài báo mới. Trong ngành khoa học máy tính nói chung và trí tuệ nhân tạo nói riêng, công nghệ thay đổi hàng ngày. Điều này đòi hỏi tụi em phải cập nhật kiến thức mới liên tục nhằm nắm bắt xu hướng và tìm ra nhiều giải pháp, cải tiến mới.

* Đâu là bí quyết giúp nhóm bạn làm việc nhóm hiệu quả trong tình hình dịch bệnh phức tạp?

Giữa bối cảnh dịch bệnh diễn biến khó lường, yếu tố quan trọng hàng đầu chính là kỹ năng phối hợp, phân công nhiệm vụ cho từng cá nhân. Đối với việc cập nhật kiến thức, tụi mình chia ra tìm hiểu các bài báo mới, sau đó chia sẻ lại với nhau. 

Để làm việc nhóm tốt, chúng ta cần những kênh giao tiếp hiệu quả và phù hợp. Mình và Quân thường xuyên trao đổi về những ý tưởng đang có cùng các đầu việc phải hoàn thành trong ngày. Đồng thời, mỗi tuần, tụi mình cũng họp bàn với hai thầy hướng dẫn (thầy Nguyễn Đức Dũng và thầy Phạm Hoàng Anh), từ đó cùng nhau tháo gỡ vướng mắc và đảm bảo quá trình nghiên cứu diễn ra đúng hướng.

Điều cuối cùng nhưng cũng không kém phần quan trọng: Nghiên cứu là một quá trình dài, đòi hỏi rất nhiều lòng kiên trì. Người làm nghiên cứu cần tìm cách cân bằng cuộc sống. Vì vậy, tụi em thường chơi game thư giãn vào mỗi buổi tối để duy trì tinh thần thoải mái sau những giờ làm việc chăm chỉ.

* Thầy Nguyễn Đức Dũng và thầy Phạm Hoàng Anh đã hỗ trợ hai bạn như thế nào suốt thời gian vừa qua?

Trong hai học kỳ thực hiện nghiên cứu (học kỳ 201-202), thầy Dũng và thầy Anh luôn theo sát tình hình của nhóm, đồng thời tạo mọi điều kiện thuận lợi về cơ sở vật chất như phòng ốc và các trang thiết bị chạy mô hình thử nghiệm. 

Khi nhóm bị bế tắc về mặt ý tưởng cải tiến hay lúc thử nghiệm cho ra kết quả không như mong đợi, hai thầy luôn động viên tinh thần và gợi mở cho tụi mình một số hướng tiếp cận khác. Không chỉ dừng lại ở đó, khi nhóm bước đầu thu được kết quả thử nghiệm khả quan, các thầy đã tận tình hướng dẫn tụi mình hoàn thiện nội dung bài báo để gửi cho tạp chí.

* Bật mí một chút về dự định tương lai của bạn nào! Được biết, sau khi bảo vệ thành công luận văn tốt nghiệp, bạn đã “đầu quân” vào VinAI Research. Với quyết định này, bạn mong muốn đóng góp điều gì cho ngành khoa học máy tính nói chung và trí tuệ nhân tạo nói riêng?

Trong tương lai, mình dự định học lên bậc tiến sỹ để tiếp tục theo đuổi đam mê nghiên cứu khoa học máy tính.

Hiện tại, mình vừa được nhận vào chương trình Residency của VinAI Research (một đơn vị nghiên cứu chuyên sâu về trí tuệ nhân tạo ở Việt Nam). Mỗi ngày mới là một trải nghiệm thú vị khi mình được làm việc trong môi trường nghiên cứu chuyên nghiệp, tích lũy nhiều kiến thức hay, học hỏi kinh nghiệm từ các mentor và cộng tác với những chuyên gia trí tuệ nhân tạo hàng đầu trong quá trình nghiên cứu. 

Hy vọng rằng những nghiên cứu của mình sẽ đóng góp một phần vào sự phát triển của ngành khoa học máy tính nói chung và trí tuệ nhân tạo nói riêng, từ đó tạo ra nhiều sản phẩm hữu ích, thiết thực, giúp cuộc sống thêm tiện nghi và tốt đẹp hơn.

(*) PeerJ Computer Science là tạp chí khoa học bình duyệt, truy cập mở về chuyên ngành Khoa học Máy tính. Tạp chí được xếp hạng SCIE-Q1 từ năm 2017 đến nay.

Các tạp chí quốc tế uy tín được quy định khác nhau và cụ thể trong hai lĩnh vực khoa học tự nhiên – kỹ thuật và khoa học xã hội. Những tạp chí thuộc một ngành/ lĩnh vực trong danh mục WoS (hay Scopus) sẽ được xếp hạng theo chỉ số IF (CiteScore) từ cao xuống thấp và tương ứng với bốn hạng sau:

  • Q1: Các tạp chí có IF (hay CiteScore) thuộc top 25%.
  • Q2: Các tạp chí có IF (hay CiteScore) thuộc nhóm 25-50%.
  • Q3: Các tạp chí có IF (hay CiteScore) thuộc nhóm 50-75%.
  • Q4: Các tạp chí có IF (hay CiteScore) thuộc nhóm 75-100%.
Với đề tài “GAC3D: Improving monocular 3D object detection with ground-guide model and adaptive convolution”, Đức Tuấn và Minh Quân đã phát triển một giải pháp mới nhằm cải tiến khả năng phát hiện các đối tượng khác nhau của xe tự hành trong không gian 3D, thông qua hình chụp từ camera thông thường. Trước nay, tuy giải pháp sử dụng công nghệ LiDAR có thể mang đến kết quả có độ chính xác cao nhưng chi phí triển khai rất lớn và thiếu tính thực tiễn.

Trong khi đó, giải pháp tận dụng camera thông thường để nhận diện vật thể trong không gian sở hữu ưu điểm là chi phí lắp đặt camera và hệ thống tính toán tương đối thấp. Do đó, nhóm hy vọng sẽ triển khai trong các hệ thống thực sớm trong thời gian tới, từ đó đóng góp vào những nghiên cứu của cộng đồng. Hơn nữa, nhóm còn thử nghiệm hệ thống trên thiết bị nhúng. Điều này mở ra tiềm năng ứng dụng giải pháp phát hiện thời gian thực với độ chính xác cao, từ đó hỗ trợ hệ thống quan sát của robot và xe tự hành.

Tiến sỹ Nguyễn Đức Dũng (giảng viên hướng dẫn chuyên môn của dự án) nhận xét: “Trong quá trình nghiên cứu, Tuấn và Quân đã phối hợp với nhau rất tốt. Dù theo học hai chương trình đào tạo khác nhau, thậm chí theo đuổi hai phân ngành khác nhau, nhưng hai bạn vẫn hợp tác ăn ý và chia sẻ công việc vô cùng khoa học. Bên cạnh thái độ làm việc chuyên nghiệp, nhóm cũng luôn chủ động trao đổi và thảo luận với các thầy. Tuấn và Quân là hai sinh viên có kỹ năng cực kỳ tốt và không ngừng hoàn thiện bản thân. Thành quả ý nghĩa này là kết quả tất yếu của quá trình phấn đấu lâu dài, từ khi các bạn tham gia cuộc thi Cuộc đua số đến lúc nghiên cứu khoa học, viết báo và hoàn thành luận văn”.

Bài: XUÂN MAI – Hình: Nhân vật cung cấp

Bài trước

Bài tiếp