Vừa nhập gia Bách khoa không lâu, Nguyễn Hồ Quang – SV K2020 chương trình Chất lượng cao ngành Khoa học Máy tính, đã xông xáo xin tham gia viết bài báo khoa học.
Có định hướng đi theo hướng nghiên cứu và sẽ học lên cao học (tiến sỹ – PhD) sau khi ra trường nên ngay khi đậu vào Khoa Khoa học & Kỹ thuật Máy tính của Trường ĐH Bách khoa, Nguyễn Hồ Quang đã chủ động chuẩn bị nền tảng cho mình từ sớm.
“Công trình đầu đời” mà Hồ Quang tham gia có chủ đề “BeCaked: An Explainable Artificial Intelligence Model for COVID-19 Forecasting” (BeCaked: Mô hình trí tuệ nhân tạo có khả năng tự giải thích để dự báo COVID-19). Đây là sản phẩm tập thể của nhóm sinh viên – giảng viên liên ngành, liên trường:
- Nguyễn Quang Đức – SV K2018 Khoa học Máy tính, Nguyễn Hồ Quang – SV K2020 chương trình Chất lượng cao ngành Khoa học Máy tính, cùng học Trường ĐH Bách khoa, ĐH Quốc gia TP.HCM
- Võ Quang Nghĩa – SV Khoa Y, ĐH Quốc gia TP.HCM
- PGS.TS. Quản Thành Thơ, TS. Nguyễn Tiến Thịnh, TS. Nguyễn An Khương – giảng viên Trường ĐH Bách khoa
- TS. Trần Ngọc Đăng – giảng viên ĐH Y Dược TP.HCM
Công trình nghiên cứu đã vinh dự được đăng tải trên Nature – trang web khoa học đa ngành uy tín hàng đầu thế giới (thuộc Nhà Xuất bản Nature).
BA ĐIỂM ĐẶC BIỆT CỦA CÔNG TRÌNH NGHIÊN CỨU
PGS.TS Quản Thành Thơ – Phó Trưởng Khoa Khoa học & Kỹ thuật Máy tính, cho biết nghiên cứu này có một số điểm đặc biệt.
Trước hết nó có sự đóng góp trí tuệ của nhiều cá nhân đến từ nhiều lĩnh vực ngành nghề khác nhau. “Để Khoa học Máy tính thực sự được ứng dụng vào các mặt của đời sống, rất cần sự tham gia của các chuyên gia của các lĩnh vực liên quan. Ví dụ như trường hợp ứng dụng vào lĩnh vực y tế, nhất thiết phải có sự kết nối và tương hỗ với các cá nhân có kiến thức chuyên môn ở mảng y khoa, nhằm kiểm chứng tính đúng đắn của hướng tiếp cận và kết quả thu được.
Thứ hai, công trình có sự tham gia của một SV năm thứ Nhất. “Khi tham gia vào nhóm nghiên cứu [2020], Nguyễn Hồ Quang giúp chuẩn bị thí nghiệm, lập trình các công cụ hỗ trợ và trực tiếp tham gia vào một số phần liên quan đến kiến thức nền tảng của bài báo. Quang có tinh thần định hướng và đam mê nghiên cứu, có tinh thần học hỏi và có tính chủ động cao. Tuy nhiên, do mới học tập ở giai đoạn đại cương (năm thứ Nhất), kiến thức chuyên môn chưa nhiều, nên em sẽ cần học tập nhiều hơn và nỗ lực nhiều hơn cho mục tiêu của mình” – TS. Thành Thơ chia sẻ.
Vị Phó Trưởng Khoa nhắn nhủ, việc tham gia nghiên cứu khoa học từ sớm sẽ giúp SV củng cố kiến thức, có tư duy tiếp cận và giải quyết vấn đề. “Nghiên cứu khoa học phù hợp với những ai có định hướng tiếp tục học thêm và đi theo con đường nghiên cứu khi ra trường, nhưng các bạn cần thời gian để thật sự thấm được điều này”.
Thứ ba, xuất phát điểm nghiên cứu đến từ một bài tập lớn trong môn học Mathematical Modeling (Mô hình hóa toán học) trong chương trình học năm thứ Hai của trưởng nhóm Nguyễn Quang Đức. Bài tập này yêu cầu SV nghiên cứu các môn hình học máy (machine learning) để giải hệ động lực học SIRD, thông qua đó dự báo tình hình dịch COVID-19. Đôi bạn Hồ Quang – Quang Đức đã “rủ rê” thêm một SV “ngoại đạo” đến từ Khoa Y – ĐH Quốc gia TP.HCM để cùng hoàn thành đề tài.
Sau khi phát triển thành mô hình dự báo có hệ suất tốt, nhóm nghiên cứu đã đem sản phẩm đi “chinh chiến” ở nhiều “đấu trường” khoa học kỹ thuật và gặt hái hàng loạt giải thưởng lớn nhỏ: Top 50 Dự án đổi mới sáng tạo ứng dụng trí tuệ nhân tạo TP.HCM 2020, giải Nhất lĩnh vực Công nghệ Sinh học – Y Sinh cuộc thi Sinh viên nghiên cứu khoa học Eureka 2020… Sau đó, nghiên cứu tiếp tục được nâng cấp và chuyển giao cho Sở Y tế TP.HCM trong giai đoạn dịch COVID-19 diễn biến phức tạp vào nửa cuối năm 2021 với độ chính xác đến 98%.
Được sự khích lệ và hướng dẫn từ các thầy, nhóm nghiên cứu SV hoàn thiện bài báo khoa học và vào tháng 4/2021, công trình đã được chấp nhận đăng trên Scientific Reports – tập san khoa học tự nhiên và y học được xếp loại Q1[1] (cũng thuộc Nhà Xuất bản Nature).
CƠ CHẾ VẬN HÀNH CỦA BECAKED
Nghiên cứu của hệ thống BeCaked được thực hiện bằng cách thu thập dữ liệu thực tế về tình hình dịch bệnh (số ca nhiễm mới, hồi phục, tử vong) được công bố công khai từ các nguồn đáng tin cậy. Từ đó, mô hình sẽ áp dụng các kỹ thuật AI tiên tiến dựa trên kỹ thuật học sâu (deep learning) để suy ra các thông số nội tại của dịch bệnh, chẳng hạn như tần số lây nhiễm trực tiếp và gián tiếp.
Ngoài ra, việc suy luận các thông số cũng khiến cho BeCaked có thể giúp các chuyên gia và nhà hoạch định chính sách giải thích được nguyên nhân của tình hình dịch bệnh và đưa ra các biện pháp ứng phó phù hợp.
Kết quả thí nghiệm với dữ liệu thật cho thấy BeCaked có độ chính xác rất cao, đặc biệt nếu so với các công trình tương tự được công bố trên thế giới. Hiện tại, các kết quả dự báo của BeCaked đang được triển khai tại trang web cse.hcmut.edu.vn/BeCaked.
Có được thành tựu này, theo PGS.TS. Quản Thành Thơ, đó còn là nhờ vào việc “các em không dừng việc nghiên cứu lại ở một thời điểm nào, mà luôn luôn cải tiến để nâng cao chất lượng công trình”.
THI CA thực hiện
[1] Q1: Nhóm các tạp chí có chỉ số trích dẫn (IF) thuộc top 25%