Select Page

Giải được bài toán bin-picking, SV OISP có bài báo được đăng tại ANZCC 2022

Công trình nghiên cứu khoa học này do Lý Phúc Thành, SV K2018 chương trình Chất lượng cao ngành Kỹ thuật Cơ điện tử thực hiện cùng các cộng sự.

Bài viết liên quan
35 đội thi trải nghiệm sàn đấu robot tại lễ phát động BK RoboCup 2022
BK RoboCup 2022: khoảnh khắc ngày training vòng loại
Sinh viên Bách khoa Quốc tế khởi nghiệp với công nghệ in 3D
Chế tạo robot đá banh, SV Bách Khoa đạt suất dự Hội nghị Cơ Điện tử Quốc tế

sv oisp lý phúc thành
Lý Phúc Thành (giữa, hàng dưới) nhận học bổng Panasonic 2021.

Vừa qua, bài nghiên cứu Structured-Light-Based 3D Scanning System for Industrial Manipulator in Bin Picking Application do Phúc Thành, PGS. TS. Nguyễn Quốc Chí – Trưởng Bộ môn Cơ Điện tử và nhóm cộng sự thực hiện đã được chọn đăng tại Hội nghị Điều khiển Úc và New Zealand (ANZCC) 2022 (sẽ diễn ra vào 24, 25/11/2022).

Song, đó chỉ là một mảnh ghép trong chuỗi thành tích ấn tượng của Phúc Thành. Trong quãng thời gian ngồi trên ghế nhà trường, chàng SV gen Z còn “xí” được những học bổng giá trị như KSYS-CUBE 2021, Panasonic 2021, SBA 2022 và gần đây nhất là đề cử Học bổng Khoa học công nghệ đào tạo thạc sỹ, tiến sỹ du học nước ngoài năm 2023 của Vingroup [1].

OISP đã có buổi chuyện trò với Phúc Thành về đề tài nghiên cứu mới thực hiện.

ỨNG DỤNG KHẢ THI VÀO SẢN XUẤT DƯỢC PHẨM VÀ PHÂN LOẠI NÔNG SẢN

* Chào Thành, em có thể giới thiệu sơ nét về đề tài nghiên cứu của mình không?

Nghiên cứu của nhóm em tích hợp hệ thống stereo camera [2] vào cánh tay robot công nghiệp nhằm phục vụ cho bài toán bin-picking [3]. Đây vốn là một bài toán khó vì nó đòi hỏi robot phải hiểu được môi trường làm việc và đưa ra được quyết định dựa trên những dữ kiện đó. Khi nhóm em tiến hành kết hợp hệ stereo camera với robot trong nghiên cứu lần này, robot sẽ biết được hình thù, biên dạng và khoảng cách của vật đến tay gắp robot.

Nhưng như vậy chưa đủ, phải làm sao để robot hiểu đâu là vật cần gắp và gắp ở vị trí nào của vật đó mới là vấn đề chính. Khi quét 3D toàn bộ thùng chứa, những vật mà ta quan tâm sẽ bị liên kết với nhau thành một cụm lớn, dữ liệu này robot không thể hiểu được vì nó không cho phép robot định vị được vị trí cần gắp. Do đó ta phải dùng đến phương pháp phân cụm thông thường là DBSCAN [4] và giải thuật lọc nhiễu RANSAC [5] để tách riêng lẻ những vật thể đó ra. Nhờ vậy mà đầu vào của hệ thống trở thành những vật thể rời rạc, tách rời và mang ý nghĩa không gian riêng biệt.

Vậy robot phải gắp ở đâu trên vật thể đó? Về tính logic, robot có thể sẽ gắp vật ở những vị trí không thuận lợi như vị trí có biên dạng cong, các đỉnh có diện tích tiếp xúc không lớn, không cho phép tay gắp bám được vật; hoặc ở đầu mút của vật có moment cao và dễ rơi; hoặc đơn thuần là yêu cầu đặc tính của vật thể chỉ cho phép robot gắp ở vị trí nhất định…

nghiên cứu sv oisp
Bản vẽ cánh tay robot quét 3D do Phúc Thành nghiên cứu và phát triển.
nghiên cứu sv oisp
Thực nghiệm định tính (a) và quét 3D thùng chứa vật (b).

Trong công nghiệp, đặc biệt là ngành sản xuất dược phẩm và phân loại nông sản, yêu cầu không gây thiệt hại đến thành phẩm được đặt ra rất cao. Vậy nên ta có thể dùng trí tuệ nhân tạo, mà cụ thể là áp dụng mô hình deep learning (học sâu) có tên là PointNet để phân đoạn những vị trí tiềm năng để gắp. Khi đó, đầu ra của mô hình deep learning là tập hợp những điểm tiềm năng cho thao tác gắp. Hệ thống chỉ cần tính toán trọng tâm hoặc trung vị tọa độ các điểm tiềm năng, rồi truyền lệnh đến robot để gắp.

Tuy phương pháp có vẻ trực quan nhưng từng bước trong hệ thống này yêu cầu độ chính xác hiệu chỉnh rất cao như hiệu chỉnh camera, hiệu chỉnh stereo, hiệu chỉnh robot-camera, ghép point-cloud… và cũng chính các sai số hiệu chỉnh này sẽ dẫn đến độ chính xác của toàn hệ thống. Nghiên cứu của nhóm em bao hàm từ bước thu thập dữ liệu đến huấn luyện mô hình và gắp vật.

* Từ đâu em nảy ra ý tưởng nghiên cứu này?

Ý tưởng nghiên cứu ban đầu của em chưa bao gồm bin-picking, mà chỉ đơn giản là tối ưu, tăng độ chính xác và mở rộng việc tái tạo 3D trên cơ sở nghiên cứu khoa học của thế hệ trước. Trong quá trình nghiên cứu, nhờ có sự góp ý của thầy Chí – giảng viên hướng dẫn luận văn của em và sự hỗ trợ nhiệt tình của các bạn tại phòng thí nghiệm, nhiều hướng đi dần mở ra, trong đó bin-picking đến với em đầu tiên, một phần vì đây là vấn đề hóc búa trong công nghiệp, đòi hỏi phải kết hợp các kiến thức về cơ khí – điện – điều khiển (robotics) và quan trọng không kém là trí tuệ nhân tạo (computer vision, deep learning).

Trong dây chuyền làm việc truyền thống có robot, đa số ứng dụng thuộc mảng pick-and-place (vị trí gắp vật và thả/ lắp) đều đã được người vận hành lập trình sẵn, nhưng tính ứng dụng của pick-and-place lại có nhiều hạn chế, đặc biệt là trong tình huống có yếu tố ngẫu nhiên (vật bị sắp xếp lộn xộn). Trong ứng dụng robot xếp hàng hóa, các vật trong thùng hàng phải được xếp đúng tiêu chuẩn và vị trí thì robot mới có thể hoàn thành tác vụ của mình. Vậy điều gì đảm bảo cho chúng được sắp xếp đúng? Đó chính là sự can thiệp của con người. Nhưng con người lại có nhiều nhược điểm: độ chính xác thấp, độ lặp không cao, yêu cầu nhiều nhân công cho dây chuyền lớn, khối lượng thấp, tần suất thấp… Dù vậy những khuyết điểm này có thể được khắc phục bằng các robot kết hợp trí tuệ nhân tạo với tốc độ, độ chính xác, khối lượng, tần suất… cao hơn đáng kể so với khả năng của con người.

nghiên cứu sv bách khoa quốc tế
Mô hình 3D sau khi qua RANSAC và DBSCAN.

nghiên cứu sv bách khoa quốc tế
Tập điểm gắp tiềm năng – graspable points (xanh dương).
Video thực nghiệm do Phúc Thành ghi nhận.

* Khả năng triển khai đại trà của nghiên cứu này ra sao?

Nghiên cứu này chỉ yêu cầu hệ camera stereo, một máy chiếu, một robot công nghiệp chuyên dụng, chương trình và huấn luyện mô hình là đủ để triển khai rộng rãi. Nếu nghiên cứu được mở rộng, nó có thể giúp ta tiến gần hơn lights-out manufacturing [6].

SẼ THEO ĐUỔI NGHIÊN CỨU ROBOT Y KHOA

* Trong quá trình nghiên cứu, những khó khăn gì đã cản lối và em vượt qua chúng bằng cách nào?

Khó khăn đầu tiên là do không có nền tảng về lập trình python nên em phải học đồng thời cả lập trình và thị giác máy tính. May nhờ có nền tảng tiếng Anh vững chắc (IELTS 8.0), em không vất vả lắm trong việc tìm tòi và tham khảo các tư liệu, bài báo nghiên cứu nước ngoài.

Mặt khác, do tính em quá cầu toàn nên mới bị chậm tiến độ trong giai đoạn đầu, buộc em phải học cách sắp xếp và đặt thứ tự ưu tiên cho các đầu việc. Dù vậy khối lượng công việc vẫn rất lớn, đặc biệt là trong giai đoạn nước rút, em phải “cắm trại” ở phòng thí nghiệm đến ba giờ sáng mỗi ngày để làm thực nghiệm đến khi cho ra kết quả. Bù lại, em cũng nhận được rất nhiều sự hỗ trợ từ các bạn tại phòng thí nghiệm – những người luôn sẵn lòng giúp đỡ khi em cần.

SV OISP ngành Cơ điện tử
Phúc Thành trình bày luận văn nghiên cứu tại Viện Nghiên cứu Dữ liệu lớn (Vingroup Big Data Institute – VinBigdata).

* Còn những thuận lợi thì sao?

Em nhận thấy OISP có cơ sở vật chất tốt, phòng thí nghiệm có nhiều thiết bị thực nghiệm đa dạng giúp em hoàn thành tốt bài nghiên cứu của mình. Các giảng viên, đặc biệt là thầy Chí đều là những người giàu kinh nghiệm và tận tình trong giảng dạy. Bạn học quanh em rất năng động và tài năng, tạo môi trường học hỏi và cạnh tranh lành mạnh để em phát huy những sở trường và khắc phục khiếm khuyết của mình.

* Hướng nghiên cứu trong tương lai của em là gì?

Em định vẫn tiếp tục thực hiện các đề tài liên quan đến roboticscomputer vision, cụ thể là medical robots hoặc soft robotics trong chương trình thạc sỹ.

Em cũng muốn tiếp tục học chương trình tiến sỹ để đóng góp kiến thức và kinh nghiệm của mình vào công cuộc xây dựng và phát triển nền khoa học công nghệ của Việt Nam trong tương lai.

Nhận xét của thầy Chí về Phúc Thành: “Về năng lực, Thành là một sinh viên có khả năng làm việc độc lập, tự định nghĩa và lên kế hoạch để giải quyết một vấn đề kỹ thuật nào đó. Về thái độ, Thành có động lực mạnh mẽ trong việc phát triển bản thân, có khát khao chinh phục những tri thức mới cũng như mục tiêu học tập và tham vọng làm việc lớn hơn so với bạn bè đồng trang lứa. Chính những điều này đã mang đến cho Thành những thành công rất đáng trân trọng. Bên cạnh đó, mình cũng đánh giá cao Thành ở tinh thần trách nhiệm và sự tôn trọng dành cho các bạn cùng nhóm nghiên cứu, ở lòng biết ơn và biết rõ trách nhiệm xã hội của mình sau này.”

Xem toàn văn bài báo Structured-Light-Based 3D Scanning System for Industrial Manipulator in Bin Picking Application tại đây.

INAKO thực hiện – Hình: LÝ PHÚC THÀNH


[1] Vingroup chấp thuận và cam kết tài trợ toàn bộ chi phí nếu SV được ĐH nước ngoài tiếp nhận, với điều kiện đó phải là những trường top 50, dẫn đầu trong các ngành khoa học công nghệ và kỹ thuật của thế giới.

[2] Stereo camera là hệ thống thị giác kinh điển gồm hai camera hoặc nhiều hơn, hoạt động gần giống như cách đôi mắt con người cảm nhận được độ sâu của vật thể trong không gian (ảnh 3D).

[3] Bin-picking là ứng dụng gắp vật được bố trí ngẫu nhiên trong thùng chứa, chủ yếu tập trung vào công nghệ robot và thị giác máy tính. Sự ra đời của thị giác máy tính và việc kết hợp với robot đã giúp mở ra những cơ hội tự động hóa mới.

[4] DBSCAN (density-based spatial clustering of applications with noise) là thuật toán phân cụm phổ biến trong học máy dùng để phân tách các bộ dữ liệu có liên quan đến đặc tính mật độ.

[5] RANSAC (random sample consensus) là phương pháp lặp dùng để ước tính các tham số của mô hình toán học từ một tập hợp dữ liệu có chứa các giá trị ngoại lai, khi các giá trị ngoại lai được cho là không ảnh hưởng đến giá trị của các ước lượng. Trong nghiên cứu này, nó đóng vai trò loại bỏ ngoại lai và loại bỏ dữ liệu 3D của thùng chứa.

[6] Lights-out manufacturing là kỹ thuật sử dụng công nghệ hoàn toàn tự động để vận hành một nhà máy sản xuất mà gần như không có sự can thiệp của con người.

Bài trước

Bài tiếp