본문 바로가기

프로젝트

공모전 회고록 (1) - CJ대한통운 미래기술 챌린지 2023

공모전이 끝난지는 시간이 많이 흘렀지만.. 내가 어떻게 생각하고, 구현하고, 검증하고, 실제 결과는 어떻게 나왔는지 회고해보려고 한다.

CJ대한통운 미래기술 챌린지 2023 회고록

1. 공모전 참여 동기

6월의 어느 날, 학과 건물 복도를 걷던 중, 공모전 포스터를 보게 되었고, 간단해 보이는 주제와, 대기업 공모전에 걸맞는 상금을 보고, 홀린듯이 팀을 짜서 신청서를 썼다.

 

2. 주제 선택 동기

우리 팀이 선택한 주제는, "스마트폰을 활용한 박스 체적 측정" 이였다.

 

박스 사진을 촬영하면, 박스의 가로,세로,높이를 측정해 UI에 나타내주는 어플을 만드는것이 주제였다.

 

선택한 이유는, 다른 과제들에 비해 주제가 간단해 보였고, 실제로 조사를 해보니, Meta에서 오픈소스로 뿌린 segment anything 알고리즘이나, YOLO 오픈소스 이미지 검출 모델 등, 쓸 수 있는 방안이 많았다. 

 

일정짜기, 우리가 구현할 큰 그림의 플로우 차트, 여러 아이디어를 메모 후, 주제 선택을 위한 회의를 마쳤다.

예선 일정이 2022-8-14 까지였고, 이에 따른 일정표를 크게 작성했다.

2022-7 ~ 2022-8

동기를 돌아보며..

공모전을 제안한 내가 팀장이였고, 당시에는 팀장이 해야할 역할인 역할분담, 세부 일정 정하기를 제대로 못했다.

 

팀원 각자가 어느부분에서 강점이 있고, 약점이 있는지 조사를 한번 하고 진행했더라면, 더 완벽한 프로젝트가 되지 않았을까 하는 후회도 남는다.

3. 첫 아이디어

처음 생각한 아이디어는, Meta의 segment anything 알고리즘을 활용해, 우리가 쓸 수 있는 부분만 쓰는 것이였다.

박스가 사진 가운데에 오도록 UI상에서 유도를 한 뒤, 어플에서 사진을 찍고 터치포인트를 남기면, 백엔드 쪽에서 전달받은 사진의 가운데 몇 지점을 정해서, 박스 구역만 추출해 처리를 하려고 했다.

 

생각한 segment anything의 플로우 차트
플로우차트 2

이런식으로 생각을 했었지만, 모델의 크기가 너무 무거웠고 (가장 가벼운게 2GB), 실제 구동해서 결과물이 나오는 시간이 우리 팀이 생각한 요구사항보다 더 오래걸렸다. CUDA, pytorch 등 구동환경을 서버에서 맞춰주는 것도 번거로웠다.

 

심지어 주최측에 문의 결과, 사용자가 어플과 상호작용을 하면 안되고 사진 촬영 하나만으로 이미지를 분석해 박스 크기를 알려줘야 했다. 

 

결국 segment anything알고리즘을 활용해 박스 이미지만 추출하는건 폐기하기로 하고, 다른 방안을 찾아야했다.

 

다음 포스팅에서 우리팀의 알고리즘 파트의 핵심, YOLO v8에 대해 쓸 것이다.