프로젝트

일반

사용자정보

Actions

Task #142

완료됨

마일스톤 #139: [비전] 노면 상태 인식 AI (Toy-PJ)

AI 연구 개발용 데이터 검수/정제

중은 정이(가) 일년 이상 전에 추가함. 일년 이상 전에 수정됨.

상태:
완료
담당자:
시작일:
2024/05/07
완료기한:
2024/05/31
진척도:

100%


설명

목적

  • Efficient Det 초기 모델 개발에서, 훈련 정확도 대비 테스트 정확도가 현저하게 낮은 증상 보이고 있음
  • 훈련 데이터 : 2023 데이터바우처 지원사업 6월 데이터
  • 검증 데이터 : 2024 년 축적 중인 Daily DB 데이터
  • 훈련 데이터와 검증 데이터 사이에 이미지의 현저한 차이가 있을 것으로 예상되며, 데이터에 대한 정제는 이뤄지지 않은 상황
  • 훈련 데이터와 검증 데이터를 직접 확인하고, 정제하여 올바른 학습과 검증이 될 수 있도록 유도하기 위함

목표

  • 훈련 데이터/검증 데이터 육안 확인 및 차이 분석
  • 훈련/검증용 데이터 정제. 클래스 별로 수량 확보 (수량 확정은 미정)

예상 개발 기간

  • 4주

참여 인력

  • 박상현

파일

데이터바우처 6월.xlsx (121 KB) 데이터바우처 6월.xlsx 상현 박, 2024/05/17 00:54
Actions #1

중은 정이(가) 일년 이상 전에 변경

  • 제목을(를) AI 활용 데이터 검수/정제에서 AI 연구 개발용 데이터 검수/정제(으)로 변경되었습니다.
Actions #2

상현 박이(가) 일년 이상 전에 변경

  • 상태을(를) 신규에서 진행(으)로 변경되었습니다.
Actions #3

상현 박이(가) 일년 이상 전에 변경

개요

  1. 현재 사용중인 올빅뎃 6월 라벨링 데이터의 5개 센서만 가지고 있다.

  2. 20220826_000_40P0S0R0A0_0, 20220428_000_40P0S1R1AX_0, 20220826_001_40P0S0R0A0_0, 20221109_000_40P0S1R1A0_0, 20221109_001_40P0S1R1A0_0 (현재 시리얼 기준)

  3. G00000008, G00000009, G00000011, G00000013, G00000014 (과거 gateway_id 기준)

  4. 현재 모바휠 자체 데이터의 경우, 10개 이상 사이트에서 데이터 수집 중

결론

  1. 올빅뎃 6월 데이터는 데이터 편향의 문제가 있다.

  2. 지속적인 DailyDB 운용을 통해 데이터 다양성의 확보가 필요하다.

Actions #4

상현 박이(가) 일년 이상 전에 변경

  • 상태을(를) 진행에서 검토 대기(으)로 변경되었습니다.
Actions #5

상현 박이(가) 일년 이상 전에 변경

  • 진척도을(를) 0에서 50(으)로 변경되었습니다.
Actions #6

중은 정이(가) 일년 이상 전에 변경 · Edited

  • 상태을(를) 검토 대기에서 검토(으)로 변경되었습니다.
  • 진척도을(를) 50에서 100(으)로 변경되었습니다.

상현 주임님!

말씀해주신 데로 훈련 데이터가 본 적이 없는 사이트 (데이터바우처 6월에 포함되지 않은 나머지 5개 사이트) 에 대해서도 예측을 하라고 하면 성능이 당연히 낮을 것 같습니다.
현재 훈련 데이터셋과 검증 데이터셋은 mobileNet 모델을 검증하는데 적합한 쌍이 아닌 것 같습니다.

6월 데이터 내에서 서로 섞이지 않게 [훈련 / 검증] 데이터를 나누어 (5:5 든, 7:3 이든 좋습니다.) 모델의 성능을 시험해보면 좋겠습니다.
만약 DailyDB 로 모은 데이터 수량이 충분하다면 꼭 데이터바우처 6월 데이터일 필요도 없습니다.

DailyDB 를 통해 데이터를 모으고 있으니, 현 Task는 여기서 종료하도록 하겠습니다.

수고하셨습니다.

Actions #7

중은 정이(가) 일년 이상 전에 변경

  • 상태을(를) 검토에서 완료(으)로 변경되었습니다.
Actions

내보내기 Atom PDF