크라우드 웍스 데이터 라벨링 중급 과정 2
크라우드 웍스 데이터 라벨링 중급과정은 총 10개의 강의로 2개로 나누어 포스팅하였으니
크라우드 웍스 데이터 라벨링 중급 과정 2의 이전 내용이 궁금하시다면 아래 글을 참고하시길 바랍니다.
개인적으로는 1~5강 실습 프로젝트 중에서는 음성전사 작업이 타 작업에 비해 까다롭다고 느꼈습니다.
하지만 못할 정도로 어려운 수준은 아니였습니다. 크라우드 웍스 데이터 라벨링 입문 과정에 비해 프로젝트 당 작업의 난이도와 개수가 더 있는 편이고, 작업 제출 시간이 지나면 처음부터 다시 작업해야 되니 시간적인 여유를 두고 강의를 들으시기를 바라겠습니다.
[ 6. 모션 키포인트 ]
1) AI 코치와 운동하기
- 10초 만에 스윙을 진단해주는 AI '골프 픽스'
- AI 코칭을 위한 데이터 가공의 중요성
- 모션 분석을 위한 데이터 가공 방법
8분 이내의 강의로 인공지능과 스포츠의 만남을 주도한 모아이스에 대한 내용, 사람 코치가 없어도 스포츠를 배울 수 있는 골프 픽스에 대한 내용을 들을 수 있습니다. 골프는 자세에 대한 데이터가 어느정도 잡혀있기 때문에 골프와 AI를 접목시켰으며, 골프의 스포츠 LTV도 타 스포츠에 비해 높은 편이기 때문에 연령과 성별 상관없이 즐길 수 있는 스포츠이기 때문에 골프라는 종목을 선택했다고 밝혔습니다. 이에 대한 데이터를 바탕으로 골프 픽스는 AI가 스윙 자세를 인식해 40가지 문제점을 발견하고 분석하고 사용자가 자신의 문제점을 파악해 개선할 수 있도록 하는 원리로 서비스를 제공하고 있습니다.
출시된 뒤 일주일 만에 구글 앱스토어에서 1위를 하였고, 정확도가 아주 우수하며, 현재도 개발중에 있다고 합니다. 비행기 모드나 온라인에 연결이 불안정한 상황에서도 5초 이내로 진단이 가능하다고합니다. 현재는 골프에만 적용하고 있지만, 추후에는 필라테스, 요가 등 다른 스포츠에도 진출할 계획이라고 합니다.
2) 실습프로젝트 가이드 및 실행
모션 키포인트에 대한 기준과 작업화면 및 작업방법에 대한 설명을 들을 수 있는 가이드로 7분 이내의 동영상입니다.
- 작업방법 : 특정동작을 수행하고 있는 사람의 지정된 신체부위 중앙에 11개의 점을 순서대로 찍는 프로젝트입니다. 6강의 얼굴 랜드마크 작업과 마찬가지로 이미지 속 사람의 기준으로 오른쪽과 왼쪽을 판단해야 합니다. 해당 부위가 보이지 않는 경우나 신체나 물체에 가려서 중앙을 알 수 없는 경우에는 점을 찍은 뒤, 미사용 버튼을 눌러서 생략해줍니다. 옷에 의해 가려졌을 경우에는 관절 기준 4분 면 가운데를 찍어주시면 됩니다.
이미 찍은 점의 위치를 편집하고 싶다면 마우스 왼쪽 버튼을 누른 상태로 드래그 하면 됩니다. 또한 사진에서 두 명이 인식되어 있는 경우 둘 다 각각 11개의 점을 찍어줘야 합니다. 작업 화면에 점을 찍는 순서가 나와 있으니 순서는 굳이 외우실 필요는 없습니다. 한 사진에 한 명만 있는 경우에는 작업이 간단하다고 느꼈지만, 세명 이상 나오면 좀 많다고 느끼실 것 같습니다. 찬찬히 한 명 한 명 한다는 생각으로 하시면 총 10장의 사진을 금방 작업하실 수 있습니다.
이와 같은 작업으로 처리된 데이터는 대상의 행동을 분석하는 소프트웨어 개발에 활용되고 있습니다.
[ 7. 바운딩 고급 Ⅰ ]
1) 나만의 AI 캐릭터
- 사람의 표정, 음성, 행동을 캐릭터로 변환하는 AI 기술
- 캐릭터 콘텐츠 제작을 위한 데이터 가공의 중요성
- 얼굴 표정을 검출하기 위한 데이터 가공 방법
인공지능 연구원(AIRI)의 보험피팅 AI 소프트웨어를 통해 핀테크 시장에 도전하고 있으며, 인공지능 연구원(AIRI)은 인공지능을 이용해 산업 및 사회문화의 문제점을 해결하는 목적을 가진 연구소입니다. 총 18분 이내의 강의로 인공지능 연구원에서 개발하는 페이스 디텝션 기술에 대한 내용을 들을 수 있으며, 이 페이스 디텝션 기술이 어디에 쓰이는지를 알 수 있습니다. 페이스 디텝션 기술을 통해 다양한 해상도의 얼굴 영역 데이터를 구축하고 있는 중이라고 합니다.
2) 실습프로젝트 가이드 및 실행
이미지 바운딩 기준과 작업화면과 작업 실행에 관한 가이드 동영상으로 9분 이내의 동영상입니다.
- 작업방법 : 악세사리를 제외한 사진에 나와 있는 사람의 얼굴을 바운딩한 뒤 표정 및 모습을 태깅해주면 됩니다. 바운딩을 새로 하고 싶은 경우에는 하던 작업을 삭제한 뒤 '+'버튼을 눌러서 새로 바운딩해주면 됩니다. '수정 버튼'을 누르면 바운딩 박스가 수정이 가능합니다. 사람이 뒤를 돌아 있을 때 예상해서 바운딩하는 경우도 있는데, 이 때는 이목구비가 없으므로 작업불가를 클릭해 사유를 제출하시면 됩니다. 가이드 기준으로는 얼굴에 해당하는 영역만 바운딩 해야하며, 사람 얼굴이 나왔다면 모두 바운딩해야 합니다. 태깅 속성은 감정, 모습을 태깅 후 총 17개의 작업을 완료하면 '바운딩 고급 Ⅰ' 강의를 완료하게 됩니다.
바운딩 기준이 정해져 있으니 가이드를 보고 바운딩 작업을 하시면 됩니다. 실제 사람만 바운딩 대상으로 사진, 그림, 인형, 거울에 반사된 사람의 경우 바운딩 대상이 아닙니다. 귀를 포함한 턱끝까지 얼굴을 기준으로 바운딩하는데 머리카락 외의 신체의 일부나 물체에 의해 얼굴이 조금이라도 가려졌다면 '가려진 모습'을 선택하시면 됩니다. 두세장 하시다보면 익숙해져서 반려도 많이 안 뜰 거라고 생각됩니다.
[ 8. OCR 중급 ]
1) AI가 OCR을 만나면 생기는 일
- 출판에 인공지능을 접목한 에듀테크 비대면 AI 학습지
- 인공지능 비전인식을 위한 데이터 가공의 중요성
- 인공지능에게 글자를 가르치기 위한 데이터 가공 방법
12분 이내의 강의로 아이에스피디의 비대면 AI학습지 플랫폼 스터 디넷에 대한 내용을 알 수 있습니다. 스터 디넷 플랫폼은 비대면 학습의 한계를 극복하기 위해 AI를 적용합니다. 페이지 인식, 좌표 매칭, 학습활동 인식, AI 자동채점, 비대면 학습활동으로 총 5단계로 구성된 단계는 학생이 효과적으로 학습할 수 있도록 합니다. 학습활동 자체를 실시간으로 업로드하도록 시스템이 구축되어 있기 때문에 비대면 학습의 한계를 극복해 새로운 사업에 대한 데이터를 축적할 수 있었다고 합니다. 동화책과 학습지 특성상 일반 OCR 데이터 라벨링 작업에 비해 추가적인 요청사항이 많았다고 합니다.
데이터 라벨러에게 당부할 사항이 있다면, AI 가공작업을 하면서 검수자나 기업에 자주 문의를 하기를 당부한다고 합니다.
2) 실습프로젝트 가이드 및 실행
OCR 작업기준과 작업화면, 작업방법에 대한 가이드로 9분 이내의 동영상 입니다.
- 작업방법 : 주어진 이미지 내 텍스트를 추출하는 작업으로 PC에서만 작업 가능합니다. 책 표지를 보고 제목을 기준으로 글씨 색상, 띄어쓰기, 줄 바꿈 기준에 맞게 바운딩한 후 태깅하고, 내용을 입력하는 작업입니다. 이미지에서 확인할 수 있는 한글과 숫자 모두 OCR대상입니다. 한글과 숫자는 각각 나누어서 바운딩해야 합니다. 또한 특수문자와 부호는 바운딩 대상에서 제외됩니다. 총 15건의 작업을 완료하면 됩니다.
띄어쓰기 한 부분과 숫자, 글자색마다 따로 바운딩해야 되기 때문에 바운딩해야 될 객체가 많습니다. 주의해서 작업하시길 바랍니다.
[ 9. 바운딩 고급 Ⅱ ]
1) 뇌 건강, AI가 책임질게요.
- 뇌 질환 극복을 위한 AI 설루션
- 딥러닝 엔진의 초고속 뇌 영역 구조 측정 및 분석
- 뇌 질환 분석을 위한 데이터 가공 방법
13분 이내의 강의로 뇌질환 치료와 진단을 안내해 주는 뉴로 핏에 대한 내용을 알 수 있습니다. 특히 치매와 뇌졸중 개선을 위한 '진단-치료 가이드-치료' 종합 인공지능 의료 설루션을 개발하고 있습니다. 핵심기술인 세그 엔진 기술로 1분 내로 97개 뇌 영역을 구획화하여 분석하여 다양한 뇌 관련 질환 진단과 치료 가이드, 수술방법에 관해 도움이 될 수 있다고 합니다.
아무리 검증된 툴이라도 오류가 존재하며, 이때 완벽한 학습 데이터 생성을 위해서는 사람의 수작업이 필요합니다. AI기반으로 뇌 MRI 구획화하는 알고리즘으로 MRI 데이터를 입력하면 1분 안에 뇌 구조에 관한 데이터와 분석정보를 알 수 있게 됩니다. 이 기술은 계속해서 고도화되고 있고, 또한 계속적으로 학습을 시켜서 앞으로 더 신뢰성을 더 확보해 나갈 계획이라고 합니다.
2) 실습 프로젝트 가이드 및 실행
이미지 바운딩으로 특정 대상을 바운딩하는 작업입니다.
- 작업방법 : 뇌 MRI(자기 공명 영상) 이미지에서 뇌실(ventricles)을 바운딩한 뒤 태깅하는 작업입니다. 뇌실이란 뇌 안에 존재하는 서로 연결된 네 개의 공간을 뇌실이라고 하는데, 이미지상으로는 검은 나비 모양처럼 보입니다. 뇌실은 중추신경 조직에 영양을 공급하거나 대사산물을 배출하는 뇌척수액으로 채워져 있습니다. 바운딩 대상은 진하거나 연한 회색 부분이 나닌 검은 부위입니다. 검은 부위가 떨어져 있어도 한 개의 바운딩 박스로 작업합니다.
총 25개의 작업을 완료하면 9강의 완료됩니다. 크게 어려운 바운딩 작업은 아니었습니다.
[ 10. 스켈레톤 추출 ]
1) 수많은 정보를 담고 있는 작은 점
- 컴퓨터 비전과 기계 학습 기반의 시각 지능 기술
- 차세대 증강 현실 커머스를 위한 가상 착용 기술 '스타일 AR'
- 증강 현실 기술을 위한 데이터 가공 방법
8분 이내의 강의로 딥 픽셀의 가상 착용 기술을 이용한 스타일 AR 기술에 대해 알 수 있습니다. 비대면을 선호하는 분위기 속에서 온라인 시장의 규모는 커지는 추세 속에서 실제로 착용하지 못하는 한계점을 극복하기 위해 나온 AI 기술입니다. 스타일 AR은 스마트 폰 카메라를 이용해 가상으로 제품을 착용해 봄으로써 구매자는 최상의 개인화된 쇼핑 경험을 통해 자신에게 가장 잘 맞는 제품을 구매할 수 있고, 판매자는 반품이 나교 환 비용에 관한 서비스에 대한 비용을 줄일 수 있는 장점이 있습니다.
2) 실습 프로젝트 가이드 및 실행
스켈레톤 추출 작업 중 하나로, 대상의 행동을 분석하고 VR, AR과 결합해 기술을 개발하고 있습니다.
- 작업방법 : 손목에서 시작해 엄지부터 새끼손가락까지 뼈마디 중앙에 총 20개의 점을 순서대로 찍는 프로젝트입니다. 가이드에 따라서 작업하면 쉽게 하실 수 있습니다. 10건의 작업을 완료하면 크라우드 웍스 데이터 라벨링 중급과정이 완료됩니다.
[ ※ 최종평가 ]
최종평가는 9강을 다 듣고 난 뒤부터 시험에 응시가 가능합니다. 그래도 앞으로의 작업을 위해서 10강을 듣고 최종평가에 응시하는 것을 추천드립니다.
- 총 20문제로 60점 이상을 획득하면 크라우드 웍스 데이터 라벨링 중급과정을 통과하게 됩니다.
저는 총 85점으로 크라우드웍스 데이터 라벨링 중급과정을 완료하였습니다.
이로써 총 13개의 배지를 획득하게 되었습니다.
추후에는 한국인공지능협회에서 주최하는 교육을 들어볼 예정입니다.
데이터 라벨링 수업 들으시는 분들 다들 파이팅입니다!
'공부 및 교육 > IT용어& 활동' 카테고리의 다른 글
SQL 문법 정리 - DML, DDL, DCL,TCL, QUERY, 연산자 (0) | 2023.03.18 |
---|---|
데이터 라벨링 작업 후기(세그멘테이션, 3D바운딩, 2D 바운딩, 3D 모델링 등) (0) | 2023.02.20 |
AI 기술 : 진짜 보다 더 진짜 같은 버츄얼(Virtual) 인플루언서 (0) | 2022.09.07 |
크라우드 웍스 데이터 라벨링 중급 과정 1 (0) | 2022.09.05 |
크라우드 웍스 데이터 라벨링 중급과정 시작 (0) | 2022.08.31 |
댓글