크라우드 웍스 데이터 라벨링 중급 과정 1
크라우드 웍스 데이터 라벨링 입문과정을 수료한 뒤 중급과정을 들을 예정입니다.
아무래도 입문과정보다 난이도가 조금은 높을 거 같아서 메모를 좀 더 자세히 해보려고 합니다.
데이터 라벨링 중급과정 들으시는 분들 다들 힘내서 수료하시길 바라겠습니다!
입문과정과 마찬가지로 대부분 실습 프로젝트를 수행하는 수업입니다.
크라우드 웍스 데이터 라벨링 중급과정은 진도율 총 80% 이상, 최종 평가에서의 60점 이상 획득이 수료 조건으로 입문과정과 동일합니다. 훈련기간 종료 후에는 최종평가 응시가 불가능하고 교육 재신청이 불가하니 기간을 꼭 지켜서 수료하시길 바라겠습니다.
이번에 제가 듣는 회차는 7회 차로 9월 2일부터 15일까지 13일간 수업을 들을 수 있습니다.
[ 1. 이미지 분류/ 판별 중급 ]
1) TV에서 본 옷과 같은 걸 찾아줘!
- 의상데이터를 활용한 패션 AI 기술
- 개인 맞춤화된 패션 서비스를 위한 데이터 가공의 중요성
- 패션 이미지 분류를 위한 데이터 가공 방법
8분 이내의 강의로 데이터 기반 패션 플랫폼인 코디너리가 어떤 데이터를 필요로 하면 어떻게 작업하는지에 대한 설명을 들으실 수 있습니다. 코디 너른 옷장에 보유하고 있는 다양한 패션 아이템을 활용하여 인공지능이 코디를 제안해주고 고객의 취향에 맞는 상품을 추천해 줍니다. AI가 개인 스타일리스트 역할하여 고객의 옷장에 보유하고 있는 옷을 분석해 코디를 제안해줍니다.
이러한 AI 모델을 개발하기 위해서는 다양한 스타일, 취향, 조합에 대한 데이터가 필요하고, 옷의 종류, 길이, 속성이 세분화될수록 정교한 패션 AI 모델을 개발할 수 있기 때문에 데이터 라벨러의 역할이 중요하다고 합니다.
2) 실습 프로젝트 가이드 및 실행
이미지 분류/ 판별 기준, 작업 인터페이스와 작업 방법에 대한 설명
- 작업 방법 : 이미지 속의 사람이 입고 있는 상의의 속성을 분류하는 작업입니다. 사람이 입고 있는 상의 중 가장 바깥쪽의 옷이 분류 대상입니다. 옷의 종류, 팔의 길이, 넥라인, 옷의 패턴(소재), 옷의 장식, 옷의 색상을 알맞게 분류하여 총 40개의 프로젝트를 완료해야 합니다.
작업은 휴대폰 및 PC에서 모두 가능합니다. 40개라 살짝 많다고 느껴졌지만 쉬운 작업입니다.
[ 2. 텍스트 분류/ 판별 중급 ]
1) 마음을 치유하는 AI 심리상담
- 멘털 헬스케어를 위한 AI 기술
- 사람의 심리를 파악하기 위한 데이터 가공의 중요성
- 고민상담 봇 개발을 위한 데이터 가공 방법
13분 이내의 강의로 비대면 멘털 케어 AI서비스 아토머스의 마인드 카페에 관한 설명과 서비스 내용, AI 기술이 어떻게 활용되는지에 관한 내용을 알 수 있습니다.
날이 갈수록 현대인의 멘털 케어의 필요성이 커지고 있지만 한국은 타 선진국에 비해 오프라인 상담이 비활성화되어 있고, 정신과에 방문해 상담을 받는 것에 대한 편견이 심합니다. 또한 가격도 높고 정신과 의사나 상담사에 대한 정보의 비대칭, 낮시간에 운영되기 때문에 직장인이나 학생이 방문하기 힘듭니다. 마인드 카페에서는 멘털 케어의 모든 단계를 제공해서 추가로 약 처방부터, AI 챗봇이 기초적인 상담을 할 수 있도록 하여 디지털 치료제로써 발전할 수 있는 것을 목표로 하고 있습니다. 쉽게 말해 전문 정신건강 서비스를 단계별로 비대 면화하는 서비스라고 이해할 수 있습니다.
2) 실습 프로젝트 가이드 및 실행
텍스트를 분류하고 판별하는 작업을 하며, 작업방법과 작업화면에 대한 가이드를 볼 수 있습니다.
인공지능 감성대화 서비스를 위한 데이터 라벨링 작업이며, 질문에 대한 적절한 답변을 선택하는 실습 프로젝트입니다.
- 작업방법 : 고민을 읽고 답변 3개 중, 위로와 공감, 응원, 조언 혹은 도움이 될만한 답변을 선택하면 됩니다. 답변은 고민에 적합하고 배려심이 있어야 하며, 고민을 말한 사람에 관한 내용을 포함하고 있으며, 고민과 감정에 관련 있어야 합니다. 답변의 의미를 파악할 수 있다면 오타, 띄어쓰기 등이 포함된 답변도 선택 가능합니다.
총 60개의 실습 프로젝트를 완료를 하면 2강을 완료하게 됩니다.
[ 3. 음성 전사 입문 ]
1) 말하는 인공지능 속 숨겨진 인간의 노력
라이언 로켓의 음성 데이터 라벨링 작업으로 텍스트를 음성으로 변환하는 AI의 개발에 사용되고 있습니다. 따로 강의 내용은 없고 어떻게 실습 프로젝트를 진행하는지에 대한 가이드를 설명하는 강의입니다.
2) 실습 프로젝트 가이드 및 실행
여러 사람이 말하는 경우에는 구간별로 음성을 듣고 받아쓰는 작업을 하는 프로젝트입니다. 이때까지 한 프로젝트에 비해 좀 더 집중해서 프로젝트를 수행해야 합니다. 총 8개의 프로젝트를 진행하면 3강이 끝납니다.
- 작업방법 : 음성을 듣고 받아쓰는 작업으로 문장부호는 마침표와 물은 표만 받아쓰기 대상이며 그 외의 부호는 제외입니다. 소리 나는 대로 한글로 작성하면 되고, 대화 외의 잡음은 받아쓰기 대상이 아닙니다. PC에서만 작업 가능합니다.
맞춤법 검사기를 사용해야 하는데, 해당 작업 워크 페이스에 '맞춤법 검사기'를 클릭하면 네이버의 맞춤법 검사기로 연결이 됩니다. 하지만, 계속해서 교정이 불가하다고 떠서 티스토리 글쓰기의 맞춤법 검사기를 이용하였습니다. 음성 구간을 설정하는 데에 정교한 작업이 필요해서 시간이 좀 걸리는 작업이었습니다. 시작점과 종료점을 미세하게 설정하는 것은 작업창 가장 아래쪽의 버튼으로 조절하면 편합니다. 또한 로딩 시간도 오래 걸리니 시간을 어느 정도 확보하고 작업하시길 바랍니다.
[ 4. OCR 입문 ]
1) AI가 글자를 읽는 방법 'OCR'
- 빠르고 간편한 화장품 종합 정보 제공 플랫폼 '찍검'
- 화장품 정보 제공을 위한 데이터 가공의 중요성
- 프라이스 택 정보 분석을 위한 데이터 가공 방법
10분 이내의 강의로 로켓 뷰의 '찍검'에 대한 내용을 들을 수 있습니다. 제품명이 길거나 영문명으로 되어 있는 제품을 찍기만 하면 제품의 정보를 얻을 수 있는 애플리케이션입니다. 카메라를 이용한 OCR 기술을 이용해 서비스를 제공합니다. 오프라인 매장에서 찍기만 하면 구매요인에 해당하는 정보를 보기 편한 인포그래픽을 통해 한눈에 볼 수 있습니다. AI의 유형학습을 통해 각 매장의 프라이 스택을 분석한 뒤, 영역 학습을 통해 세부적인 학습 데이터를 인식합니다. 바운딩한 가격 프라이 스택은 찍검 AI에 저장되어 이 정보를 기반으로 제품의 정보를 확인할 수 있습니다.
2) 실습 프로젝트 가이드 및 실행
OCR 실습 프로젝트로 이미지 내의 텍스트를 추출하는 작업입니다. 문자인식 소프트웨어 개발에 사용됩니다.
- 작업방법 : 가격 택 이미지에서 텍스트를 추출하는 작업입니다. 이미지에서 바코드, 브랜드명, 브랜드명과 제품명, 세일가, 세일 기간, 정가, 제품명을 추출하는 작업이며, PC에서만 작업 가능합니다. OCR의 포인트는 이미지 바운딩보다 정교해야 한다는 것입니다. 여백을 최소화해야 합니다. 바운딩 > 태깅> 전사 순서로 이루어집니다. 기울어져있거나 곡선의 이미지의 경우에도 글자를 빠짐없이 바운딩만 하면 됩니다.
총 10개의 프로젝트를 수행하면 됩니다. 프라이스 택에서 선택해야 될 요소가 많고 , 문자도 오타 없이 입력해야 되기 때문에 가이드를 유심히 보고 작업해야 합니다.
[ 5. 얼굴 랜드마크 ]
1) AI가 얼굴을 알아본다
- 가상인물 자동화 서비스 '딥 리얼 AI'
- 지능형 콘텐츠 개발을 위한 데이터 수집/가공의 중요성
- 인공지능 기반의 가상 인물 이미지 생성을 위한 데이터 가공 방법
16분 이내의 강의로 펄스 나인의 AI 아이돌 이터니티에 대한 설명, 지능형 콘텐츠 개발에 대한 강의를 들을 수 있습니다. 페인 틀리, 딥 리얼, 딥 텍터가 있습니다. 실제 하지는 않지만 실제처럼 보이는 딥 리얼에 관한 자세한 내용을 알 수 있습니다. 딥 리얼 AI를 이용하면 다양한 인종, 남녀노소 구분 없이 가상인물을 만들어 낼 수 있으며, 더 나아가서는 인공지능 기술로 실사형 인물 콘텐츠 창작을 쉽게 할 수 있습니다.
뉴미디어의 성장으로 가상인물을 이용한 광고 마케팅, 더 나아가 IP플레이스까지 시장이 확대되고 있습니다. 기존의 기술의 한계를 극복하여 실제처럼 보이게 됩니다. 앞으로 더욱 커질 가상인물 시장에서는 딥 리얼 AI이 핵심 기술이 될 것입니다.
촬영된 영상에 태깅하고 데이터 라벨링 및 데이터 전처리를 하게 되면서, AI의 한계를 극복하고 AI의 학습을 도와주게 됩니다. 현재는 촬영한 영상에 얼굴에 CG처리를 입혀 처리를 하지만, 앞으로는 촬영 장비 없이도 콘텐츠를 만들 수 있게 된다고 합니다.
2) 실습 프로젝트 가이드 및 실행
민감한 개인 초상권의 이유로 데이터 라벨러 역시 데이터 보안에 유의하여야 합니다. 얼굴 랜드마크 가이드에 관한 내용으로
- 작업방법 : 사람 얼굴의 특정 위치에 점을 찍는 작업입니다. 눈, 코, 입꼬리 중앙에 총 5개의 점을 순서대로 찍어야 합니다. (오른쪽 눈, 왼쪽 눈, 코 중앙, 오른쪽 입꼬리, 왼쪽 입꼬리 중앙)
이렇게 데이터 라벨링 된 데이터들은 얼굴 인식 소프트웨어 개발에 활용됩니다. 점을 찍는 순서는 오른쪽 눈 → 왼쪽 눈 → 코 중앙 → 오른쪽 입꼬리 → 왼쪽 입꼬리 순서로 입력하면 됩니다. 이미지 속 사람을 기준으로 오른쪽과 왼쪽을 파악해야 합니다. 작업을 할 때 순서도 같이 나와있기 때문에 헷갈리는 부분은 없습니다. 총 30건의 작업을 완료하면 5강의 끝납니다.
◇크라우드 웍스 중급과정 중간 후기
확실히 입문보다 어려운 작업이 종종 있었고, 반려되는 횟수도 입문과정보다 많았던 것 같습니다.
하지만 못할 정도로 어렵진 않았고, 조금만 집중한다면 시간은 그리 오래 걸리지 않습니다.
저는 휴대폰으로는 강의를 듣고 PC에서 작업을 했더니 금방 5강까지 들었습니다.
남은 5강으로 크라우드 웍스 중급과정 2로 찾아오겠습니다.
강의 들으시는 분들 파이팅하세요!
크라우드 웍스 데이터 라벨링 입문 과정이 궁금하시다면 아래 글을 참고하시길 바랍니다.
데이터라벨링 교육 수료 뒤 데이터 라벨링 작업 후기도 있으니 참고하시길 바랍니다.
'공부 및 교육 > IT용어& 활동' 카테고리의 다른 글
크라우드 웍스 데이터 라벨링 중급 과정 2 (0) | 2022.09.12 |
---|---|
AI 기술 : 진짜 보다 더 진짜 같은 버츄얼(Virtual) 인플루언서 (0) | 2022.09.07 |
크라우드 웍스 데이터 라벨링 중급과정 시작 (0) | 2022.08.31 |
바운딩이 뭐야? 크라우드 웍스 데이터 라벨링 실습 프로젝트 수료 완료 (0) | 2022.08.16 |
'디지털 뉴딜' 데이터 라벨링 반자동 툴 제작 기업들과 데이터라벨링 절차 (0) | 2022.08.09 |
댓글