AI알바




분류 오디오

일반 음성 수집 및 전사 (4인)(마스크 착용)

작성자 정보

  • 작성자 카키복
  • 작성일

본문

일반 음성 수집 및 전사 (4인)

주의 사항
  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 음성수집 재작업 요청 후 48시간 이내 재작업하지 않으면 음성 수집 작업물이 삭제됩니다.

프로젝트 소개

동거하는 가족 3인과 함께 5분 동안 자유로운 대화 내용을 녹음하고 전사해주세요

    1. 동거하는 가족 3인과 함께 최대 6분 동안 자유로운 대화 내용을 녹음하고 먼저 작업을 제출해주세요
    2. 모바일로 녹음 내용을 저장하고 PC로 로그인 하여 전사 작업을 진행해주세요
    3. 4명이 함께 대화 진행, 함께 녹음한 1개의 음성 파일 전사 및 제출 가능합니다.
    4. 녹음 및 전사 완료 후 아래 페이지 정보제공 동의서 동의 및 성별 및 연령 정보 그리고 녹음 중 방언을 사용하셨다면 방언 지역 정보를 입력하셔야 제출이 가능합니다.

이 프로젝트는 음성 인식 소프트웨어를 개발하는 데에 활용됩니다.

 

※ 주의 사항 :
1. 약 10분 이상 활동이 없을 시 자동 로그 아웃 되며 전사 내용이 유실될 수 있으니 중간에 전사 내용을 지속적으로 저장하고 수정 버튼을 누르고 작업 진행 해주세요

2.  주의 사항 : PC로그인 상태에서 음성 파일 저장 버튼을 클릭하면 다시 듣기가 되지 않으니 주의하기 바라며, 저장 버튼을 클릭한 경우 작업 화면을 나갔다가 재진입하면 다시 듣기가 가능합니다.

3. 작업 내역은 최대 12시간 유지되므로 유의하시기 바랍니다.

4. 다른 기기에서 녹음 하여 재생하는 방법 등 부정 녹음시 패널티가 부여됩니다. 

5. 동일한 음성으로 여러 아이디로 작업제출시 부정작업자로 간주하여 작업제한 및 포인트가 회수 됩니다.

6. 작업 중복 참여 구분을 위해 하단에 동반 참여자의 이메일을 기재해야 하므로 이메일이 없는 동반 참여자는 작업자의 다른 이메일 주소라도 꼭 작성 부탁드립니다.

7. 한번에 여러 기계에서 여러 아이디로 로그인 후 동일한 녹음 음성을 전사 후 제출 하는 것은 불가능합니다.

작업 방법

1. 녹음 가이드

  • 참여자 : 4인 참여 1개 작업 제출
  • 녹음 장소 : 실내 장소 (자택, 회의실 외 개인 공간 등 대화가 불가능할 정도의 소음이 들리지 않는 공간이나 자택에서 녹음 권장)
  • 소음 기준 :
    1. 대화 내용이 전혀 들리지 않을 정도의 소음은 반려 대상
    2. 전체 녹음 중 대화가 전혀 들리지 않을 정도의 소음이 1초 미만 발생한 경우는 2회 이하에 한정하여 허용
  • 대화 내용 : 일상 대화
    1. 주제에 대한 제한은 없으나 위법 적인 내용을 포함하지 않는 내용으로 녹음
    2. 대화 중간에 한 가지가 아닌 여러 가지 주제로 주제를 변경 하여 대화 진행 가능
    3. 대화 주제 흐름 가이드 (참고용)
    -. 최근에 시청한 컨텐츠 : 영화, 드라마, 책, 음악, 유튜브 등
    -. 선호 하는/싫어 하는 요소와 그 이유
    -. 관련된 본인의 경험/추억 등
  • 녹음 분량 :
    1. 5분 10초 이상 ~ 5분 30초 이하 (최대 6분)
    2. 전체 녹음 중 대화 내용이 최소 4분 30초 이상 포함될 수 있도록 녹음
    3. 동시에 발화 하여 음성이 겹치는 상황이 최대한 발생하지 않도록 녹음

2. 전사 가이드

  • 기본 전사 방식은 아래와 같습니다.
    타임코드/화자분리/전사내용
    타임코드를 입력하지 않을 경우 반려 대상이니 반드시 입력 해주세요.
    00:10/남자1/안녕하세요
  • 화자 분리 : 성별 인원 형식으로 입력
    1. 남자1, 남자2, 여자1, 여자2 또는 남자1, 남자2, 남자3, 여자1 로 공백 없이 숫자를 붙여 전사
    2. 화자 발화가 변경될 때 마다 줄 바꿈
    00:10/남자1/어제 그 경기 봤어?
    00:15/여자1/뭐 저녁인가 새벽에 하던 거?
    00:10/남자2/아 그거 누나랑 같이 봤잖아
    00:10/여자2/맞아 손흥민이 골 넣더라
  • 맞춤법 및 띄어쓰기
    1. 맞춤법 및 띄어쓰기 모두 맞추어 전사
    2. 네이버 맞춤법 검사기로 확인했을 시 수정 내용이 없는 기준
    -. 네이버 맞춤법 검사기(https://bit.ly/3i7VDAE)
  • 문장 부호 :
    1. 상황에 맞추어 마침표(.) 물음표(?) 느낌표(!)를 넣어 전사
    2. 이외 특수문자 사용 금지
  • 숫자 영문 표기
    1. 숫자 영어 표기는 자주 사용하는 표기로 전사 지향
    -. 세 분 (O),  3분 (X)
    -. 3분 (O), 삼 분(X)
    -. 4시 (O) , 네 시 (X)
    -. 드라마 (O), drama (X)
    -. 장르 (O), genre (X)
    2. 숫자에 천 단위 구분 쉼표를 넣지 않음
    -. 1000 (O),  1,000 (X)
  • 음성 파일 내 발화 문장 일부가 녹음 누락되어 잘려있는 경우
    1. 해당 발화 내용 대괄호 물음표([?]) 입력 후 나머지 문장 전사
    00:10/남자1/내일은 무슨 수업 들어?
    00:15/여자1/무슨 수업이야. 이제 [?]. 그래서 수업 안 들어도 돼.
    00:10/여자2/너는 동생이 언제 방학하는 지도 모르냐.
    00:10/남자2/회사 일하다 보면 그럴 수도 있지. [?] 참 빠르다
  • 음성 겹침
    1. 해당 발화 내용이 정확히 들리면 화자 분리
    2. 끼어든 사람의 음성이 잘 들리지 않는 경우 대괄호 플러스([+])로 표시
    00:10/남자1/요새 이런 거 만드는 게 유행이래. 나도 사서 해볼까.
    00:15/여자1/어 이거 저번에 수진이가 하던 거 아니야?
    00:10/여자2/어 [+] 이거 너무 어려워서 하다가 말았어.
    00:10/남자2/그 [+] 되게 잘했던데?
  • 간투어 : 어, 음, 아, 하, 흠, 헉, 앗 등의 1음절의 의미 없는 간투어는 대괄호([ ])로 표시
    00:10/남자1/크림 스파게티 만드는 데 뭐 들어가더라?
    00:15/여자1/[어] [흠] [앗] 그거는 넣지 말고 빼. 맛이 이상해져.
    00:10/남자2/그 블로그 레시피 보면 잘 나와있던데. 링크 좀 보내줘.
    00:10/여자2/맞아. 그거 진짜 맛있게 먹었었잖아.
  • 웃음 소리/ 우는 소리 : 웃음 소리/우는 소리는 전사 대상에서 제외
  • 네트웍 장애로 인해 음성이 중간에 소실된 경우 :
    해당 발화 내용 대괄호 물음표([?]) 입력 후 나머지 문장 전사
    00:10/남자1/핸드폰 바꿀 때가 된 것 같아.
    00:15/여자1/오빠는 어디 거로 바꾸고 싶은데?
    00:10/여자2/어 나는 [?] 한 거보다는 큰 거면 좋아.
    00:10/남자2/이 참에 가족 할인으로 바꿔볼까?
  • 말더듬 : 말을 더듬는 구간은 전사 후, 대괄호([ ])로 구간 표시
    00:10/남자1/밖에 눈 사람 만든 거 봤어? 진짜 예술작품이더라
    00:15/여자1/봐봐 엄마 이거 진짜 대단하지?
    00:10/여자2/[엇] 이야 다들 금손인가보네
    00:10/남자2/눈 하면 [누 누 눈] 싸움하던 거 밖에 생각 안 나
  • 사투리
    1. 표준어로 변경하지 않고 소리 그대로 전사
    2. 띄어쓰기 모두 맞추어 전사
    00:10/남자1/할머니 어제 그 할머니 어떻게 만났어?
    00:15/여자1/아휴 옛날 그 말 하믄 어떵
    00:10/여자2/할머니 제주도 사투리 한 거야? 나도 할 수 있어. 생각해 보게 어떵
    00:10/남자2/망우리 구러 들어봤쥬 이런 말도 있던데.

관련자료