AI알바




분류 오디오

일반 음성 수집 및 전사 (2인)(마스크 착용)

작성자 정보

  • 작성자 카키복
  • 작성일

본문

일반 음성 수집 및 전사 (2인)

주의 사항
  • 본 프로젝트의 데이터는 인공지능 학습용으로 사용됩니다.
  • 본 프로젝트는 아래 가이드 숙지 후에 작업이 가능합니다.
  • 반려된 건에 대해 수정하지 않고 다시 제출하는 경우, 3 이상 반려를 당할 경우 작업 불가 대상이 될 수 있습니다.
  • 데이터 할당을 받기 위하여 대충 작업하고 반려받아 재작업하는 행위는 엄격히 금지됩니다. 발견 시 작업금지 회원이 될 수 있습니다.
  • 음성수집 재작업 요청 후 48시간 이내 재작업하지 않으면 음성 수집 작업물이 삭제됩니다.

프로젝트 소개

동거하는 가족 1인과 함께 최대 5분 동안 자유로운 대화 내용을 녹음하고 전사해주세요

    1. 동거하는 가족 1인과 함께 최대 6분 동안 자유로운 대화 내용을 녹음하고 먼저 작업을 제출해주세요
    2. 모바일로 녹음 내용을 저장하고 PC로 로그인 하여 전사 작업을 진행해주세요
    3. 2명이 함께 대화 진행, 함께 녹음한 1개의 음성 파일 전사 및 제출 가능합니다.
    4. 녹음 및 전사 완료 후 아래 페이지 정보제공 동의서 동의 및 성별 및 연령 정보 그리고 녹음 중 방언을 사용하셨다면 방언 지역 정보를 입력하셔야 제출이 가능합니다.

이 프로젝트는 음성 인식 소프트웨어를 개발하는 데에 활용됩니다.

 

※ 주의 사항 :
1. 약 10분 이상 활동이 없을 시 자동 로그 아웃 되며 전사 내용이 유실될 수 있으니 중간에 전사 내용을 지속적으로 저장하고 수정 버튼을 누르고 작업 진행 해주세요.

2.  주의 사항 : PC로그인 상태에서 음성 파일 저장 버튼을 클릭하면 다시 듣기가 되지 않으니 주의하기 바라며, 저장 버튼을 클릭한 경우 작업 화면을 나갔다가 재진입하면 다시 듣기가 가능합니다.

3. 작업 내역은 최대 12시간 유지되므로 유의하시기 바랍니다.

4. 다른 기기에서 녹음 하여 재생하는 방법 등 부정 녹음시 패널티가 부여됩니다. 

5. 동일한 음성으로 여러 아이디로 작업제출시 부정작업자로 간주하여 작업제한 및 포인트가 회수 됩니다.

6. 작업 중복 참여 구분을 위해 하단에 동반 참여자의 이메일을 기재해야 하므로 이메일이 없는 동반 참여자는 작업자의 다른 이메일 주소라도 꼭 작성 부탁드립니다.

7. 한번에 여러 기계에서 여러 아이디로 로그인 후 동일한 녹음 음성을 전사 후 제출 하는 것은 불가능합니다. 

작업 방법

1. 녹음 가이드

  • 참여자 : 2인 참여 1개 작업 제출
  • 녹음 장소 : 실내 장소 (자택, 회의실 외 개인 공간 등 대화가 불가능할 정도의 소음이 들리지 않는 공간이나 자택에서 녹음 권장)
  • 소음 기준 :
    1. 대화 내용이 전혀 들리지 않을 정도의 소음은 반려 대상
    2. 전체 녹음 중 대화가 전혀 들리지 않을 정도의 소음이 1초 미만 발생한 경우는 2회 이하에 한정하여 허용
  • 대화 내용 : 일상 대화
    1. 주제에 대한 제한은 없으나 위법 적인 내용을 포함하지 않는 내용으로 녹음
    2. 대화 중간에 한 가지가 아닌 여러 가지 주제로 주제를 변경 하여 대화 진행 가능
    3. 대화 주제 흐름 가이드 (참고용)
    -. 최근에 시청한 컨텐츠 : 영화, 드라마, 책, 음악, 유튜브 등
    -. 선호 하는/싫어 하는 요소와 그 이유
    -. 관련된 본인의 경험/추억 등
  • 녹음 분량 :
    1. 5분 10초 이상 ~ 5분 30초 이하 (최대 6분)
    2. 전체 녹음 중 대화 내용이 최소 4분 30초 이상 포함될 수 있도록 녹음
    3. 동시에 발화 하여 음성이 겹치는 상황이 최대한 발생하지 않도록 녹음

2. 전사 가이드

  • 기본 전사 방식은 아래와 같습니다.
    타임코드/화자분리/전사내용
    타임코드를 입력하지 않을 경우 반려 대상이니 반드시 입력 해주세요.
    00:10/남자1/안녕하세요

  • 화자 분리 : 성별 인원 형식으로 입력
    1. 남자1, 여자1 또는 남자1, 남자2 또는 여자1, 여자2로 공백 없이 숫자를 붙여 전사
    2. 화자 발화가 변경될 때 마다 줄 바꿈
    00:10/남자1/안녕하세요
    00:15/여자1/잘 지내셨어요?
  • 맞춤법 및 띄어쓰기
    1. 맞춤법 및 띄어쓰기 모두 맞추어 전사
    2. 네이버 맞춤법 검사기로 확인했을 시 수정 내용이 없는 기준
    -. 네이버 맞춤법 검사기(https://bit.ly/3i7VDAE)
  • 문장 부호 :
    1. 상황에 맞추어 마침표(.) 물음표(?) 느낌표(!)를 넣어 전사
    2. 이외 특수문자 사용 금지
  • 숫자 영문 표기
    1. 숫자 영어 표기는 자주 사용하는 표기로 전사 지향
    -. 세 분 (O),  3분 (X)
    -. 3분 (O), 삼 분(X)
    -. 4시 (O) , 네 시 (X)
    -. 드라마 (O), drama (X)
    -. 장르 (O), genre (X)
    2. 숫자에 천 단위 구분 쉼표를 넣지 않음
    -. 1000 (O),  1,000 (X)
  • 음성 파일 내 발화 문장 일부가 녹음 누락되어 잘려있는 경우
    1. 해당 발화 내용 대괄호 물음표([?]) 입력 후 나머지 문장 전사
    00:10/여자1/요새는 나가지도 못하는데 무슨 운동해?
    00:10/여자2/안 그래도 필라테스 하던 거 못 나가서 뭐 [?] 중이야.
  • 음성 겹침
    1. 해당 발화 내용이 정확히 들리면 화자 분리
    2. 끼어든 사람의 음성이 잘 들리지 않는 경우 대괄호 플러스([+])로 표시
    00:10/여자1/그 배우는 거기 드라마에서도 나오는데 영화도 출연했대?
    00:10/여자2/아 나도 그 배우 나오는 거 [+]
  • 간투어 : 어, 음, 아, 하, 흠, 헉, 앗 등의 1음절의 의미 없는 간투어는 대괄호([ ])로 표시
    00:10/여자1/주말에 뭐하고 있었어?
    00:15/여자2/[어] [음] 할 게 없어서 집에만 있었어요.
  • 웃음 소리/ 우는 소리 : 웃음 소리/우는 소리는 전사 대상에서 제외
  • 네트웍 장애로 인해 음성이 중간에 소실된 경우 :
    해당 발화 내용 대괄호 물음표([?]) 입력 후 나머지 문장 전사
    00:10/여자1/요 앞에 새로 생긴 만둣집 다녀와봤어?
    00:15/여자2/아 그 [?] 친구랑 같이 [?]데 맛집이야.
  • 말더듬 : 말을 더듬는 구간은 전사 후, 대괄호([ ])로 구간 표시
    00:10/여자1/엄마 나 이 부분이 너무 어려워서 [서 서 선]생님한테 질문했어
    00:15/여자2/그래? 선생님이 뭐라고 답변해주셨어?
  • 사투리
    1. 표준어로 변경하지 않고 소리 그대로 전사
    2. 띄어쓰기 모두 맞추어 전사
    00:10/남자1/어제 통화 음질이 별로 안 좋았나 봐. 잘 안 들리던데?
    00:15/여자1/이리 말하니까 잘 몬 알아듣던 데 답답해갖고  끊었다.

관련자료