AI알바




분류 오디오

일반 음성 수집 및 전사 (4인)(마스크 미착용)

작성자 정보

  • 작성자 카키복
  • 작성일

본문

1. 녹음 가이드

  • 참여자 : 4인 참여 1개 작업 제출
  • 녹음 장소 : 실내 장소 (자택, 회의실 외 개인 공간 등 대화가 불가능할 정도의 소음이 들리지 않는 공간이나 자택에서 녹음 권장)
  • 소음 기준 :
    1. 대화 내용이 전혀 들리지 않을 정도의 소음은 반려 대상
    2. 전체 녹음 중 대화가 전혀 들리지 않을 정도의 소음이 1초 미만 발생한 경우는 2회 이하에 한정하여 허용
  • 대화 내용 : 일상 대화
    1. 주제에 대한 제한은 없으나 위법 적인 내용을 포함하지 않는 내용으로 녹음
    2. 대화 중간에 한 가지가 아닌 여러 가지 주제로 주제를 변경 하여 대화 진행 가능
    3. 대화 주제 흐름 가이드 (참고용)
    -. 최근에 시청한 컨텐츠 : 영화, 드라마, 책, 음악, 유튜브 등
    -. 선호 하는/싫어 하는 요소와 그 이유
    -. 관련된 본인의 경험/추억 등
  • 녹음 분량 :
    1. 5분 10초 이상 ~ 5분 30초 이하 (최대 6분)
    2. 전체 녹음 중 대화 내용이 최소 4분 30초 이상 포함될 수 있도록 녹음
    3. 동시에 발화 하여 음성이 겹치는 상황이 최대한 발생하지 않도록 녹음

2. 전사 가이드

  • 기본 전사 방식은 아래와 같습니다.
    타임코드/화자분리/전사내용
    타임코드를 입력하지 않을 경우 반려 대상이니 반드시 입력 해주세요.
    00:10/남자1/안녕하세요
  • 화자 분리 : 성별 인원 형식으로 입력
    1. 남자1, 남자2, 여자1, 여자2 또는 남자1, 남자2, 남자3, 여자1 로 공백 없이 숫자를 붙여 전사
    2. 화자 발화가 변경될 때 마다 줄 바꿈
    00:10/남자1/어제 그 경기 봤어?
    00:15/여자1/뭐 저녁인가 새벽에 하던 거?
    00:10/남자2/아 그거 누나랑 같이 봤잖아
    00:10/여자2/맞아 손흥민이 골 넣더라
  • 맞춤법 및 띄어쓰기
    1. 맞춤법 및 띄어쓰기 모두 맞추어 전사
    2. 네이버 맞춤법 검사기로 확인했을 시 수정 내용이 없는 기준
    -. 네이버 맞춤법 검사기(https://bit.ly/3i7VDAE)
  • 문장 부호 :
    1. 상황에 맞추어 마침표(.) 물음표(?) 느낌표(!)를 넣어 전사
    2. 이외 특수문자 사용 금지
  • 숫자 영문 표기
    1. 숫자 영어 표기는 자주 사용하는 표기로 전사 지향
    -. 세 분 (O),  3분 (X)
    -. 3분 (O), 삼 분(X)
    -. 4시 (O) , 네 시 (X)
    -. 드라마 (O), drama (X)
    -. 장르 (O), genre (X)
    2. 숫자에 천 단위 구분 쉼표를 넣지 않음
    -. 1000 (O),  1,000 (X)
  • 음성 파일 내 발화 문장 일부가 녹음 누락되어 잘려있는 경우
    1. 해당 발화 내용 대괄호 물음표([?]) 입력 후 나머지 문장 전사
    00:10/남자1/내일은 무슨 수업 들어?
    00:15/여자1/무슨 수업이야. 이제 [?]. 그래서 수업 안 들어도 돼.
    00:10/여자2/너는 동생이 언제 방학하는 지도 모르냐.
    00:10/남자2/회사 일하다 보면 그럴 수도 있지. [?] 참 빠르다
  • 음성 겹침
    1. 해당 발화 내용이 정확히 들리면 화자 분리
    2. 끼어든 사람의 음성이 잘 들리지 않는 경우 대괄호 플러스([+])로 표시
    00:10/남자1/요새 이런 거 만드는 게 유행이래. 나도 사서 해볼까.
    00:15/여자1/어 이거 저번에 수진이가 하던 거 아니야?
    00:10/여자2/어 [+] 이거 너무 어려워서 하다가 말았어.
    00:10/남자2/그 [+] 되게 잘했던데?
  • 간투어 : 어, 음, 아, 하, 흠, 헉, 앗 등의 1음절의 의미 없는 간투어는 대괄호([ ])로 표시
    00:10/남자1/크림 스파게티 만드는 데 뭐 들어가더라?
    00:15/여자1/[어] [흠] [앗] 그거는 넣지 말고 빼. 맛이 이상해져.
    00:10/남자2/그 블로그 레시피 보면 잘 나와있던데. 링크 좀 보내줘.
    00:10/여자2/맞아. 그거 진짜 맛있게 먹었었잖아.
  • 웃음 소리/ 우는 소리 : 웃음 소리/우는 소리는 전사 대상에서 제외
  • 네트웍 장애로 인해 음성이 중간에 소실된 경우 :
    해당 발화 내용 대괄호 물음표([?]) 입력 후 나머지 문장 전사
    00:10/남자1/핸드폰 바꿀 때가 된 것 같아.
    00:15/여자1/오빠는 어디 거로 바꾸고 싶은데?
    00:10/여자2/어 나는 [?] 한 거보다는 큰 거면 좋아.
    00:10/남자2/이 참에 가족 할인으로 바꿔볼까?
  • 말더듬 : 말을 더듬는 구간은 전사 후, 대괄호([ ])로 구간 표시
    00:10/남자1/밖에 눈 사람 만든 거 봤어? 진짜 예술작품이더라
    00:15/여자1/봐봐 엄마 이거 진짜 대단하지?
    00:10/여자2/[엇] 이야 다들 금손인가보네
    00:10/남자2/눈 하면 [누 누 눈] 싸움하던 거 밖에 생각 안 나
  • 사투리
    1. 표준어로 변경하지 않고 소리 그대로 전사
    2. 띄어쓰기 모두 맞추어 전사
    00:10/남자1/할머니 어제 그 할머니 어떻게 만났어?
    00:15/여자1/아휴 옛날 그 말 하믄 어떵
    00:10/여자2/할머니 제주도 사투리 한 거야? 나도 할 수 있어. 생각해 보게 어떵
    00:10/남자2/망우리 구러 들어봤쥬 이런 말도 있던데.

관련자료