인공지능 데이터 가공
AI DATA PROCESSING인공지능 기업을 위한 원스톱 토탈 학습데이터 서비스를 제공합니다.
디그랩만의 크라우드소싱, 다양한 알고리즘 적용, 정확한 음성인식, 신속한 전사 및 정제, 강력한 자연어 이해 처리 등해당 분야의 높은 이해도와 데이터 정제 노하우로 구축된 데이터를 통해 성공적인 AI 서비스 구현을 기대할 수 있습니다.
진행 과정
-
STEP 1
요구사항 분석 및 설계
·고객의 요구사항 충분히 파악 ·정확도, 속도, 다양성 향상
워크플로 설계 ·기본 메타데이터 생성 ·프로젝트 맞춤형 인력 운영 설계 -
STEP 2
데이터 수집가공
·음성데이터 정제 ·데이터 어노테이션 ·텍스트 데이터 분류 ·회자정보 확보 및 세분화디그랩만의 전문성
-
STEP 3
품질 분석
·전문 인력을 통한 검수 ·다중 검수 시스템 운영 ·유효성 / 통계적 검증 ·품질체크를 통해 최적화 -
STEP 4
결과보고 및 납품
·고객이 원하는 맞춤형 산출물 전달 ·대량의 데이터도 단기간 구축 ·납품일 엄수
디그랩만의 전문화된 데이터 수집가공
더 나아가 생산성은 물론 완성도까지 완벽하게 갖춘 국내 유일 속기사 전문
작업·검수 과정이 포함된 디그랩만의 프리미엄 가공방식이 있습니다.
작업·검수 과정이 포함된 디그랩만의 프리미엄 가공방식이 있습니다.
수집항목
-
01
음성수집
지역별 다양한 녹음환경 구축 근거리, 단거리, 원거리, 다채널 녹음환경 구축 실내외 잡음, 무소음 등 다양한 녹음 환경 음성수집 자유 주제 2인 대화 및 다자토론, script 낭독 등 다양한 대화 수집 지역별, 연령별, 성별, 비원어민 등 다양한 발화자 음성 수집 사투리 녹음 및 스크립트 제작 -
02
텍스트 수집
정형 · 비정형 데이터 수집 다양하고 정확한 크롤링 시스템 활용 대용량의 정형, 비정형 데이터 분산 저장 시스템 구축 정확하고 신속한 색인 시스템 구축 -
03
음성 전사 및 정제
단기간 대량 음성 전사 가능 속기사용 음성인식기술을 활용한 초안 작성 음성녹음, 변환, 편집 기술 보유 자체 개발 빅데이터 전사툴, 비교 평가 툴 활용 -
04
자연어처리
각종 대화 자료 수집 시스템 구축 심층대화, 전문가 수준의 질의응답 가능 코퍼스 DB 구축 국내유일 속기사 보유로 정확도 높은 토큰화 작업시스템 구축 자연어 분석·이해·생성 전과정 담당 전문가 배치 -
05
영상 · 이미지 수집
이미지 객체분류 · 속성 수치화 작업 구축 각종 상황에 최적화 된 코퍼스 DB 구축 대용량의 정형, 비정형 데이터 분산 저장 시스템 구축 정확하고 신속한 색인 시스템 구축 -
06
영상 · 이미지 데이터 어노테이션
DNN기반 이미지 영상 인식 서비스 및 자율자동차 구현 영상 · 이미지 데이터 주석 (Labeling) 작업 프로그램 구축 이탈 · 등장의 오류 최소화 작업도구 활용 자체 검수 시스템 구축