데이터 매칭은 사용자가 여러 소스에서 동일한 엔티티의 레코드를 탐지, 분석 및 병합하여 데이터의 가용성과 접근성을 높일 수 있도록 하는 데이터 관리 프로세스이다.
일반적으로 데이터 저장소 및 응용 프로그램이 중복 레코드로 채우게 된다. 그러나 오타, 이름 변형 및 기타 오류의 경우, 보통 매칭 도구는 동일한 엔티티에 필수적인 중복 항목을 식별할 수 있다.
CMC Global은 뛰어난 데이터 매칭 기술을 통해 지능형 매칭 및 머신 러닝 알고리즘으로 모든 위치와 포맷에서의 중복 레코드를 찾거나 병합 또는 삭제할 수 있는 솔루션을 고객에게 제공한다.
기술
빅 데이터
대규모 데이터 세트의 중복 문제를 처리하는 고급 인덱싱 알고리즘
AI
자연어 처리: 텍스트 필드의 확률을 계산하고 의미론 매칭 문제를 처리하기 위한 언어 모델, 자동 인코더를 적용한다