문서를 영문으로 보려면 영문 확인란을 선택하세요. 마우스 포인터를 텍스트 위로 이동시켜 팝업 창에서 영문 텍스트를 표시할 수도 있습니다.
번역
영문

유사 항목 그룹화 변환 편집기(고급 탭)

유사 항목 그룹화 변환 편집기 대화 상자의 고급 탭을 사용하여 입/출력 열을 지정하고, 유사성 임계값을 설정하고, 구분 기호를 정의할 수 있습니다.

참고 참고

유사 항목 그룹화 변환의 ExhaustiveMaxMemoryUsage 속성은 유사 항목 그룹화 변환 편집기에서 사용할 수 없지만 고급 편집기를 사용하여 설정할 수 있습니다. 이러한 속성에 대한 자세한 내용은 변환 사용자 지정 속성의 유사 항목 그룹화 변환 섹션을 참조하십시오.

유사 항목 그룹화 변환에 대한 자세한 내용은 유사 항목 그룹화 변환을 참조하십시오.

입력 키 열 이름

각 입력 행에 대한 고유 식별자를 포함하는 출력 열의 이름을 지정합니다. _key_in 열에는 각 행을 고유하게 식별하는 값이 있습니다.

출력 키 열 이름

중복 행 그룹의 정식 행에 대한 고유 식별자를 포함하는 출력 열의 이름을 지정합니다. _key_out 열은 정식 데이터 행의 _key_in 값에 해당합니다.

유사성 점수 열 이름

유사성 점수를 포함하는 열의 이름을 지정합니다. 유사성 점수는 입력 행과 정식 행의 유사성을 나타내는 0과 1 사이의 값입니다. 점수가 1에 가까울수록 입력 행이 정식 행과 더 가깝게 일치합니다.

유사성 임계값

슬라이더를 사용하여 유사성 임계값을 설정합니다. 임계값이 1에 가까울수록 두 행이 보다 유사하여 중복으로 처리됩니다. 임계값을 높이면 고려할 레코드 수가 감소하기 때문에 비교 속도를 향상시킬 수 있습니다.

토큰 구분 기호

변환에서 데이터 토큰화에 사용할 수 있는 기본 구분 기호 집합을 제공하지만 필요에 따라 목록을 편집하여 구분 기호를 추가 또는 제거할 수 있습니다.

커뮤니티 추가 항목

추가
표시: