유사 항목 그룹화 변환 편집기(고급 탭)

유사 항목 그룹화 변환 편집기 대화 상자의 고급 탭을 사용하여 입/출력 열을 지정하고, 유사성 임계값을 설정하고, 구분 기호를 정의할 수 있습니다.

[!참고]

유사 항목 그룹화 변환의 Exhaustive 및 MaxMemoryUsage 속성은 유사 항목 그룹화 변환 편집기에서 사용할 수 없지만 고급 편집기를 사용하여 설정할 수 있습니다. 이러한 속성에 대한 자세한 내용은 변환 사용자 지정 속성의 유사 항목 그룹화 변환 섹션을 참조하십시오.

유사 항목 그룹화 변환에 대한 자세한 내용은 유사 항목 그룹화 변환을 참조하십시오.

옵션

  • 입력 키 열 이름
    각 입력 행에 대한 고유 식별자를 포함하는 출력 열의 이름을 지정합니다. _key_in 열에는 각 행을 고유하게 식별하는 값이 있습니다.

  • 출력 키 열 이름
    중복 행 그룹의 정식 행에 대한 고유 식별자를 포함하는 출력 열의 이름을 지정합니다. _key_out 열은 정식 데이터 행의 _key_in 값에 해당합니다.

  • 유사성 점수 열 이름
    유사성 점수를 포함하는 열의 이름을 지정합니다. 유사성 점수는 입력 행과 정식 행의 유사성을 나타내는 0과 1 사이의 값입니다. 점수가 1에 가까울수록 입력 행이 정식 행과 더 가깝게 일치합니다.

  • 유사성 임계값
    슬라이더를 사용하여 유사성 임계값을 설정합니다. 임계값이 1에 가까울수록 두 행이 보다 유사하여 중복으로 처리됩니다. 임계값을 높이면 고려할 레코드 수가 감소하기 때문에 비교 속도를 향상시킬 수 있습니다.

  • 토큰 구분 기호
    변환에서 데이터 토큰화에 사용할 수 있는 기본 구분 기호 집합을 제공하지만 필요에 따라 목록을 편집하여 구분 기호를 추가 또는 제거할 수 있습니다.