링크: http://gpdb.docs.pivotal.io/4380/admin_guide/ddl/ddl-index.html#topic93
인덱스로 묶을 컬럼들의 고유값이 100개에서 100,000개 사이인 경우 효율적이라고 함.
selectivity ratio = count( distinct col1 ) / count( col1 )
이름 같이 high cardinarity data에는 부적합하다고 함 => 이럴땐 B-tree 인덱스를..
성별같이 범주가 몇개 안되면 어떤 인덱스도 효과를 못본다.
'SW-PRODUCT > 개발-데이터분석' 카테고리의 다른 글
[링크] Kafka New Producer API (0) | 2016.12.21 |
---|---|
PostgreSQL : row_number vs rank vs dense_rank (0) | 2016.11.11 |
[링크] R을 이용한 텍스트 감정분석. 여론과 감성 발견하기 (0) | 2016.09.22 |
[링크] 쉽게 풀어쓴 딥러닝 (0) | 2016.09.20 |
[링크] 유튜브 비디오 추천: MF 말고 (0) | 2016.09.07 |