SW-PRODUCT/개발-데이터분석

그린플럼(Greenplum)에서 Bitmap Index 사용하기

굴돌 2016. 11. 8. 19:09



링크:  http://gpdb.docs.pivotal.io/4380/admin_guide/ddl/ddl-index.html#topic93


인덱스로 묶을 컬럼들의 고유값이 100개에서 100,000개 사이인 경우 효율적이라고 함.


selectivity ratio  =  count( distinct col1 ) / count( col1 )


이름 같이 high cardinarity data에는 부적합하다고 함 =>  이럴땐 B-tree  인덱스를..


성별같이 범주가 몇개 안되면 어떤 인덱스도 효과를 못본다.