[링크] NLP를 위한 딥러닝 가이드 - Likejazz http://docs.likejazz.com/deep-learning-for-nlp/ SW-PRODUCT/개발-데이터분석 2017.01.15
[퍼옴] 통계하는 사람들의 직장에서의 모습 통계하는 사람들의 직장에서의 모습 1. 일단 데이터를 보기전에 상사의 의중을 묻는다. -연구보고서가 아니므로 결과를 알고 분석에 임하는 자세를 키워나간다. 2. 상사의 의중과 대세가 가는 방향에 따라 어떻게 분석해야할지 고민한다. -잘모르는 경우 이것저것 닥치는 데로 분석기법을.. SW-PRODUCT/개발-데이터분석 2017.01.06
[링크] Druid와 연동된 imply의 Pivot https://imply.io/docs/latest/ Yahooo의 Data Sckeches라는 것도 같이 쓰면 좋은 듯 https://yahooeng.tumblr.com/post/135390948446/data-sketches SW-PRODUCT/개발-데이터분석 2016.12.22
PostgreSQL : row_number vs rank vs dense_rank row_number : 몇번째 줄인지를 알려줌. 10개의 row가 있으면 항상 1~10이 빠짐없이 부여된다. rank : 동점이 있을 경우 같은 등수를 부여하고, 동점 갯수만큼 순위를 건너뛰어 부여한다. 즉, 2등이 동점일 경우 2등이 둘, 3등 없고, 4등부터 부여된다. dense_rank : 동점이 있을 경우 같은 등수를 부여하.. SW-PRODUCT/개발-데이터분석 2016.11.11
그린플럼(Greenplum)에서 Bitmap Index 사용하기 링크: http://gpdb.docs.pivotal.io/4380/admin_guide/ddl/ddl-index.html#topic93 인덱스로 묶을 컬럼들의 고유값이 100개에서 100,000개 사이인 경우 효율적이라고 함. selectivity ratio = count( distinct col1 ) / count( col1 ) 이름 같이 high cardinarity data에는 부적합하다고 함 => 이럴땐 B-tree 인덱스를.. 성별같이 범주가 몇.. SW-PRODUCT/개발-데이터분석 2016.11.08
[링크] R을 이용한 텍스트 감정분석. 여론과 감성 발견하기 sentiment_analysis_hyungjunkim.pdf 한글기반으로 토픽모델링 및 신경망에 대한 주제를 다루고 있음. 키워드들과 도형은 있으나... 당연히 설명은 없다.. 감정분석 할일이 혹시라도 있으면 entry point 정도는 될 듯? SW-PRODUCT/개발-데이터분석 2016.09.22
[링크] 쉽게 풀어쓴 딥러닝 http://t-robotics.blogspot.kr/2015/05/deep-learning.html?m=1 언제쯤에나 읽을까... ㅜㅜ SW-PRODUCT/개발-데이터분석 2016.09.20
[링크] 유튜브 비디오 추천: MF 말고 http://keunwoochoi.blogspot.kr/2016/09/deep-neural-networks-for-youtube.html?m=1 SW-PRODUCT/개발-데이터분석 2016.09.07
[링크] 베타분포: 성공확률의 확률 계산하기.. http://m.egloos.zum.com/nullmodel/v/3790240 알고있는 불량:정상 수를 이용해서 증분방식으로 불량률의 확률밀도함수를 구한다. 컨텐츠 추천에서도 활용한단다. SW-PRODUCT/개발-데이터분석 2016.08.26