반응형
엘라시틱 서치 간단정리
※score 계산 알고리즘
- tf-idf와 bm25 사용 (엘라스틱 서치 5.0 부터는 bm25로 사용한다고 한다.)
https://www.popit.kr/bm25-elasticsearch-5-0%EC%97%90%EC%84%9C-%EA%B2%80%EC%83%89%ED%95%98%EB%8A%94-%EC%83%88%EB%A1%9C%EC%9A%B4-%EB%B0%A9%EB%B2%95/
※최소 만족해야하는 score 지정 min_score
검색된 데이터중에서 score가 6이상인 문서만 추출
https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-min-score.html
1 2 3 4 5 6 7 8 9 10 11 12 | GET /ws_play/play/_search { "query": { "match": { "title": { "query" : "dd", "minimum_should_match": "50%" } } }, "min_score": 6 } | cs |
※일치하는 term % 지정 (minmum_should_match)
%이상 일치 또는 %이상 불일치 여부에 따라 반환되는 데이터 걸러내기
https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-minimum-should-match.html
※6.4 이후버전부터 기본으로 추가되는 한글 형태소 분석기 노리(nori)
- 기존에 arirang과 은전한닢 그리고 open korean text를 별도로 설치해서 사용했었는데, 6.4부터는 기본으로 탑재
반응형
'데이터베이스 > Elasticsearch' 카테고리의 다른 글
엘라스틱 서치 (elasticsearch) fielddata (0) | 2018.10.06 |
---|---|
elasticsearch percolating 쿼리 (0) | 2018.10.06 |
elasticsearch session timeout 이슈 (0) | 2018.10.06 |
Elasticsearch 한글 형태소 설치 및 사용 (0) | 2018.10.06 |
elasticsearch multi type 기능 제거 이슈 (0) | 2018.10.06 |