데이터베이스/Elasticsearch

elasticsearch 몇가지 간단 정리

반응형

엘라시틱 서치 간단정리

score 계산 알고리즘

- tf-idf와 bm25 사용 (엘라스틱 서치 5.0 부터는 bm25로 사용한다고 한다.)
https://www.popit.kr/bm25-elasticsearch-5-0%EC%97%90%EC%84%9C-%EA%B2%80%EC%83%89%ED%95%98%EB%8A%94-%EC%83%88%EB%A1%9C%EC%9A%B4-%EB%B0%A9%EB%B2%95/


※최소 만족해야하는 score 지정 min_score

검색된 데이터중에서 score가 6이상인 문서만 추출
https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-min-score.html

1
2
3
4
5
6
7
8
9
10
11
12
GET /ws_play/play/_search
{
  "query": {
    "match": {
      "title": {
          "query" : "dd",
          "minimum_should_match": "50%"
      }
    }
  },
  "min_score": 6
}
cs


※일치하는 term % 지정 (minmum_should_match)
%이상 일치 또는 %이상 불일치 여부에 따라 반환되는 데이터 걸러내기
https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-minimum-should-match.html


※6.4 이후버전부터 기본으로 추가되는 한글 형태소 분석기 노리(nori)
- 기존에 arirang과 은전한닢 그리고 open korean text를 별도로 설치해서 사용했었는데, 6.4부터는 기본으로 탑재



반응형