리랭킹#

Xinference에서 재정렬 모델을 사용하는 방법을 학습합니다.

소개#

주어진 쿼리와 일련의 문서가 있을 때, Rerank는 쿼리와의 의미적 관련성에 따라 문서를 가장 관련성 높은 순에서 낮은 순으로 재정렬합니다. Xinference에서는 Rerank 엔드포인트를 통해 Rerank 모델을 호출하여 일련의 문서를 정렬할 수 있습니다.

빠른 시작#

cURL, OpenAI Client 또는 Xinference를 통해 Rerank API를 사용해 볼 수 있습니다:

curl -X 'POST' \
  'http://<XINFERENCE_HOST>:<XINFERENCE_PORT>/v1/rerank' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "<MODEL_UID>",
    "query": "A man is eating pasta.",
    "documents": [
        "A man is eating food.",
        "A man is eating a piece of bread.",
        "The girl is carrying a baby.",
        "A man is riding a horse.",
        "A woman is playing violin."
    ]
  }'