Reordenamiento#

Aprende a utilizar modelos de reordenación en Xinference.

Introducción#

Dada una consulta y una serie de documentos, Rerank reordena los documentos de mayor a menor relevancia semántica con respecto a la consulta. En Xinference, se puede invocar un modelo Rerank a través del endpoint Rerank para clasificar una serie de documentos.

Inicio rápido#

Podemos probar la API de Rerank mediante cURL, OpenAI Client o Xinference:

curl -X 'POST' \
  'http://<XINFERENCE_HOST>:<XINFERENCE_PORT>/v1/rerank' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "<MODEL_UID>",
    "query": "A man is eating pasta.",
    "documents": [
        "A man is eating food.",
        "A man is eating a piece of bread.",
        "The girl is carrying a baby.",
        "A man is riding a horse.",
        "A woman is playing violin."
    ]
  }'