Ejemplo: Interfaz de chat de Gradio 🤗#

Descripción：

Este ejemplo muestra cómo usar la interfaz de chat Gradio ChatInterface y el LLM local Xinference para construir un chatbot con solo 120 líneas de código.

Tecnologías involucradas:

@ Xinference como servicio de alojamiento de modelos LLM

@ Gradio como interfaz web para el chatbot

Descripción detallada de la función de demostración:

Analiza los argumentos de línea de comandos proporcionados por el usuario para capturar parámetros clave del modelo, como nombre, tamaño, formato y método de cuantización.
Establece la conexión con el framework Xinference y despliega el modelo especificado, asegurándote de que esté listo para la interacción en tiempo real.
Implementa las funciones auxiliares (flatten y to_chat) para procesar y almacenar de manera eficiente las interacciones de chat, asegurando que el modelo tenga el contexto necesario para generar respuestas relevantes.
Usa Gradio para configurar una interfaz de chat interactiva, que permita a los usuarios comunicarse con el modelo en un entorno amigable.
Iniciar la interfaz web de Gradio para que los usuarios puedan comenzar sus sesiones de chat y recibir respuestas generadas por el modelo según sus consultas.

Código fuente

Gradio ChatInterface