Backend Developer
~80% LLM cost ↓
AI Wisdom (AI Support Platform API)
Plataforma backend para chatbots de soporte al cliente con LLM (Ollama) y RAG (embeddings + búsqueda vectorial con pgvector).
Highlights
- Arquitectura e implementación de pipelines RAG para soporte (ingestión, embeddings, retrieval y respuesta)
- Búsqueda vectorial en PostgreSQL (pgvector) para recuperar contexto relevante
- Optimización de costos de respuesta del LLM (~80%) vía retrieval-first y control de contexto
- API multi-tenant: cada request requiere API key + tenant identifier
RAG flow
Docs/KB → chunking → embeddings
↓
pgvector search (top-k)
↓
context assembly + prompt
↓
LLM (Ollama) response
Access
This API is multi-tenant and requires an API key + tenant identifier on every request (no public “try it”).