Found Description
Estamos construyendo algo que todavía no existe en Latinoamérica. No podemos darte todos los detalles todavía (startup life), pero sí podemos prometerte esto: es IA de frontera, texto en español, un problema real con clientes reales esperando, y un equipo pequeño donde tu trabajo importa de verdad.
Lo que construirás- Pipeline de datos en español a escala: limpieza real, tokenización, deduplicación
- Continual Pre‑Training sobre modelo base open‑source en GPUs dedicadas (ya las tenemos)
- Fine‑tuning supervisado: SFT con Lo RA/QLo RA, Hugging Face + TRL
- Pipeline RLHF/DPO con anotadores de dominio
- Cuantización para deployment on‑premise: GGUF, MLX
- RAG sobre Postgre SQL + pgvector
- Suite de evaluación y monitoreo de calidad
- Python avanzado
- PyTorch + Hugging Face Transformers (experiencia real)
- Fine‑tuning de LLMs: SFT, Lo RA, QLo RA ...