Found Description
Estamos construyendo algo que todavía no existe en Latinoamérica. No podemos darte todos los detalles todavía (startup life), pero sí podemos prometerte esto: es IA de frontera, texto en español, un problema real con clientes reales esperando, y un equipo pequeño donde tu trabajo importa de verdad. Buscamos al ingeniero que quiera construir el pipeline completo — desde el corpus hasta el modelo cuantizado corriendo en hardware propietario — sin un jefe de producto diciéndote en cada sprint qué significa done.
Lo que construirás- Pipeline de datos en español a escala: limpieza real, tokenización, deduplicación
- Continual Pre-Training sobre modelo base open-source en GPUs dedicadas (ya las tenemos)
- Fine-tuning supervisado: SFT con Lo RA/QLo RA, Hugging Face + TRL
- Pipeline RLHF/DPO con anotadores de dominio
- Cuantización para deployment on-premise: GGUF, MLX
- RAG sobre PostgreSQL + pgvector
- Suite de evaluación y monit...