Desarrolladores de Python
Cualquiera con conocimientos intermedios de Python que esté interesado en aprender sobre el uso de la técnica de Aprendizaje por Refuerzo a partir de Retroalimentación Humana.
Entusiastas de la IA
Individuos que buscan entender cómo alinear modelos de lenguaje grandes con valores y preferencias humanas.
Científicos de Datos
Profesionales que buscan ajustar modelos de lenguaje utilizando técnicas avanzadas como RLHF.