29. Alinhamento de modelos generativos
Sistemas conversacionais precisam obedecer instruções, recusar pedidos perigosos e manter qualidade. Você cobre RLHF, DPO, red teaming, avaliações humanas, políticas de segurança e trade-offs entre utilidade e risco.