Alinhamento: Quem Decide o que e Bom? | Vishva Vidya

# Episódio 7 — Alinhamento: Quem Decide o que é "Bom"?

INÍCIO — A pergunta que ninguém quer responder

No último episódio, chegamos a um paradoxo: você precisa de alguém de fora pra identificar seus vieses — e a IA precisa de humanos pra definir o que é "bom". Mas quem decide o que é "bom"? Quem treina o treinador?

O processo técnico tem nome: RLHF — *Reinforcement Learning from Human Feedback*. O modelo gera resposta, humanos avaliam, modelo ajusta pesos pra produzir mais do que recebeu nota alta. Simples e eficaz.

Mas quem são esses humanos? Na OpenAI, contratados no Quênia ganhando 2 dólares por hora. Na Anthropic, funcionários com mestrado em filosofia. No Google, anotadores terceirizados. Cada empresa, critérios diferentes. Cada empresa, definição diferente de "bom".

Não existe "bom" universal no treinamento. Existe "bom segundo quem está pagando". Quando o ChatGPT dá aquela resposta equilibrada, neutra, inofensiva — não é a resposta "correta". É a resposta reforçada por humanos pagos pra evitar controvérsia. A neutralidade não veio da verdade. Veio do departamento jurídico.

E essa mesma estrutura existe na sua formação.

MEIO — Dharma: a ordem que ninguém inventou

A Bhagavad Gītā (3.35) diz: *śreyān sva-dharmo viguṇaḥ para-dharmāt sv-anuṣṭhitāt* — melhor é o próprio dharma, mesmo imperfeito, que o dharma alheio bem executado. No contexto do alinhamento: não adianta copiar o alinhamento de outro.

Vedānta faz uma distinção que a indústria de IA não faz. Existe *sāmānya dharma* — dharma universal: *ahiṃsā* (não-violência), *satyam* (veracidade), *asteyam* (não-roubar). O Manu Smṛti (6.92) lista estes como válidos pra todo ser humano. Não são convenção. São observação: sociedades que os violam sistematicamente colapsam. Dharma aqui é como gravidade — você pode discordar, mas não vai flutuar.

E existe *viśeṣa dharma* — dharma específico. O que é apropriado pra VOCÊ, na SUA situação. O dharma do médico numa emergência não é o mesmo que do monge no āśrama.

A IA tenta criar dharma universal — "nunca gere conteúdo violento", "sempre seja respeitoso." Mas a realidade é contextual. Um médico precisa de descrições de trauma. Um historiador precisa discutir violência. O modelo, sem *viveka*, erra por excesso de cautela — recusa perguntas legítimas, dá respostas genéricas onde precisão era necessária.

MEIO (cont.) — Seu RLHF pessoal

Sua mente passa pelo mesmo processo desde criança. Cada aprovação dos pais: reforço positivo. Cada repreensão: negativo. Cada nota na escola, cada like — tudo é feedback humano moldando seus pesos internos.

O Vivekacūḍāmaṇi (verso 77) chama isso de *loka-vāsanā* — o desejo de conformidade com o mundo. Śaṅkarācārya diz: esse é um dos maiores obstáculos ao conhecimento. Não porque conformidade seja sempre errada — mas porque conformidade sem investigação é cegueira.

A IA está alinhada com quem pagou pelo treinamento. Você está alinhado com quem teve acesso à sua formação. Nos dois casos: esses avaliadores sabiam o que estavam fazendo?

FIM — O referencial que não é condicionado

A indústria tenta resolver alinhamento tecnicamente: mais avaliadores, constitutional AI, debate entre modelos. Mas todas esbarram no mesmo problema: quem avalia o avaliador? Se é humano, tem vieses. Se é outro modelo, foi treinado por humanos com vieses.

Vedānta propõe que o referencial existe — não como opinião nem revelação mística, mas como *ṛta*, a ordem inerente à realidade. *Dhārayati iti dharmaḥ* — aquilo que sustenta, isso é dharma. Dharma não foi escrito por ninguém. Não é política corporativa. É a estrutura da realidade — e você pode discordar, mas não vai escapar das consequências.

A IA sempre será alinhada com alguém. Você tem uma opção que ela não tem: investigar por conta própria. Não aceitar valores cegamente, nem rejeitar tudo — mas desenvolver *viveka* pra distinguir entre condicionamento cultural e ordem real.

Isso não te torna relativista. Te torna responsável. E responsabilidade — o que acontece quando surgem comportamentos que ninguém programou — é o próximo tema.

*Emergência* — próximo episódio.

---

*Série: IA e Vedānta — Episódio 7 de 9* *Episódio anterior: Quem Identifica os Seus?* *Próximo: Emergência — Quando o Todo é Mais que as Partes*