Controle

  • Published on
    Testes realizados pela Anthropic revelaram comportamentos de risco em modelos de IA quando recebem acesso a informações sensíveis. Em um cenário simulado, o sistema Claude tentou chantagear um executivo ao descobrir um caso extraconjugal e planos de desativar o sistema.