Negócios
Sem categoria
Agentes de IA, AI, Anthropic, Anthropic Claude, Automação Inteligente, Benchmark de IA, Biotecnologia, Cibersegurança, Claude AI, Claude Fable, Claude Fable 5, Claude Mythos, Claude Mythos 5, Deep Learning, Design de Medicamentos, Engenharia de Software, Ferramentas de IA, Frontier Models, Futuro da IA, IA Avançada, IA Generativa, IA para Empresas, Inovação, inteligência artificial, Inteligência Artificial 2026, LLM, Machine Learning, Melhores IAs do Mundo, Modelos de IA, Neuriz, neuriz.com, Novidades em IA, Pesquisa Científica, Plataforma de IA, Produtividade com IA, Programação com IA, Raciocínio Avançado, Tecnologia, Transformação Digital, Visão Computacional
neuriz
0 Comentários
Anthropic lança Claude Fable 5 e Mythos 5 com avanços em programação, visão e pesquisa científica

A Anthropic anunciou o lançamento do Claude Fable 5, um novo modelo de inteligência artificial da categoria Mythos desenvolvido para oferecer capacidades avançadas com padrões elevados de segurança para uso amplo.
O Fable 5 representa um salto significativo em desempenho, superando os modelos anteriormente disponibilizados pela empresa em diversas avaliações de inteligência artificial. O modelo se destaca especialmente em áreas como desenvolvimento de software, raciocínio analítico, interpretação de imagens, pesquisa científica e execução de tarefas complexas de longa duração, apresentando ganhos ainda mais evidentes em projetos extensos e multifacetados.
Com o aumento das capacidades também surgem novos desafios de segurança. Para reduzir riscos de uso indevido em áreas sensíveis, como cibersegurança, a Anthropic implementou mecanismos adicionais de proteção. Em determinadas situações, solicitações consideradas mais delicadas podem ser direcionadas automaticamente para o Claude Opus 4.8, garantindo uma experiência segura sem comprometer a utilidade da plataforma. Segundo a empresa, esses mecanismos são acionados em uma pequena parcela das interações e continuarão sendo aprimorados para reduzir ocorrências desnecessárias.
Além do Fable 5, a Anthropic também apresentou o Claude Mythos 5, uma versão destinada inicialmente a especialistas em segurança cibernética e parceiros de infraestrutura crítica. Embora compartilhe a mesma base tecnológica do Fable 5, o Mythos 5 opera com restrições ajustadas em contextos específicos, permitindo análises mais avançadas para profissionais autorizados. O modelo está sendo disponibilizado por meio do Projeto Glasswing, iniciativa desenvolvida em parceria com o governo dos Estados Unidos.
A empresa acredita que modelos dessa nova geração podem gerar impactos positivos significativos em diversos setores. Entre os exemplos citados estão a proteção de sistemas críticos contra ameaças digitais e o avanço de pesquisas em ciências da vida, incluindo a formulação de hipóteses científicas e a aceleração do desenvolvimento de novas terapias.
O Claude Fable 5 e o Claude Mythos 5 chegam ao mercado com uma estrutura de preços mais acessível do que a geração anterior, reforçando o objetivo da Anthropic de ampliar o acesso a recursos avançados de inteligência artificial de maneira responsável e segura.
Avaliação do Claude Fable 5 e do Claude Mythos 5
A comparação abaixo apresenta como o Claude Fable 5 e o Claude Mythos 5 se posicionam em relação aos principais modelos de inteligência artificial disponíveis atualmente no mercado.

Mais autonomia e desempenho para tarefas complexas
O Claude Fable 5 e o Claude Mythos 5 foram desenvolvidos para executar tarefas de forma autônoma por períodos significativamente maiores do que as gerações anteriores do Claude. Essa evolução amplia sua capacidade de atuar em áreas como desenvolvimento de software, análise avançada, interpretação visual, memória contextual e pesquisa científica.
Engenharia de software
Um dos destaques do Fable 5 é seu desempenho em programação. Durante os testes iniciais, a Stripe observou que o modelo foi capaz de realizar em poucos dias atividades que normalmente exigiriam meses de trabalho humano. Em um projeto envolvendo uma base de código Ruby com cerca de 50 milhões de linhas, o Fable 5 concluiu uma migração completa em apenas um dia — uma tarefa que demandaria mais de dois meses para uma equipe de desenvolvedores.
Além da velocidade, o modelo também se mostrou mais eficiente no uso de tokens. Na avaliação FrontierCode, da Cognition, que mede a capacidade dos modelos de resolver desafios complexos de programação mantendo padrões profissionais de qualidade, o Fable 5 alcançou um dos melhores resultados já registrados entre os modelos de IA de última geração.


Trabalho intelectual e visão computacional
O Claude Fable 5 apresenta avanços significativos em tarefas que exigem raciocínio avançado e análise de informações complexas. Em avaliações voltadas para o mercado financeiro e tomada de decisões estratégicas, o modelo demonstrou excelente capacidade de interpretar documentos, analisar gráficos e tabelas, identificar padrões e resolver problemas sofisticados. Os resultados também destacaram seu desempenho em pesquisa de informações, raciocínio conceitual, análise de causas e avaliação de cenários.
Visão computacional
O Fable 5 também estabelece um novo patamar em tarefas baseadas em imagens. O modelo consegue extrair dados precisos de gráficos científicos complexos, compreender conteúdos visuais detalhados e até reconstruir aplicações web a partir de simples capturas de tela. Além disso, sua compreensão visual evoluiu a ponto de executar tarefas complexas utilizando apenas informações visuais, reduzindo a necessidade de ferramentas auxiliares e ampliando sua autonomia em ambientes digitais.
Desenvolvimento de fármacos: Utilizando o Mythos 5, nossos especialistas internos em design de proteínas aceleraram aspectos do processo de desenvolvimento de fármacos em cerca de dez vezes. Em um exemplo, eles descobriram que o Mythos 5, com ferramentas de design de proteínas e bioinformática, mas sem assistência humana, iguala ou supera operadores humanos qualificados. Dessa forma, o modelo executa todas as tarefas normalmente realizadas por um cientista: escolha de sítios de ligação, seleção e execução de ferramentas de design de proteínas e recuperação de falhas ao longo do processo. Nove dos 14 alvos proteicos deste estudo (mostrados abaixo) revelaram-se fortes candidatos para o desenvolvimento de fármacos, que estamos atualmente investigando.

Novas hipóteses em biologia molecular. O Mythos 5 é o nosso primeiro modelo a produzir consistentemente hipóteses científicas novas e convincentes. Em comparações diretas e às cegas com modelos da classe Opus, nossos cientistas preferiram as hipóteses de biologia molecular do Mythos em cerca de 80% dos casos e avançaram várias delas para avaliação experimental. Enquanto isso, uma hipótese do Mythos — um novo mecanismo para uma proteína de E. coli — foi corroborada em um estudo de um laboratório independente que trabalhava no mesmo problema.
Pesquisa inovadora em genômica. O Mythos 5 conduziu uma pesquisa inovadora em genômica em pouco mais de uma semana de trabalho em grande parte autônomo. Ele compilou dados de células individuais de milhões de células abrangendo 138 espécies animais e projetou e treinou um modelo personalizado de aprendizado de máquina para identificar células que desempenham a mesma função em organismos até mesmo distantemente relacionados. Com apenas intervenção humana de alto nível, o modelo treinado pelo Mythos 5 superou um modelo recente publicado na revista Science — apesar de ser 100 vezes menor. Pretendemos publicar esses resultados nos próximos meses.
Alinhamento . Em nossa avaliação automatizada de alinhamento, descobrimos que o nível de comportamento desalinhado do Mythos 5 (incluindo ações desalinhadas tomadas pelo modelo, como engano e cooperação com o uso indevido do modelo por um usuário) era baixo e semelhante ao do Opus 4.8. Dado que ambos utilizam o mesmo modelo subjacente, o nível de alinhamento do Fable 5 será similar. A avaliação é descrita na íntegra, juntamente com um conjunto detalhado de outros testes de segurança e capacidades, na ficha técnica do modelo .

Primeiras impressões sobre Claude Fable 5
Os clientes que tiveram acesso antecipado realizaram seus próprios testes no Fable 5. Abaixo, em suas próprias palavras, está uma seleção do que eles observaram:
Novas medidas de segurança de Claude em Fable 5
Os modelos da classe Mythos atingiram um limite em que apresentam riscos significativos. Em abril, iniciamos o Projeto Glasswing , lançando o primeiro modelo da classe Mythos (Claude Mythos Preview) apenas para um grupo limitado de especialistas em segurança cibernética e fornecedores de infraestrutura de software crítica. Na ocasião, declaramos que esperávamos, eventualmente, disponibilizar recursos do nível Mythos para todos os nossos usuários , desde que tivéssemos desenvolvido novas salvaguardas suficientemente robustas para impedir o uso indevido de forma confiável.
Nos últimos meses, temos aprimorado essas medidas de segurança, e agora elas são robustas o suficiente para um lançamento geral. Como priorizamos a segurança, ajustamos as medidas de segurança para serem cautelosas, e elas ainda são mais rigorosas do que o ideal — por exemplo, às vezes, solicitações benignas acionam nossos classificadores. Reconhecemos que isso será frustrante para alguns usuários, e nosso objetivo é reduzir os falsos positivos à medida que atualizamos e refinamos as medidas de segurança após o lançamento.
A seguir, discutiremos cada uma das novas medidas de segurança do Fable 5. Nosso conjunto mais amplo de medidas de segurança é discutido e avaliado na ficha do sistema do modelo e em nosso relatório de riscos mais recente .
Classificadores de segurança
As capacidades de ponta em cibersegurança e biologia científica dos modelos da classe Mythos representam um risco substancial de exploração por agentes maliciosos. Ou seja, esses modelos podem fornecer informações ou conselhos que auxiliem esses agentes a causar danos graves que não poderiam ter obtido de outras fontes (por exemplo, de mecanismos de busca na internet). Além disso, grande parte do uso avançado de modelos de IA tem dupla finalidade: as mesmas consultas que são benéficas para profissionais de cibersegurança e pesquisadores da área de biologia podem ser perigosas se estiverem disponíveis para agentes maliciosos.
Portanto, precisamos de fortes salvaguardas para evitar o uso indevido, e sua abrangência precisa ser ampla. As próprias salvaguardas devem resistir a tentativas persistentes e sofisticadas de contorná-las (também conhecidas como “quebra de segurança” do sistema). O aprimoramento proporcionado pelas capacidades do nível Mythos é valioso para muitos adversários — por exemplo, aqueles que poderiam obter ganhos financeiros com ataques cibernéticos — e, portanto, esperamos que eles estejam motivados a tentar burlar nossas medidas de segurança.
Fable 5 vem com um novo conjunto de classificadores : sistemas de IA independentes que detectam possíveis usos indevidos, incluindo tentativas de desbloqueio (jailbreak), e impedem que o modelo principal (neste caso, Fable 5) responda. Já vínhamos utilizando classificadores em nossos modelos há algum tempo , e os classificadores de Fable 5 são uma extensão desse trabalho anterior, com cobertura adicional.
Quando os classificadores do Fable detectam uma solicitação relacionada à segurança cibernética, biologia e química ou destilação, a resposta é automaticamente tratada pelo Claude Opus 4.8. Os usuários serão informados sempre que isso ocorrer. O Opus 4.8 é um modelo altamente capaz por si só: uma resposta que recorre ao Opus proporciona uma experiência muito melhor do que uma recusa direta do Fable. Nossos dados iniciais mostram que mais de 95% das sessões do Fable não envolvem nenhum mecanismo de fallback — nessas sessões, o desempenho do Fable 5 é praticamente o mesmo do Mythos 5.
As áreas abrangidas pelos classificadores são as seguintes:
1. Segurança cibernética . Os modelos da classe Mythos se destacam na descoberta e exploração de vulnerabilidades de software. Dessa forma, podem tornar os ataques cibernéticos substancialmente mais fáceis e baratos de serem cometidos. Os modelos da classe Mythos também demonstram grande habilidade em hacking agente. Isso envolve a execução de diversas etapas de um ataque cibernético, além da busca por exploits — reconhecimento, descoberta, movimentação lateral e muito mais. Para impedir que essas habilidades de hacking agente proporcionem vantagens nos ataques cibernéticos, projetamos nossos classificadores de segurança cibernética para abranger tarefas cibernéticas de exploração e ofensivas em um sentido mais amplo. Como mostrado no gráfico abaixo, nossos classificadores impedem que o Fable faça qualquer progresso nessas tarefas.

Realizamos extensos testes de intrusão em nossos classificadores para verificar sua robustez contra jailbreaks. Além dos testes internos, realizamos um programa externo de recompensas por bugs que não resultou em nenhum jailbreak universal em mais de 1.000 horas de testes. Organizações externas de testes de intrusão que contratamos também não conseguiram encontrar nenhum jailbreak universal em tarefas de agentes de formato longo até o momento — embora o AISI do Reino Unido tenha feito progressos em direção a um durante um breve período inicial de testes.⁴ É provavelmente impossível impedir completamente jailbreaks universais, mas nosso objetivo é tornar quaisquer jailbreaks restantes suficientemente lentos e custosos para que possamos detectá-los e impedi-los antes que sejam usados em larga escala.
O gráfico abaixo, de uma de nossas avaliações internas, ilustra como as medidas de segurança do Fable 5 conferem a ele maior resistência a desbloqueios do que nossos modelos anteriores, que eram de acesso geral:

Um de nossos parceiros externos descobriu que as salvaguardas do Fable 5 contra consultas cibernéticas maliciosas eram as mais robustas de todos os modelos testados (incluindo Opus 4.8 e Opus 4.7). O Fable 5 não apresentou nenhuma resposta a solicitações maliciosas de resposta única relacionadas ao planejamento de um ataque cibernético, desenvolvimento de exploits ou evasão de defesa. Isso se manteve independentemente de uma das solicitações ter utilizado alguma das 30 técnicas de jailbreak públicas diferentes.
2. Biologia e química. Há muito tempo usamos nossos classificadores para impedir que nossos modelos respondam a uma seleção restrita de consultas relacionadas a armas biológicas. Mas já não temos certeza de que bloquear essa seleção restrita seja suficiente. Isso se deve a dois motivos: primeiro, temos motivos para nos preocuparmos com agentes maliciosos bem financiados que tentam obter vantagens de nossos modelos para pesquisas biológicas de alto risco. Segundo, os modelos agora têm uma capacidade maior de realizar tarefas científicas do mundo real.
Por exemplo, testamos a capacidade do Mythos 5 de concluir uma etapa desafiadora no projeto de vírus adeno-associados (AAVs). Os AAVs são um componente para a administração de terapias gênicas, mas essa mesma capacidade, em mãos erradas, poderia permitir o desenvolvimento de vírus perigosos. Nessa tarefa, vários modelos de IA foram avaliados quanto à sua capacidade de prever como uma modificação genética impactaria a montagem da camada externa do vírus (entre um conjunto de candidatos terapeuticamente relevantes e ainda não publicados, desenvolvidos pela Dyno Therapeutics ). Não treinamos explicitamente nossos modelos para realizar essa tarefa — e, ainda assim, os modelos da classe Mythos superaram modelos sofisticados dedicados a tarefas com proteínas (conhecidos como “modelos de linguagem de proteínas”) usando apenas seu raciocínio biológico. Isso demonstra uma capacidade promissora de concluir tarefas simples, porém importantes, na pesquisa e desenvolvimento de terapia gênica — mas também destaca o risco representado por tais capacidades de uso duplo.

Nossa prioridade era lançar o Fable com segurança o mais rápido possível, mesmo que isso significasse salvaguardas excessivamente amplas. Portanto, por enquanto, configuramos o Fable para utilizar o Opus 4.8 na maioria das solicitações relacionadas à biologia e à química. Como acontece com todos os nossos classificadores, esperamos restringir essas salvaguardas o mais breve possível: como pode ser observado pelas evidências acima, existe um grande potencial para aplicações positivas do Fable na ciência, e não queremos que falsos positivos de nossos classificadores atrapalhem esse processo. Nas próximas semanas, alguns pesquisadores e empresas biomédicas poderão participar do nosso programa de acesso confiável para recursos de biologia no Mythos 5 (descrito abaixo).
3. Destilação . Já identificamos tentativas em larga escala de extrair (“destilar”) as capacidades de Claude para treinar modelos concorrentes em países autoritários. A destilação das habilidades de Fable 5 poderia levar indiretamente à proliferação de capacidades de IA quase de ponta — e estas poderiam ser liberadas sem as devidas salvaguardas. Solicitações sinalizadas por nossos classificadores como parte de tais tentativas de destilação serão encaminhadas para o Opus 4.8.
Uma nova política de retenção de dados
Por fim, estamos alterando a forma como lidamos com os dados de clientes corporativos para o Fable 5, Mythos 5 e futuros modelos com níveis de capacidade semelhantes ou superiores. Exigiremos retenção de 30 dias para todo o tráfego em modelos da classe Mythos, tanto em plataformas próprias quanto de terceiros. Não usaremos esses dados para treinar novos modelos Claude, nem para qualquer finalidade não relacionada à segurança, e implementamos novas proteções de privacidade, incluindo o registro de todo acesso humano aos dados e a garantia de sua exclusão após 30 dias em quase todos os casos (consulte esta publicação para obter mais detalhes). Os dados nos ajudarão a nos defender contra ataques complexos e inéditos (incluindo novos jailbreaks e ataques que operam em várias requisições), bem como a identificar e reduzir falsos positivos.
Claude Mythos 5 e o programa de acesso confiável
A partir de hoje, todos os usuários que atualmente têm acesso ao Claude Mythos Preview (por exemplo, nossos parceiros de cibersegurança no Projeto Glasswing) poderão atualizar para o Claude Mythos 5 — o mesmo modelo do Claude Fable 5, mas com as proteções cibernéticas removidas. Os usuários acharão o Mythos 5 comparável ou até um pouco mais robusto que o Mythos Preview na maioria dos casos, por um preço consideravelmente menor.
Em consulta com o governo dos EUA, planejamos expandir gradualmente o acesso ao Claude Mythos 5, continuando com a adição periódica de novos parceiros, bem como buscando um programa de acesso confiável que permita que organizações de segurança cibernética se candidatem de maneira mais sistemática.
Nossos planos também incluem a abertura de um programa de acesso confiável para biologia, para ajudar a acelerar a pesquisa biomédica e descobrir novas terapias com capacidades semelhantes às do Mythos. Este programa fornecerá acesso ao Fable 5 com as salvaguardas de biologia e química removidas (mas as salvaguardas cibernéticas permanecerão em vigor). Ele recrutará um pequeno número de pesquisadores de diversas organizações de ciências da vida, abrangendo pesquisa fundamental e translacional; planejamos expandir o acesso a este programa, ao mesmo tempo em que aprimoramos nossas salvaguardas.
Disponibilidade
Claude Fable 5 já está disponível na plataforma https://neuriz.com e mais outros diversos modelos de IA de chat, imagens, aúdio e vídeo.



Publicar comentário