SquellSquell
Zpět na archiv
AI svět8. května 2026·7 min čtení

Claude Opus 4.7: Anthropic přepsalo žebříček SWE-benchu

Nový model od Anthropicu zvládá osmihodinové úkoly bez dohledu, na SWE-bench Verified atakuje 87,6 % a cena zůstává stejná. Co to znamená v praxi?

AutorDavid Jurica
Vývojář pracující s AI asistentem na rozsáhlé kódové základně
Foto: Unsplash

Anthropic 16. dubna 2026 vypustil do produkce Claude Opus 4.7. Na první pohled jen drobný číselný posun „čtyřšestkové“ rodiny — ve skutečnosti ale jeden z nejostřejších meziverzových skoků, jaký AI laboratoře za poslední rok ukázaly. A to bez navýšení ceny.

Co se vlastně změnilo

Nejvíc se posunulo softwarové inženýrství. Na SWE-bench Verified, který měří schopnost modelu opravit reálnou chybu v open-source repozitáři, Opus 4.7 dosáhl 87,6 %. Předchůdce Opus 4.6 zvládal 53,4 %, GPT-5.4 podle stejné metriky 57,7 %, Gemini 3.1 Pro 54,2 %. Na obtížnější verzi SWE-bench Pro Anthropic vykazuje 64,3 %.

Kromě benchmarků si Anthropic chválí dvě praktické věci: model dělá třetinu chyb při volání nástrojů oproti 4.6 a o 14 % lépe zvládá vícekrokové agentní řetězce. V praxi to znamená dlouhé úlohy — refaktoring, debugging napříč moduly, čtení velkých kódových bází — bez nutnosti drobit zadání na malé kousky.

Lepší vidění a tvorba dokumentů

Opus 4.7 vidí obrázky ve trojnásobném rozlišení. To není akademický detail: znamená to čitelné screenshoty z designových nástrojů, čitelné chyby v IDE, čitelné tabulky z PDF. K tomu Anthropic přidal kvalitnější výstupy pro UI, slidy a textové dokumenty — oblast, kde předchozí Claude často zůstával u generického vzhledu.

„Uživatelé hlásí, že nejtěžší kódovací práci, která dříve potřebovala blízký dohled, už mohou s důvěrou předat Opus 4.7.“

Anthropic, oficiální oznámení modelu

Cena, kontext a integrace

Sazba zůstává: 5 dolarů za milion vstupních tokenů, 25 dolarů za milion výstupních. Anthropic nabízí 90% slevu při využití prompt cachingu a 50% při dávkovém zpracování. Důležitý detail v drobném písmu: 4.7 používá nový tokenizer, který může stejný text rozdělit do 1,0–1,35× většího počtu tokenů. Reálná faktura tedy nemusí být úplně stejná.

Model je dostupný napříč ekosystémem: API Anthropicu, Amazon Bedrock, Google Cloud Vertex AI a Microsoft Foundry. To je pro firmy v EU klíčové — provoz přes Bedrock ve Frankfurtu nebo Vertex v Belgii řeší většinu otázek datové rezidence.

  • Cena: 5 USD vstup / 25 USD výstup za 1M tokenů
  • SWE-bench Verified: 87,6 % (Opus 4.6: 53,4 %)
  • CursorBench: 70 % (Opus 4.6: 58 %)
  • Třetina chyb při volání nástrojů oproti 4.6
  • Dostupnost: API, Bedrock, Vertex AI, Microsoft Foundry

Bezpečnost: Mythos zůstává za zdí

Anthropic v oznámení otevřeně přiznává, že má interně silnější model jménem Mythos Preview. Ten je ale dostupný jen na pozvánku v rámci Project Glasswing pro defenzivní kybernetické workflow. Důvod je strategický: Mythos umí najít sofistikované zranitelnosti ve velkých kódových bázích s minimální asistencí, a to s sebou nese rizika dvojího užití.

Pro českou agenturu nebo vývojářský tým je Opus 4.7 zajímavý hlavně tím, že posouvá hranici úloh, které dává smysl modelu nechat řešit autonomně. Není to už jen autocomplete — je to seniorní kolega, kterému zadáte ticket.

Co s tím

Pokud používáte Cursor, Windsurf, Claude Code nebo vlastní agentní pipeline, upgrade má smysl ihned — rozdíl 70 % vs 58 % na CursorBench je v denní práci znát. Pokud platíte za Opus 4.6 přes API, počítejte s drobným nárůstem tokenového účtu kvůli novému tokenizeru a otestujte si reálné prompty.

A pokud zatím Claude nepoužíváte, tohle je solidní důvod začít. Konkurence z OpenAI a Googlu na agentní kódování zatím nemá odpověď — a v praktickém vývoji to je jediná disciplína, která nakonec vrací investici.