Anthropic twierdzi, że jego model Mythos znalazł elegancki dowód na jeden z najstarszych otwartych problemów geometrycznych. To nie jest zwykły test wydajności, lecz realny postęp w automatycznym rozumowaniu.
Problem Erdősa i jego znaczenie w geometrii kombinatorycznej
Problem jednostkowych odległości, postawiony w 1946 roku przez Paula Erdősa, dotyczył maksymalnej liczby punktów na płaszczyźnie przy zachowaniu minimalnych odległości. Przez dekady stanowił wyzwanie dla matematyków na całym świecie. Model Mythos zaproponował alternatywną ścieżkę rozwiązania.
Odkrycie OpenAI z wcześniejszych miesięcy pokazało, że modele językowe potrafią generować nowe układy punktów. Anthropic podeszło do zadania inaczej, wykorzystując wiele równoległych instancji Claude Code. To podejście pozwoliło na eksplorację szerszej przestrzeni rozwiązań.
Jak system agentyczny Anthropic przetwarzał zadanie
Inżynierowie zbudowali środowisko testowe składające się z izolowanych instancji Mythos. Każda instancja rozwijała własne ścieżki rozumowania, a następnie jedna z nich podsumowywała wyniki i przekazywała je dalej. Taki mechanizm przypomina współpracę zespołu badaczy.
W przeciwieństwie do klasycznego użycia modelu, tutaj kluczową rolę odegrała koordynacja wielu agentów. Claude Mythos często wybierał inną drogę niż poprzednie rozwiązanie OpenAI.
Porównanie dowodów Mythos i wcześniejszego modelu OpenAI
Matematyk Daniel Litt ocenił dowód Mythos jako nieco gorszy jakościowo od wersji OpenAI. Jednocześnie Mythos samodzielnie odkrył rozwiązanie przedstawione wcześniej przez konkurencję. To sugeruje, że modele potrafią weryfikować cudze wyniki.
Anthropic opublikowało wersję dowodu przygotowaną przez Opus 4.7. Dokument jest dostępny publicznie i zawiera pełne uzasadnienie matematyczne.
Rola modelu Opus 4.7 w finalizacji dowodu
Choć Mythos wygenerował główne pomysły, ostateczną wersję przygotował starszy model Opus. Kombinacja nowszego i starszego systemu pokazała wartość hybrydowego podejścia. Opus 4.7 uporządkował wnioski i nadał im formalną postać.
Taki podział pracy między modelami może stać się standardem w przyszłych badaniach. Każdy z nich wnosi inne mocne strony do procesu.
Porównanie z podejściem Google DeepMind
DeepMind niedawno ogłosiło rozwiązanie dziewięciu problemów Erdősa przy pomocy systemu opartego na języku Lean. Metoda ta wymaga formalnej weryfikacji, co różni się od czysto tekstowego dowodu Mythos. System DeepMind kosztował zaledwie kilkaset dolarów.
Podejście Anthropic jest bliższe naturalnemu rozumowaniu człowieka. Nie wymaga jednak automatycznej weryfikacji formalnej, co budzi mieszane opinie wśród matematyków.
Implikacje dla rozwoju modeli językowych
Wynik wskazuje na nadmiar mocy obliczeniowej w aktualnych systemach AI. Inżynier Sholto Douglas nazwał to „poważną nadwyżką” (serious overhang) w odkryciach matematycznych. Modele zaczynają rozwiązywać problemy wcześniej dostępne tylko dla ludzi.
Jednocześnie Anthropic nadal ukrywa pełne możliwości Mythos przed szerszą publicznością. To rodzi pytania o rzeczywistą dostępność najnowszych systemów.
Wpływ na rywalizację między laboratoriami AI
OpenAI jako pierwsze opublikowało rozwiązanie, a Anthropic szybko przedstawiło alternatywę. Wcześniejsze osiągnięcie OpenAI stało się punktem odniesienia dla kolejnych prac.
Szybkość pojawiania się nowych dowodów sugeruje, że tempo postępu w matematyce wspomaganej przez AI będzie rosło. Różnorodność podejść zwiększa szanse na dalsze odkrycia.
Źródła:
The Decoder, https://the-decoder.com/claude-mythos-reportedly-solves-openais-landmark-erdos-problem-with-a-cute-simple-proof/, X.com posts by Sholto Douglas