Czy Mythos naprawdę rozwiązał problem Erdősa?

Tak, według doniesień inżynierów Anthropic model przedstawił prosty i poprawny dowód. Wersja ta została opublikowana przez Opus 4.7.

Jakie jest znaczenie tego osiągnięcia dla matematyki?

Pokazuje ono, że modele językowe potrafią generować nowe dowody na otwarte problemy geometryczne. To rozszerza zakres zadań dostępnych dla sztucznej inteligencji.

Dlaczego DeepMind użyło innego podejścia?

Ich system opiera się na formalnym języku Lean, co umożliwia automatyczną weryfikację. Podejście Anthropic jest bardziej tekstowe i mniej formalne.

Czy Mythos jest dostępny publicznie?

Nie, firma nadal ogranicza dostęp do pełnej wersji modelu. Publikuje jedynie wybrane wyniki badań.

Claude Mythos rozwiązuje problem Erdősa. Czy Anthropic wyprzedza OpenAI w matematyce?

Anthropic twierdzi, że jego model Mythos znalazł elegancki dowód na jeden z najstarszych otwartych problemów geometrycznych. To nie jest zwykły test wydajności, lecz realny postęp w automatycznym rozumowaniu.

Problem Erdősa i jego znaczenie w geometrii kombinatorycznej

Problem jednostkowych odległości, postawiony w 1946 roku przez Paula Erdősa, dotyczył maksymalnej liczby punktów na płaszczyźnie przy zachowaniu minimalnych odległości. Przez dekady stanowił wyzwanie dla matematyków na całym świecie. Model Mythos zaproponował alternatywną ścieżkę rozwiązania.

Odkrycie OpenAI z wcześniejszych miesięcy pokazało, że modele językowe potrafią generować nowe układy punktów. Anthropic podeszło do zadania inaczej, wykorzystując wiele równoległych instancji Claude Code. To podejście pozwoliło na eksplorację szerszej przestrzeni rozwiązań.

Jak system agentyczny Anthropic przetwarzał zadanie

Inżynierowie zbudowali środowisko testowe składające się z izolowanych instancji Mythos. Każda instancja rozwijała własne ścieżki rozumowania, a następnie jedna z nich podsumowywała wyniki i przekazywała je dalej. Taki mechanizm przypomina współpracę zespołu badaczy.

W przeciwieństwie do klasycznego użycia modelu, tutaj kluczową rolę odegrała koordynacja wielu agentów. Claude Mythos często wybierał inną drogę niż poprzednie rozwiązanie OpenAI.

Porównanie dowodów Mythos i wcześniejszego modelu OpenAI

Matematyk Daniel Litt ocenił dowód Mythos jako nieco gorszy jakościowo od wersji OpenAI. Jednocześnie Mythos samodzielnie odkrył rozwiązanie przedstawione wcześniej przez konkurencję. To sugeruje, że modele potrafią weryfikować cudze wyniki.

Anthropic opublikowało wersję dowodu przygotowaną przez Opus 4.7. Dokument jest dostępny publicznie i zawiera pełne uzasadnienie matematyczne.

Rola modelu Opus 4.7 w finalizacji dowodu

Choć Mythos wygenerował główne pomysły, ostateczną wersję przygotował starszy model Opus. Kombinacja nowszego i starszego systemu pokazała wartość hybrydowego podejścia. Opus 4.7 uporządkował wnioski i nadał im formalną postać.

Taki podział pracy między modelami może stać się standardem w przyszłych badaniach. Każdy z nich wnosi inne mocne strony do procesu.

Porównanie z podejściem Google DeepMind

DeepMind niedawno ogłosiło rozwiązanie dziewięciu problemów Erdősa przy pomocy systemu opartego na języku Lean. Metoda ta wymaga formalnej weryfikacji, co różni się od czysto tekstowego dowodu Mythos. System DeepMind kosztował zaledwie kilkaset dolarów.

Podejście Anthropic jest bliższe naturalnemu rozumowaniu człowieka. Nie wymaga jednak automatycznej weryfikacji formalnej, co budzi mieszane opinie wśród matematyków.

Implikacje dla rozwoju modeli językowych

Wynik wskazuje na nadmiar mocy obliczeniowej w aktualnych systemach AI. Inżynier Sholto Douglas nazwał to „poważną nadwyżką” (serious overhang) w odkryciach matematycznych. Modele zaczynają rozwiązywać problemy wcześniej dostępne tylko dla ludzi.

Jednocześnie Anthropic nadal ukrywa pełne możliwości Mythos przed szerszą publicznością. To rodzi pytania o rzeczywistą dostępność najnowszych systemów.

Wpływ na rywalizację między laboratoriami AI

OpenAI jako pierwsze opublikowało rozwiązanie, a Anthropic szybko przedstawiło alternatywę. Wcześniejsze osiągnięcie OpenAI stało się punktem odniesienia dla kolejnych prac.

Szybkość pojawiania się nowych dowodów sugeruje, że tempo postępu w matematyce wspomaganej przez AI będzie rosło. Różnorodność podejść zwiększa szanse na dalsze odkrycia.

Źródła:

The Decoder, https://the-decoder.com/claude-mythos-reportedly-solves-openais-landmark-erdos-problem-with-a-cute-simple-proof/, X.com posts by Sholto Douglas