Podczas finałowego dnia kampanii „12 dni OpenAI” CEO firmy, Sam Altman, ogłosił wprowadzenie najnowszych modeli sztucznej inteligencji – o3 oraz o3-mini. Modele te bazują na poprzednich wersjach o1, ale wprowadzają zaawansowaną funkcję „symulowanego rozumowania” (ang. simulated reasoning, SR), która przenosi możliwości sztucznej inteligencji na nowy poziom.
Co wyróżnia modele o3?
Modele o3 i o3-mini korzystają z tzw. „prywatnego łańcucha myśli” (ang. private chain of thought). Pozwala to modelowi analizować swój wewnętrzny dialog i planować odpowiedzi przed ich udzieleniem. Dzięki temu AI jest w stanie wykazywać się czymś zbliżonym do ludzkiego rozumowania, co wykracza poza możliwości tradycyjnych dużych modeli językowych (LLM).
OpenAI poinformowało, że o3 osiągnął rekordowe wyniki na benchmarku ARC-AGI, dedykowanym wizualnemu rozumowaniu. W niskokomputerowych scenariuszach model uzyskał 75,7%, a w wysokokomputerowych aż 87,5% – wynik porównywalny z ludzką wydajnością na poziomie 85%.
Model osiągnął również 96,7% na egzaminie American Invitational Mathematics Exam 2024, tracąc tylko jeden punkt. Na benchmarku GPQA Diamond, obejmującym pytania z biologii, fizyki i chemii na poziomie studiów, zdobył 87,7%. W przypadku Frontier Math, opracowanego przez EpochAI, o3 rozwiązał 25,2% zadań – wynik, który znacząco przewyższa dotychczasowy rekord wynoszący 2%.
o3-mini – innowacyjny model z adaptacyjnym czasem przetwarzania
Oprócz o3 OpenAI zaprezentowało również o3-mini, wersję zoptymalizowaną pod kątem elastyczności. Model ten posiada funkcję adaptacyjnego czasu przetwarzania, umożliwiającą wybór między niską, średnią a wysoką mocą obliczeniową, co pozwala dostosować szybkość działania do potrzeb użytkownika. Na benchmarku Codeforces o3-mini znacząco przewyższył swojego poprzednika, model o1.
Symulowane rozumowanie – przyszłość sztucznej inteligencji
Ogłoszenie modeli o3 i o3-mini to odpowiedź OpenAI na rosnącą konkurencję w obszarze symulowanego rozumowania. W ostatnich miesiącach inne firmy technologiczne zaprezentowały własne rozwiązania SR, w tym Google z Gemini 2.0 Flash Thinking Experimental, DeepSeek z modelem DeepSeek-R1 oraz Alibaba z Qwen-QwQ, pierwszą otwartą alternatywą dla o1.
Modele SR wprowadzają nowatorskie podejście do AI, koncentrując się na poprawie zdolności rozumowania w czasie rzeczywistym zamiast na kosztownym i mniej efektywnym procesie szkolenia modeli.
OpenAI udostępni swoje nowe modele SR najpierw badaczom bezpieczeństwa w celu przeprowadzenia testów. Premiera o3-mini zaplanowana jest na koniec stycznia 2025 roku, a pełnowymiarowy model o3 ma zadebiutować wkrótce po nim.