English
русский
Українська

Currency

Sześć najbardziej zaawansowanych modeli sztucznej inteligencji nie zdało testów matematycznych na poziomie badawczym: najlepszy wynik wyniósł zaledwie 2%

Inna VasilyukWiadomości
Najbardziej zaawansowana sztuczna inteligencja rozwiązała tylko 2% zadań. Źródło: Freepik

Matematycy opracowali nowe problemy w celu przetestowania umiejętności rozumowania sześciu najbardziej zaawansowanych modeli sztucznej inteligencji. Jednak sztuczna inteligencja nie zdała prawie wszystkich testów.

Nowoczesne modele sztucznej inteligencji mają trudności z rozwiązywaniem problemów matematycznych na poziomie badawczym. Nawet najbardziej zaawansowane systemy sztucznej inteligencji są w stanie rozwiązać tylko 2% z setek problemów, przed którymi stają, pisze LiveScience.

Według instytutu badawczego Epoch AI, matematykom ze stopniem doktora rozwiązywanie złożonych problemów zajmuje zwykle godziny lub dni. Najbardziej zaawansowane modele sztucznej inteligencji są w stanie rozwiązać mniej niż 2% z nich.

W ciągu ostatniej dekady opracowano szereg testów sztucznej inteligencji, a w wielu przypadkach modele AI z łatwością przechodzą te testy, twierdzą naukowcy. Na przykład w standardowym teście MMLU (Measuring Massive Multitask Language Understanding) nowoczesne modele AI odpowiadają poprawnie na 98% problemów matematycznych.

Większość z tych testów ma na celu sprawdzenie zdolności sztucznej inteligencji do wykonywania zadań matematycznych na poziomie szkoły średniej i college'u, pisze Elliot Glazer, matematyk z Epoch AI.

Jednak nowy zestaw testów o nazwie FrontierMath jest skierowany na wyższy poziom rozumowania. Epoch AI opracowała pytania z pomocą profesorów matematyki. Według twórców testy obejmują szeroki zakres poddziedzin, od teorii liczb po geometrię algebraiczną.

Odkrycia naukowców pokazują, że obecnie modele sztucznej inteligencji nie mają rozumowania matematycznego na poziomie badawczym. Jednak w miarę rozwoju sztucznej inteligencji te testy porównawcze zapewnią sposób sprawdzenia, czy ich zdolności rozumowania są coraz głębsze.

"Regularnie oceniając najnowocześniejsze modele i współpracując ze społecznością badawczą AI, dążymy do pogłębienia naszego zrozumienia możliwości i ograniczeń AI" - powiedział zespół naukowców.

Tylko zweryfikowane informacje są dostępne na kanale OBOZ.UA Telegram i Viber. Nie daj się nabrać na podróbki!

Inne wiadomości

Były ambasador w Wielkiej Brytanii ocenił perspektywy przystąpienia Ukrainy do NATO. Wideo

Były ambasador w Wielkiej Brytanii ocenił perspektywy przystąpienia Ukrainy do NATO. Wideo

Przypomniał, co mówi artykuł 6 Traktatu Północnoatlantyckiego
Niedoceniany kolor manicure został uznany za jeden z najlepszych wyborów tej zimy

Niedoceniany kolor manicure został uznany za jeden z najlepszych wyborów tej zimy

Śliwkowy odcień w manicure to symbol zimy
Lepsze niż dżinsy: Bella Hadid prezentuje nowy look z modnymi spodniami

Lepsze niż dżinsy: Bella Hadid prezentuje nowy look z modnymi spodniami

Skórzane spodnie pozostają klasykiem, który nadaje ton nowoczesnemu stylowi miejskiemu, potwierdzając ich wszechstronność i popularność