English
русский
Українська

Currency

Sześć najbardziej zaawansowanych modeli sztucznej inteligencji nie zdało testów matematycznych na poziomie badawczym: najlepszy wynik wyniósł zaledwie 2%

Inna VasilyukWiadomości
Najbardziej zaawansowana sztuczna inteligencja rozwiązała tylko 2% zadań. Źródło: Freepik

Matematycy opracowali nowe problemy w celu przetestowania umiejętności rozumowania sześciu najbardziej zaawansowanych modeli sztucznej inteligencji. Jednak sztuczna inteligencja nie zdała prawie wszystkich testów.

Nowoczesne modele sztucznej inteligencji mają trudności z rozwiązywaniem problemów matematycznych na poziomie badawczym. Nawet najbardziej zaawansowane systemy sztucznej inteligencji są w stanie rozwiązać tylko 2% z setek problemów, przed którymi stają, pisze LiveScience.

Według instytutu badawczego Epoch AI, matematykom ze stopniem doktora rozwiązywanie złożonych problemów zajmuje zwykle godziny lub dni. Najbardziej zaawansowane modele sztucznej inteligencji są w stanie rozwiązać mniej niż 2% z nich.

W ciągu ostatniej dekady opracowano szereg testów sztucznej inteligencji, a w wielu przypadkach modele AI z łatwością przechodzą te testy, twierdzą naukowcy. Na przykład w standardowym teście MMLU (Measuring Massive Multitask Language Understanding) nowoczesne modele AI odpowiadają poprawnie na 98% problemów matematycznych.

Większość z tych testów ma na celu sprawdzenie zdolności sztucznej inteligencji do wykonywania zadań matematycznych na poziomie szkoły średniej i college'u, pisze Elliot Glazer, matematyk z Epoch AI.

Jednak nowy zestaw testów o nazwie FrontierMath jest skierowany na wyższy poziom rozumowania. Epoch AI opracowała pytania z pomocą profesorów matematyki. Według twórców testy obejmują szeroki zakres poddziedzin, od teorii liczb po geometrię algebraiczną.

Odkrycia naukowców pokazują, że obecnie modele sztucznej inteligencji nie mają rozumowania matematycznego na poziomie badawczym. Jednak w miarę rozwoju sztucznej inteligencji te testy porównawcze zapewnią sposób sprawdzenia, czy ich zdolności rozumowania są coraz głębsze.

"Regularnie oceniając najnowocześniejsze modele i współpracując ze społecznością badawczą AI, dążymy do pogłębienia naszego zrozumienia możliwości i ograniczeń AI" - powiedział zespół naukowców.

Tylko zweryfikowane informacje są dostępne na kanale OBOZ.UA Telegram i Viber. Nie daj się nabrać na podróbki!

Inne wiadomości

Na świecie jest wiele budynków, które zadziwiają turystów

7 mało znanych cudów architektury na całym świecie, które nie są gorsze od Wieży Eiffla. Zdjęcie

Niektóre z budynków zostały wpisane do Księgi Rekordów Guinnessa
Soczyste i zdrowe pieczone kotlety rybne z serem i ryżem: polubią je nawet dzieci

Soczyste i zdrowe pieczone kotlety rybne z serem i ryżem: polubią je nawet dzieci

Pamiętaj, aby dobrze ubić mieloną rybę i wstawić do lodówki na 20-30 minut
Citroen C3 Aircross

Poważny problem w nowym budżetowym samochodzie Citroena

Niska cena to jedna z niewielu zalet modelu