Wiadomości

Wojna na Ukrainie Kontratak AFU Pomoc wojskowa dla Ukrainy Wołodymyr Zełenski

Sześć najbardziej zaawansowanych modeli sztucznej inteligencji nie zdało testów matematycznych na poziomie badawczym: najlepszy wynik wyniósł zaledwie 2%

Inna Vasilyuk Wiadomości22.11.2024 08:47

Najbardziej zaawansowana sztuczna inteligencja rozwiązała tylko 2% zadań. Źródło: Freepik

Matematycy opracowali nowe problemy w celu przetestowania umiejętności rozumowania sześciu najbardziej zaawansowanych modeli sztucznej inteligencji. Jednak sztuczna inteligencja nie zdała prawie wszystkich testów.

Nowoczesne modele sztucznej inteligencji mają trudności z rozwiązywaniem problemów matematycznych na poziomie badawczym. Nawet najbardziej zaawansowane systemy sztucznej inteligencji są w stanie rozwiązać tylko 2% z setek problemów, przed którymi stają, pisze LiveScience.

Według instytutu badawczego Epoch AI, matematykom ze stopniem doktora rozwiązywanie złożonych problemów zajmuje zwykle godziny lub dni. Najbardziej zaawansowane modele sztucznej inteligencji są w stanie rozwiązać mniej niż 2% z nich.

Sześć najbardziej zaawansowanych modeli sztucznej inteligencji nie zdało testów matematycznych na poziomie badawczym: najlepszy wynik wyniósł zaledwie 2%

W ciągu ostatniej dekady opracowano szereg testów sztucznej inteligencji, a w wielu przypadkach modele AI z łatwością przechodzą te testy, twierdzą naukowcy. Na przykład w standardowym teście MMLU (Measuring Massive Multitask Language Understanding) nowoczesne modele AI odpowiadają poprawnie na 98% problemów matematycznych.

Większość z tych testów ma na celu sprawdzenie zdolności sztucznej inteligencji do wykonywania zadań matematycznych na poziomie szkoły średniej i college'u, pisze Elliot Glazer, matematyk z Epoch AI.

Jednak nowy zestaw testów o nazwie FrontierMath jest skierowany na wyższy poziom rozumowania. Epoch AI opracowała pytania z pomocą profesorów matematyki. Według twórców testy obejmują szeroki zakres poddziedzin, od teorii liczb po geometrię algebraiczną.

Odkrycia naukowców pokazują, że obecnie modele sztucznej inteligencji nie mają rozumowania matematycznego na poziomie badawczym. Jednak w miarę rozwoju sztucznej inteligencji te testy porównawcze zapewnią sposób sprawdzenia, czy ich zdolności rozumowania są coraz głębsze.

"Regularnie oceniając najnowocześniejsze modele i współpracując ze społecznością badawczą AI, dążymy do pogłębienia naszego zrozumienia możliwości i ograniczeń AI" - powiedział zespół naukowców.

Tylko zweryfikowane informacje są dostępne na kanale OBOZ.UA Telegram i Viber. Nie daj się nabrać na podróbki!

Badania prowadzone przez naukowców

/Wiadomości/Sześć najbardziej zaawansowanych...

Inne wiadomości

Volkswagen Tera

Długo oczekiwany crossover VW tańszy od Dustera został pokazany na zdjęciach

05.03.2025 23:23

Jak gotować buraki w 10 minut: podstawowa metoda, która będzie odpowiednia dla każdego

Jak gotować buraki w 10 minut: podstawowa metoda, która będzie odpowiednia dla każdego

05.03.2025 19:58

Alpine A390

Nowy rywal niedrogiego crossovera Renault Tesla został pokazany od środka. Zdjęcie

05.03.2025 19:55

"Nie próbuję kpić": były mistrz świata w upokarzający sposób wypowiedział się o Usyku

"Nie próbuję kpić": były mistrz świata w upokarzający sposób wypowiedział się o Usyku

Brytyjczyk wypowiedział się na temat sukcesu naszego rodaka

05.03.2025 19:48

Durow został zauważony podczas kolacji przy świecach z Jaredem Leto. Zdjęcie

Durow został zauważony podczas kolacji przy świecach z Jaredem Leto. Zdjęcie

Znają się od 2015 roku

05.03.2025 19:45

Jak pozbyć się pleśni i nieprzyjemnego zapachu w pralce: skuteczna metoda

Jak pozbyć się pleśni i nieprzyjemnego zapachu w pralce: skuteczna metoda

05.03.2025 19:45

Volkswagen Tera

Długo oczekiwany budżetowy crossover VW tańszy od Dustera pokazany na nowych zdjęciach

05.03.2025 19:31

Jak w sekundę oddzielić śledzie od ości: prosty life hack dla gospodyń domowych

Jak w sekundę oddzielić śledzie od ości: prosty life hack dla gospodyń domowych

05.03.2025 19:28

Jak przycinać róże, aby kwitły intensywnie: instrukcje krok po kroku

Jak przycinać róże, aby kwitły intensywnie: instrukcje krok po kroku

05.03.2025 19:11

Pyszny i zdrowy "Napoleon" z ciasta filo: przygotowanie zajmuje kilka minut

Pyszny i zdrowy "Napoleon" z ciasta filo: przygotowanie zajmuje kilka minut

05.03.2025 19:05

Najmodniejszy kolor manicure na wiosnę 2025: pięć wzorów barwinka

Najmodniejszy kolor manicure na wiosnę 2025: pięć wzorów barwinka

05.03.2025 18:52

Najbardziej udane dni marca dla każdego znaku zodiaku: horoskop

Najbardziej udane dni marca dla każdego znaku zodiaku: horoskop

05.03.2025 18:09

Wiśniowy McPie w domu w kilka sekund: będzie smaczniejszy niż w restauracji

Wiśniowy McPie w domu w kilka sekund: będzie smaczniejszy niż w restauracji

05.03.2025 17:14

Robert Downey Jr. odmówił zagrania w "Odysei" Christophera Nolana: jaki jest powód?

Robert Downey Jr. odmówił zagrania w "Odysei" Christophera Nolana: jaki jest powód?

Jeden z ulubionych aktorów nagrodzonego Oscarem reżysera nie pojawi się w jego kolejnym ambitnym projekcie

05.03.2025 17:04

Joshua szykuje dla Usyka ustawkę z walką o tytuł mistrza absolutnego

Joshua szykuje dla Usyka ustawkę z walką o tytuł mistrza absolutnego

Brytyjczyk chce rewanżu

05.03.2025 16:22

Wrócili na miesiąc miodowy: Meghan Markle opowiada, jak sprawiła, że książę Harry zakochał się w niej ponownie po siedmiu latach małżeństwa

Wrócili na miesiąc miodowy: Meghan Markle opowiada, jak sprawiła, że książę Harry zakochał się w niej ponownie po siedmiu latach małżeństwa

05.03.2025 16:20

"Nie mogę tego wyrzucić z głowy": Reprezentantka Polski na Konkursie Piosenki Eurowizji 2025 chwali piosenkę Ukrainy

"Nie mogę tego wyrzucić z głowy": Reprezentantka Polski na Konkursie Piosenki Eurowizji 2025 chwali piosenkę Ukrainy

05.03.2025 16:18

Będą bardziej popularne niż dżinsy: najmodniejsze spodnie sezonu, które są już masowo kupowane przez fashionistki

Będą bardziej popularne niż dżinsy: najmodniejsze spodnie sezonu, które są już masowo kupowane przez fashionistki

05.03.2025 16:16

Volkswagen Taigo

Volkswagen szykuje nowego niedrogiego crossovera na bazie Polo. Zdjęcie

05.03.2025 16:15

Tongue Sülze: jak ugotować popularną świąteczną przystawkę w pyszny sposób

Tongue Sülze: jak ugotować popularną świąteczną przystawkę w pyszny sposób

05.03.2025 16:14

Volkswagen Tera

Długo oczekiwany crossover VW tańszy od Dustera został pokazany na zdjęciach

05.03.2025 23:23

Jak gotować buraki w 10 minut: podstawowa metoda, która będzie odpowiednia dla każdego

05.03.2025 19:58

Nowy rywal niedrogiego crossovera Renault Tesla został pokazany od środka. Zdjęcie

05.03.2025 19:55

"Nie próbuję kpić": były mistrz świata w upokarzający sposób wypowiedział się o Usyku

05.03.2025 19:48

Durow został zauważony podczas kolacji przy świecach z Jaredem Leto. Zdjęcie

05.03.2025 19:45

Jak pozbyć się pleśni i nieprzyjemnego zapachu w pralce: skuteczna metoda

05.03.2025 19:45

Długo oczekiwany budżetowy crossover VW tańszy od Dustera pokazany na nowych zdjęciach

05.03.2025 19:31

Jak w sekundę oddzielić śledzie od ości: prosty life hack dla gospodyń domowych

05.03.2025 19:28

Jak przycinać róże, aby kwitły intensywnie: instrukcje krok po kroku

05.03.2025 19:11

Pyszny i zdrowy "Napoleon" z ciasta filo: przygotowanie zajmuje kilka minut

05.03.2025 19:05

Najmodniejszy kolor manicure na wiosnę 2025: pięć wzorów barwinka

05.03.2025 18:52

Najbardziej udane dni marca dla każdego znaku zodiaku: horoskop

05.03.2025 18:09

Wiśniowy McPie w domu w kilka sekund: będzie smaczniejszy niż w restauracji

05.03.2025 17:14

Robert Downey Jr. odmówił zagrania w "Odysei" Christophera Nolana: jaki jest powód?

05.03.2025 17:04

Joshua szykuje dla Usyka ustawkę z walką o tytuł mistrza absolutnego

05.03.2025 16:22