Currency
Google uruchamia Gemini AI: to "najlepsza na świecie" sztuczna inteligencja, która sprawi, że GPT-4 pozostanie w tyle
Podczas gdy trwa debata na temat tego, czy należy kontynuować masowe eksperymenty ze sztuczną inteligencją i czy stanowią one zagrożenie dla ludzkości, Google wykonało swój ruch. Uruchomił nowy model sztucznej inteligencji o nazwie Gemini. Według twórców, może on przewyższać zarówno model OpenAI GPT-4, jak i ludzi "na poziomie eksperta" w wielu testach inteligencji.
Według New Scientist, dyrektor generalny Alphabet Inc. i jej spółki zależnej Google, Sundar Pichai, ogłosił istnienie Gemini w maju. W tym czasie model był na etapie szkolenia. Teraz został zaprezentowany publicznie.
Gemini jest obecnie dostępny w trzech wersjach: Nano, Pro i Ultra, które różnią się rozmiarem i możliwościami. Najmniejsza z nich, Nano, jest przeznaczona do lokalnego uruchamiania na smartfonach. Ma dwie wersje. Jedna będzie działać na wolniejszych telefonach i ma 1,8 miliarda parametrów, a druga działa na mocniejszych urządzeniach i ma 3,25 miliarda parametrów. Google odmówiło ujawnienia liczby parametrów Pro i Ultra, ich wielkości, a także skali lub źródła danych treningowych. Dla porównania, podobno GPT-4 zawiera do 1,7 biliona parametrów, a LLAMA-2 firmy Meta ma 70 miliardów.
Według Google, średnia wersja Gemini, zwana Pro, jest lepsza od niektórych innych modeli, takich jak OpenAI GPT3.5. Jednak "najstarsza" z linii Ultra przewyższa możliwości wszystkich istniejących modeli AI. Po raz pierwszy udało mu się pokonać człowieka w standardowym teście MMLU, uzyskując wynik 90%. Wiadomo, że od człowieka na poziomie "eksperta" oczekuje się wyniku 89,8% w tym teście. Test obejmuje szeroki zakres trudnych pytań na tematy takie jak błędy logiczne, kwestie moralne w codziennych sytuacjach, kwestie medyczne, ekonomia i geografia.
W tym samym teście GPT-4 uzyskał 87%, LLAMA-2 68%, a Claude 2 firmy Anthropic 78,5%. Gemini przewyższył wszystkie te modele w ośmiu z dziewięciu innych popularnych testów wydajności.
Firma poinformowała, że model Pro zostanie zintegrowany z Google Bard, internetowym chatbotem uruchomionym w marcu tego roku. A na początku 2024 roku zostanie wydany Bard Advanced, który będzie zawierał jeszcze większy model - Gemini Ultra.
Od dziś nowa wersja Barda będzie dostępna w języku angielskim w ponad 170 krajach. Nie będzie jednak dostępna w Wielkiej Brytanii i Europie. Według Cissy Xiao z Google, opóźnienie jest związane z regulacjami, a nie rozwojem: "Współpracujemy z lokalnymi politykami i organami regulacyjnymi, aby upewnić się, że przestrzegamy lokalnych przepisów i tym podobnych rzeczy przed uruchomieniem w innych regionach" - powiedziała.
Z kolei Ali Collins z Google DeepMind nazwał Gemini najpotężniejszym modelem firmy i jednocześnie najbardziej wszechstronnym. Według deweloperów można go dostosować do różnych zadań. Jest przeszkolony do odbierania zarówno tekstu, jak i dźwięku oraz dostarczania danych wyjściowych w różnych formatach. Jednak na tym etapie uruchomienie Barda pozwoli tylko na korzystanie z podpowiedzi tekstowych. Oczekuje się, że interakcja dźwiękowa i praca z obrazami będą dostępne w nadchodzących miesiącach.
Podczas prezentacji nie zaprezentowano wersji Gemini do testów, ale Google zademonstrowało nagranie swojej sztucznej inteligencji pomagającej w odrabianiu lekcji i pracującej z danymi wejściowymi wideo w czasie rzeczywistym. Firma zapewniła również, że nowy model jest lepszy w tworzeniu oprogramowania niż poprzednie wersje. Wiadomo, że w zeszłym roku oddział Google DeepMind wydał generator kodu oparty na sztucznej inteligencji o nazwie AlphaCode. Twórcy twierdzą, że może on przewyższyć połowę ludzkich programistów. Zaktualizowana wersja oparta na Gemini, według firmy, może przewyższyć 85% ludzkich programistów w kodowaniu.
Wcześniej OBOZ.UA powiedział, kiedy, według byłego dyrektora generalnego Google, sztuczna inteligencja stanie się zagrożeniem dla ludzkości.
Subskrybuj kanały OB OZ.UA na Telegramie i Viberze, aby być na bieżąco z najnowszymi wydarzeniami.