ChatGPT mo�e zacz�� si� ba�. Google pokaza� najpot�niejszy model AI

Google og�osi� prze�omowy projekt, kt�ry b�dzie stanowi� nie lada wyzwanie dla ChataGPT. Gemini to najpot�niejszy model AI i najbardziej zaawansowany projekt badawczy w historii giganta. Ju� teraz trudno ukry� zdziwienie, a to dopiero pocz�tek mo�liwo�ci tej sztucznej inteligencji.

Google zapowiedział w nocy swój nowy model sztucznej inteligencji, który - jak ogłoszono - jest najbardziej zaawansowanym projektem naukowo-badawczym w historii firmy. Nie tylko zupełnie zrewolucjonizuje możliwości chatbota Google Bard, ale i pokonuje już w testach ChataGPT w najnowszej wersji GPT-4. Poznajcie Gemini, którego możliwości są znacznie szersze, niż moglibyśmy przypuszczać.

Zobacz wideo Jak uniknąć buntu maszyn? Czy da się wychować sztuczną inteligencję? [Next Station]

Nowy model sztucznej inteligencji Google zaskakuje i trochę przeraża

Google chwali się, że Gemini nie jest kontynuacją jakiegoś wcześniej prowadzonego projektu, ale zupełnie nowym, stworzonym od zera projektem przygotowanym w ramach szeroko zakrojonej współpracy wielu zespołów w Google. Od początku projektowano go jako tzw. model multimodalny, czyli zdolny przyjmować, rozpoznawać i przetwarzać różne formy informacji - tekst, obraz, wideo, dźwięk lub kod.

Wypuszczony właśnie model dostępny w wersji Gemini 1.0 podzielono na trzy warianty - Gemini Nano do pracy na urządzeniach mobilnych, Gemini Pro do skalowania bardzo zróżnicowanych zadań oraz najbardziej zaawansowany i wydajny Gemini Ultra do realizacji wyjątkowo złożonych zadań. Ten ostatni został już poddany szeregowi testów i bije w nich nie tylko już istniejące modele sztucznej inteligencji, ale nawet ludzkich ekspertów (o czym za chwilę).

 

Google pochwalił się już filmami, w których Gemini poddano szeregowi łatwiejszych i trudniejszych testów. Szczególnie te pokazujące możliwość rozpoznawania i analizy różnorodnych obrazków, kształtów lub fragmentów nagrań robią gigantyczne wrażenie.

AI rozpoznaje odręczne szkice, orzeka, co jest najlepszym wyborem w opisanej obrazkiem sytuacji, doradza, jak wykorzystać pokazane przed kamerą materiały lub momentalnie rozpoznaje finalny obrazem w zadaniu polegającym na łączeniu kropek. Całe, trwające ponad 6 minut wideo wypakowane jest dziesiątkami zadań, z którymi Gemini radzi sobie podobnie dobrze, ale często szybciej niż człowiek:

 

Google Gemini to coś więcej niż chatbot. Pokonał nawet ekspertów

Oczywiście możliwości Gemini nie opierają się głównie na rozpoznawaniu rysunków. Google pokazał też wyniki badań, w których Gemini stanął w szranki z ChatemGPT w najnowszej wersji GPT-4. W teście sprawdzającym kilka kluczowych możliwości takich modeli - z zakresu wiedzy ogólnej, rozumienia, matematyki i kodowania - Gemini Ultra zdobył lepszy wynik w siedmiu z ośmiu zadań.

Google chwali się też, że Gemini Ultra jest pierwszym modelem językowym, który pokonał (ludzkich) ekspertów w tekście MMLU (masowe wielozadaniowe rozumienie języka) sprawdzającym przede wszystkim precyzję rozumienia i analizy pytania przed udzieleniem odpowiedzi.

Gemini może też w tym samym czasie rozpoznawać i rozumieć tekst, obraz i dźwięk, dzięki czemu - jak tłumaczą jego twórcy - może wyłapywać niuanse zawarte w przekazywanych mu informacjach i odpowiadać na pytania dotyczące skomplikowanych zagadnień. Co więcej, radzi sobie świetnie w rozumowaniu procesu rozwiązywania skomplikowanych zagadnień matematycznych, dlatego może pokazać, w jaki sposób rozwiązać zadanie z matematyki lub fizyki, zamiast jedynie podawać wynik.

 

Możliwości Gemini Pro będziemy mogli niebawem przetestować w chatbocie Google Bard, który właśnie został zaktualizowany o nowy model. Nowość ma działać na starcie w ponad 170 krajach �wiata. Bardziej zaawansowany Gemini Ultra pojawi się w Bard dopiero na początku przyszłego roku. Model działa na razie tylko w języku angielskim, ale specjaliści z Google już pracują nad dodaniem kolejnych języków. Gemini ma też zostać zaimplementowany do wyszukiwarki Google, następnie w systemie operacyjnym smartfonów Pixel, a potem w aplikacjach i usługach firmy - m.in. w klawiaturze Gboard czy przeglądarce Chrome.

Wi�cej o: