Fontos lépés történt a mesterséges intelligencia területén: a Google leleplezte legújabb, nagy nyelvi modelljét, a Geminint. 

Sundar Pichai, a Google vezérigazgatója és Demis Hassabis, a DeepMind vezérigazgatója kijelentették, hogy a modell jelentős mérföldkőnek számít és széles körben érinti a Google termékeit. A Gemini nem csak egy AI modell, hanem egy sokrétű platform is, amely többféle verzióban érhető el: a kisebb Gemini Nanótól – mely Android készülékeken működik – a fejlettebb Gemini Prón át, egészen a legnagyobb teljesítményű, adatközpontoknak és vállalati alkalmazásoknak szánt Gemini Ultráig.

A Google Gemini és az OpenAI GPT-4 modelljének versenye szintén figyelemre méltó: a Google 32 ismert benchmark segítségével összehasonlította a két modellt, és Hassabis szerint a Gemini 30 esetben mutatott jobb teljesítményt, mint a GPT-4. A Gemini előnye különösen a videók és hanganyagok megértésében és azokkal való interakcióban mutatkozik meg: https://www.youtube.com/watch?v=UIZAiXYceBI 

Ezzel szemben a tech óriás nem hozott létre külön modelleket képek és hangok számára, hanem kezdettől fogva egy multiszenzoros modellt fejlesztett. A Geminibe a jövőben további szenzorokat is integrálnak, beleértve az olyan területeket, mint az érintés, ami a robotika felé mutat. Bár ezek a modellek továbbra is „hallucinálhatnak” és rendelkezhetnek előítéletekkel, Hassabis szerint minél több adat áll rendelkezésre, annál jobbak lesznek.

A Gemini bevezetése nem csak technológiai előrehaladást jelent a Google számára, hanem azt is, hogy az AI piacon újra vezető szerepre törhet. Az OpenAI és a ChatGPT dominanciáját követően a Google ismét visszakerül a versenybe, ami új lehetőségeket nyit meg az AI technológiában.

 

(Forrás: fintech.hu)

(Borítókép: Depositphotos)


Ha tetszett a cikk:

és kövess minket a Facebookon!



Szólj hozzá

Vélemény, hozzászólás?