Gemini 3.1 Pro: A Google visszavette az AI trónt

A Google DeepMind 2026. február 19-én csendesen eleresztett egy bombaát az AI világában: megjelent a Gemini 3.1 Pro. Az első “.1” verziószám (korábban .5-ös frissítések jöttek) már önmágában jelzi, hogy valami változóban van a Google fejlesztési ritmusában. De a valodi számok még meglepetesttel szolgalnak: 31%-ról 77.1%-ra ugrótt az ARC-AGI-2 reasoning teljesítmény. Ez nem evolúció — ez egy ugrás.

A benchmark háború ismét feléledt. A Claude Opus 4.6 és a GPT-5.2 után a Google modellje visszavette az él mezőnyt — legalábbis a legtöbb mérőszámon. Hogy mit jelent ez a gyakorlatban, és mikor érdemes inkább a Gemini-t választani, azt most szétszedjük.

Mi az a “.1” verziószám — és miért fontos?

Eddig a Gemini verziók “.5” ugrásokkal jöttek (1.0, 1.5, 2.0). A 3.1 szám azt jelzi, hogy a Google gyorsabb fejlesztési ciklust vezet be: sűrűbb, apinkább frissítések, amélyek között mégis érdemi teljesítmény-ugrások történnek. Ez az OpenAI és Anthropic stratégiájához igazodó váltás: a piac nem vár negyedévekig a következő nagy bejelentésig.

Egyszerűen fogalmazva: a Google rákapcsolt.

A legnagyobb szám: ARC-AGI-2 — +148%-os ugrás

Az ARC-AGI-2 az egyik legszigorúbb reasoning (következtetési képesség) benchmark. Olyan feladatokat tartalmaz, amelyeket az ember viszonylag könnyen megold, de az AI modellek hagyományosan megszívják. Nem “tényérdés”, hanem új szituációk értelmezése.

A Gemini 3.1 Pro eredménye:

Modell	ARC-AGI-2 eredmény
Gemini 3.0 Pro (előző verzió)	31%
Gemini 3.1 Pro	77.1%
Claude Opus 4.6	~68%
GPT-5.2	~71%

Az ugrás mértéke: +148% egyetlen modellváltáson belül. Ez nem hasonlítható a korábbi “kicsit jobb vagyok” lépésekhez.

12/18 benchmark-on első hely — de nem mindenen

A Gemini 3.1 Pro a 18 mért szabvány benchmark közül 12-n érte el az első helyet. Ez impozáns — de a teljes kép árnyaltabb.

Ahol a Gemini 3.1 Pro vezet

Benchmark	Gemini 3.1 Pro	Claude Opus 4.6	GPT-5.2
ARC-AGI-2 Reasoning	77.1%	~68%	~71%
GPQA Diamond	94.3%	91.3%	92.4%
LiveCodeBench Pro	2887 Elo	~2750 Elo	~2810 Elo
Multimodiális feladatok	#1	#2	#3

Ahol a Gemini 3.1 Pro lemarad

A TrendingTopics és a versenytársak benchmarkjai szerint a Gemini 3.1 Pro nem nyeri az összes csatát:

Emberi értékelés (human preference): Claude Opus 4.6 jobb — az emberek határozottan preferálják a Claude stílusát és “hangsúlyt”
Tool use & agent megbízhatóság: Claude Opus 4.6 megbízhatóbban használ eszközöket komplex agent feladatokon
Kód review és debugging: A szárazabb AI értékelések a Claude-ot preferálják

A tanulság: a Gemini 3.1 Pro a legtöbb objektív mérőszámon vezet, de az emberi érzet és a komplex agentic munkakörnyezetek még a Claude és a GPT erőssége.

⚡

Melyik AI modell való neked?

Töltsd le az AI Eszköz Összehasonlító Táblázatunkat — Gemini, ChatGPT, Claude és több — kategóriánként, árakkal és valós használati esetekkel.

Ingyenes letöltés →

Az 1 millió tokenes kontextus — most mi ez a szám?

A Gemini 3.1 Pro 1 millió tokenes context window-t kínál. A versenytársakához képest ez:

Modell	Max kontextus	Max output
Gemini 3.1 Pro	1 000 000 token	64 000 token
Claude Opus 4.6	1 000 000 token (béta)	32 000 token
GPT-5.2	200 000 token	16 000 token

A GPT-5.2-höz képest a Gemini 3.1 Pro 5x nagyobb kontextussal dolgozik — és a 64 000 tokenes output (a Claude kétszerese) azt jelenti, hogy egyszerre készíthet hosszabb kódot, elemzéseket, dokumentumokat anélkül, hogy “belecsonkítaná” a válaszát.

Gyakorlatban: egy teljes regény, egy vállalat éves jelentése, vagy egy nagyobb kódbázis egy menetben elemezhető.

Gondolkodási szintek: Low / Medium / High

A Gemini 3.1 Pro bevezeti a háromszintű gondolkodás opciót:

Low (Alacsony): Gyors válasz, egyszerű feladatokra — olcsóbb és gyorsabb
Medium (Közepes):
High (Magas): Mélyebb elemzés, több “gondolkodási lépés”, komplex reasoning feladatokra

Ez hasonlít az OpenAI “o” sorozatára, de a Gemini-nél nincs külön modell — ugyanabban a modellben váltsz szintet. Praktikus és költséghatékony megoldás.

Multimodalitás: szöveg, kép, hang, videó, kód — egyszerre

A Gemini 3.1 Pro natívan érti és feldolgozza:

Szöveg — minden nyelven, óriási kontextusban

Képek — elemzés, leírás, összehasonlítás

Hang — átirat, elemzés, fordítás

Videó — tartalomelemzés, felirat, összefoglaló

Kódrepositóriumok — natívan érti a teljes GitHub repo struktúráját

A versenytársak többsége vagy csak képet ért, vagy hang/videó feldolgozáshoz külső eszközt igényel. A Gemini 3.1 Pro mindezt egy hívásban kezeli.

Ár: 7x olcsóbb mint a Claude Opus — de van egy fogás

Ez az egyik legigazibb meglepetés:

Modell Input ár Output ár Költségarány a Gemini-hez képest

Gemini 3.1 Pro $2 / 1M token $12 / 1M token —

Claude Opus 4.6 $15 / 1M token $75 / 1M token ~6-7x dragább

GPT-5.2 $10 / 1M token $30 / 1M token ~2.5x dragább

A context caching tovább csökkenti a költséget: $0.20–0.40 / 1M token cachelt tartalomnál — ez akár 75%-os megtakarítást jelent ismétlődő kérések esetén.

A fogás: a High gondolkodási szint drágább mint a Medium — a pontos felárat Google még nem közölte nyilvánosan, de az eredmények alapján érdemes lehet Low/Medium-on kezdeni és csak komplex feladatokra váltani High-ra.

Search Grounding: 5000 ingyen keresés havonta

A Gemini 3.1 Pro bejön a Search Grounding funkcióval: a modell valós időben keresi meg az aktuális információkat a Google-ön, és beépíti őket a válaszába.

Ingyenes keret: 5000 keresés / hó (az API csomagban benne van)

Felette: fizetős, de az ár egyelőre nem nyilvános

Mit jelent: Nem szükséges külön web-search plugint kezelni — a modell maga hoz közép-aktuális adatokat

Ez érdekesen versenyez a Perplexity-vel és a ChatGPT web-böngészésjével — de a Gemini esetén ez bele van sütve a modellbe, nem egy add-on.

Hol érhető el?

A Gemini 3.1 Pro az indulástól több platformon elérhető:

Google AI Studio — ingyenes hozzáférés API kulccsal

Google Cloud Vertex AI — vállalati integrációkhoz

Gemini CLI — parancssori eszköz fejlesztőknek

Gemini app — Pro és Ultra előfizetőknek közvetlen hozzáférés

Hogyan próbáld ki ingyenesen

Menj a Google AI Studio oldalra

Jelentkezz be Google fiókoddal

Hozz létre egy API kulcsot (ingyenes, korláttal)

Modell: gemini-3-1-pro-20260219

Próbáld ki az “Explore” fülön közvetlen chatként is

API hívás P Python

import google.generativeai as genai genai.configure(api_key="YOUR_API_KEY") model = genai.GenerativeModel( model_name="gemini-3-1-pro-20260219", generation_config={"thinking_mode": "high"} ) response = model.generate_content( "Elemezd a következő kódbázist és javasold a refaktorálási lehetőségeket..." ) print(response.text)

Bónusz: Lyria 3 — zene szövegből és képből

A Gemini 3.1 Pro bejelentésével egy napon jelent meg a Lyria 3, a Google új zenei AI modellje:

Generál 30 másodperces zenei klipreket szöveg leírásból vagy képből

Stílusok: könnyedén vált jazz-től electronicáig, ambienten át

SynthID vízjel — az AI által gen erált zene hallható jelzéssel van ellátva (a mélyhamisítások elleni védelemre)

Elérhető: Google DeepMind API-on és a Gemini app premiém csomagban

A Lyria 3 elsősorban kreatív tartalom készítésre (rövid videók, social media, prototípusok) érdekes — nem versenyez a Suno/Udio-féle teljes dal-generátorokkal, de egyértelmű az irány: a Google a teljes kreatív csatornát le akarja fedni.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2 — teljes összehasonlító

Szemp Gemini 3.1 Pro Claude Opus 4.6 GPT-5.2

Reasoning (ARC-AGI-2) 77.1% ✅ ~68% ~71%

Tudományos kérdések (GPQA) 94.3% ✅ 91.3% 92.4%

Kódolás (LiveCodeBench) 2887 Elo ✅ ~2750 Elo ~2810 Elo

Emberi preferéncia Jó Legjobb ✅ Jó

Tool use / Agent Jó Legjobb ✅ Jó

Max kontextus 1M token ✅ 1M token (béta) 200K token

Max output 64K token ✅ 32K token 16K token

Multimodalitás Szöveg+kép+hang+videó+kód ✅ Szöveg+kép Szöveg+kép

Input ár $2/1M ✅ $15/1M $10/1M

Output ár $12/1M ✅ $75/1M $30/1M

Gondolkodási szintek Low/Medium/High ✅ Extended thinking o-sorozat

Web-keresés 5000 q/hó benne ✅ Külső eszköz Plug-in

Mikor válaszd a Gemini 3.1 Pro-t — és mikor ne?

Gemini 3.1 Pro-t válaszd, ha:

Költséghatékonyság fontos (7x olcsóbb Opus-nál)

Nagy dokumentumokat, kódbázisokat kell egyszerre elemezni (1M token)

Hang és videó is kerül be a workflow-ba

Komplex reasoning / matematika / tudományos feladatok (GPQA)

Sok API hívás történik és a context caching jelen s megtakarít

Google ökoszisztéma már használatban van (Workspace, Vertex)

Maradj Claude Opus 4.6-nál, ha:

Komplex agent-feladatok, megbízható tool use kell

Az emberi “hangzás” és stílus fontos (szövegírás, kreatív)

Vállalati szintű biztonság és Anthropic compliance-preferencia

GPT-5.2 még releváns, ha:

OpenAI ökoszisztémában vagy (Plugins, GPTs, DALL-E integráció)

ChatGPT-t használsz és nem akarod váltani a felületet

Összefoglalás

A Gemini 3.1 Pro visszahozta a Google-t az AI csúcsra — legalábbis a benchmark számok alapján. A +148%-os reasoning ugrás, a 12/18 mérőszámon szerzett első hely és az ~7x olcsóbb árazás a Claude Opus 4.6-hoz képest érdemi választ tételeznek az előző generációs elmaradásra.

A valós kép nuanszált: az emberi preferéncia és az agent megbízhatóság még a Claude erőssége. De ha API-n dolgozol, nagy kontextust kezelsz, vagy multimodális workflow-t építesz — a Gemini 3.1 Pro most a legjobb ár-érték arányú frontier modell a piacon.

A Lyria 3 pédig jelzi: a Google nem csak a szövegben és kódban gondolkozik, hanem a teljes kreatív tartalomi láncban.

Források:

Google Blog: Gemini 3.1 Pro hivatalos bejelentés

9to5Google: Gemini 3.1 Pro

VentureBeat: Google visszavette az AI korona

TrendingTopics: Benchmark összehasonlító

Modell	Input ár	Output ár	Költségarány a Gemini-hez képest
Gemini 3.1 Pro	$2 / 1M token	$12 / 1M token	—
Claude Opus 4.6	$15 / 1M token	$75 / 1M token	~6-7x dragább
GPT-5.2	$10 / 1M token	$30 / 1M token	~2.5x dragább

Szemp	Gemini 3.1 Pro	Claude Opus 4.6	GPT-5.2
Reasoning (ARC-AGI-2)	77.1% ✅	~68%	~71%
Tudományos kérdések (GPQA)	94.3% ✅	91.3%	92.4%
Kódolás (LiveCodeBench)	2887 Elo ✅	~2750 Elo	~2810 Elo
Emberi preferéncia	Jó	Legjobb ✅	Jó
Tool use / Agent	Jó	Legjobb ✅	Jó
Max kontextus	1M token ✅	1M token (béta)	200K token
Max output	64K token ✅	32K token	16K token
Multimodalitás	Szöveg+kép+hang+videó+kód ✅	Szöveg+kép	Szöveg+kép
Input ár	$2/1M ✅	$15/1M	$10/1M
Output ár	$12/1M ✅	$75/1M	$30/1M
Gondolkodási szintek	Low/Medium/High ✅	Extended thinking	o-sorozat
Web-keresés	5000 q/hó benne ✅	Külső eszköz	Plug-in

Gemini 3.1 Pro: A Google visszavette az AI trónt

Mi az a “.1” verziószám — és miért fontos?

A legnagyobb szám: ARC-AGI-2 — +148%-os ugrás

12/18 benchmark-on első hely — de nem mindenen

Ahol a Gemini 3.1 Pro vezet

Ahol a Gemini 3.1 Pro lemarad

Az 1 millió tokenes kontextus — most mi ez a szám?

Gondolkodási szintek: Low / Medium / High

Multimodalitás: szöveg, kép, hang, videó, kód — egyszerre

Ár: 7x olcsóbb mint a Claude Opus — de van egy fogás

Search Grounding: 5000 ingyen keresés havonta

Hol érhető el?

Hogyan próbáld ki ingyenesen

API hívás P Python

Bónusz: Lyria 3 — zene szövegből és képből

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2 — teljes összehasonlító

Mikor válaszd a Gemini 3.1 Pro-t — és mikor ne?

Gemini 3.1 Pro-t válaszd, ha:

Maradj Claude Opus 4.6-nál, ha:

GPT-5.2 még releváns, ha:

Összefoglalás

További olvasnivalók

Kapcsolódó cikkek

ChatGPT vs Gemini 2026: Melyiket használd?

Claude Opus 4.6: Az Anthropic eddigi legerősebb modellje

GPT-5.3-Codex: Az OpenAI legjobb kódoló modellje

Tetszett a cikk?