A Google DeepMind 2026. február 19-én csendesen eleresztett egy bombaát az AI világában: megjelent a Gemini 3.1 Pro. Az első “.1” verziószám (korábban .5-ös frissítések jöttek) már önmágában jelzi, hogy valami változóban van a Google fejlesztési ritmusában. De a valodi számok még meglepetesttel szolgalnak: 31%-ról 77.1%-ra ugrótt az ARC-AGI-2 reasoning teljesítmény. Ez nem evolúció — ez egy ugrás.

A benchmark háború ismét feléledt. A Claude Opus 4.6 és a GPT-5.2 után a Google modellje visszavette az él mezőnyt — legalábbis a legtöbb mérőszámon. Hogy mit jelent ez a gyakorlatban, és mikor érdemes inkább a Gemini-t választani, azt most szétszedjük.

Mi az a “.1” verziószám — és miért fontos?

Eddig a Gemini verziók “.5” ugrásokkal jöttek (1.0, 1.5, 2.0). A 3.1 szám azt jelzi, hogy a Google gyorsabb fejlesztési ciklust vezet be: sűrűbb, apinkább frissítések, amélyek között mégis érdemi teljesítmény-ugrások történnek. Ez az OpenAI és Anthropic stratégiájához igazodó váltás: a piac nem vár negyedévekig a következő nagy bejelentésig.

Egyszerűen fogalmazva: a Google rákapcsolt.

A legnagyobb szám: ARC-AGI-2 — +148%-os ugrás

Az ARC-AGI-2 az egyik legszigorúbb reasoning (következtetési képesség) benchmark. Olyan feladatokat tartalmaz, amelyeket az ember viszonylag könnyen megold, de az AI modellek hagyományosan megszívják. Nem “tényérdés”, hanem új szituációk értelmezése.

A Gemini 3.1 Pro eredménye:

Modell ARC-AGI-2 eredmény
Gemini 3.0 Pro (előző verzió) 31%
Gemini 3.1 Pro 77.1%
Claude Opus 4.6 ~68%
GPT-5.2 ~71%

Az ugrás mértéke: +148% egyetlen modellváltáson belül. Ez nem hasonlítható a korábbi “kicsit jobb vagyok” lépésekhez.

12/18 benchmark-on első hely — de nem mindenen

A Gemini 3.1 Pro a 18 mért szabvány benchmark közül 12-n érte el az első helyet. Ez impozáns — de a teljes kép árnyaltabb.

Ahol a Gemini 3.1 Pro vezet

Benchmark Gemini 3.1 Pro Claude Opus 4.6 GPT-5.2
ARC-AGI-2 Reasoning 77.1% ~68% ~71%
GPQA Diamond 94.3% 91.3% 92.4%
LiveCodeBench Pro 2887 Elo ~2750 Elo ~2810 Elo
Multimodiális feladatok #1 #2 #3

Ahol a Gemini 3.1 Pro lemarad

A TrendingTopics és a versenytársak benchmarkjai szerint a Gemini 3.1 Pro nem nyeri az összes csatát:

  • Emberi értékelés (human preference): Claude Opus 4.6 jobb — az emberek határozottan preferálják a Claude stílusát és “hangsúlyt”
  • Tool use & agent megbízhatóság: Claude Opus 4.6 megbízhatóbban használ eszközöket komplex agent feladatokon
  • Kód review és debugging: A szárazabb AI értékelések a Claude-ot preferálják

A tanulság: a Gemini 3.1 Pro a legtöbb objektív mérőszámon vezet, de az emberi érzet és a komplex agentic munkakörnyezetek még a Claude és a GPT erőssége.

Melyik AI modell való neked?

Töltsd le az AI Eszköz Összehasonlító Táblázatunkat — Gemini, ChatGPT, Claude és több — kategóriánként, árakkal és valós használati esetekkel.

Ingyenes letöltés →

Az 1 millió tokenes kontextus — most mi ez a szám?

A Gemini 3.1 Pro 1 millió tokenes context window-t kínál. A versenytársakához képest ez:

Modell Max kontextus Max output
Gemini 3.1 Pro 1 000 000 token 64 000 token
Claude Opus 4.6 1 000 000 token (béta) 32 000 token
GPT-5.2 200 000 token 16 000 token

A GPT-5.2-höz képest a Gemini 3.1 Pro 5x nagyobb kontextussal dolgozik — és a 64 000 tokenes output (a Claude kétszerese) azt jelenti, hogy egyszerre készíthet hosszabb kódot, elemzéseket, dokumentumokat anélkül, hogy “belecsonkítaná” a válaszát.

Gyakorlatban: egy teljes regény, egy vállalat éves jelentése, vagy egy nagyobb kódbázis egy menetben elemezhető.

Gondolkodási szintek: Low / Medium / High

A Gemini 3.1 Pro bevezeti a háromszintű gondolkodás opciót:

  • Low (Alacsony): Gyors válasz, egyszerű feladatokra — olcsóbb és gyorsabb
  • Medium (Közepes):
  • High (Magas): Mélyebb elemzés, több “gondolkodási lépés”, komplex reasoning feladatokra

Ez hasonlít az OpenAI “o” sorozatára, de a Gemini-nél nincs külön modell — ugyanabban a modellben váltsz szintet. Praktikus és költséghatékony megoldás.

Multimodalitás: szöveg, kép, hang, videó, kód — egyszerre

A Gemini 3.1 Pro natívan érti és feldolgozza:

  • Szöveg — minden nyelven, óriási kontextusban
  • Képek — elemzés, leírás, összehasonlítás
  • Hang — átirat, elemzés, fordítás
  • Videó — tartalomelemzés, felirat, összefoglaló
  • Kódrepositóriumok — natívan érti a teljes GitHub repo struktúráját

A versenytársak többsége vagy csak képet ért, vagy hang/videó feldolgozáshoz külső eszközt igényel. A Gemini 3.1 Pro mindezt egy hívásban kezeli.

Ár: 7x olcsóbb mint a Claude Opus — de van egy fogás

Ez az egyik legigazibb meglepetés:

Modell Input ár Output ár Költségarány a Gemini-hez képest
Gemini 3.1 Pro $2 / 1M token $12 / 1M token
Claude Opus 4.6 $15 / 1M token $75 / 1M token ~6-7x dragább
GPT-5.2 $10 / 1M token $30 / 1M token ~2.5x dragább

A context caching tovább csökkenti a költséget: $0.20–0.40 / 1M token cachelt tartalomnál — ez akár 75%-os megtakarítást jelent ismétlődő kérések esetén.

A fogás: a High gondolkodási szint drágább mint a Medium — a pontos felárat Google még nem közölte nyilvánosan, de az eredmények alapján érdemes lehet Low/Medium-on kezdeni és csak komplex feladatokra váltani High-ra.

Search Grounding: 5000 ingyen keresés havonta

A Gemini 3.1 Pro bejön a Search Grounding funkcióval: a modell valós időben keresi meg az aktuális információkat a Google-ön, és beépíti őket a válaszába.

  • Ingyenes keret: 5000 keresés / hó (az API csomagban benne van)
  • Felette: fizetős, de az ár egyelőre nem nyilvános
  • Mit jelent: Nem szükséges külön web-search plugint kezelni — a modell maga hoz közép-aktuális adatokat

Ez érdekesen versenyez a Perplexity-vel és a ChatGPT web-böngészésjével — de a Gemini esetén ez bele van sütve a modellbe, nem egy add-on.

Hol érhető el?

A Gemini 3.1 Pro az indulástól több platformon elérhető:

  • Google AI Studio — ingyenes hozzáférés API kulccsal
  • Google Cloud Vertex AI — vállalati integrációkhoz
  • Gemini CLI — parancssori eszköz fejlesztőknek
  • Gemini app — Pro és Ultra előfizetőknek közvetlen hozzáférés

Hogyan próbáld ki ingyenesen

  1. Menj a Google AI Studio oldalra
  2. Jelentkezz be Google fiókoddal
  3. Hozz létre egy API kulcsot (ingyenes, korláttal)
  4. Modell: gemini-3-1-pro-20260219
  5. Próbáld ki az “Explore” fülön közvetlen chatként is

API hívás P Python

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel(
    model_name="gemini-3-1-pro-20260219",
    generation_config={"thinking_mode": "high"}
)

response = model.generate_content(
    "Elemezd a következő kódbázist és javasold a refaktorálási lehetőségeket..."
)
print(response.text)

Bónusz: Lyria 3 — zene szövegből és képből

A Gemini 3.1 Pro bejelentésével egy napon jelent meg a Lyria 3, a Google új zenei AI modellje:

  • Generál 30 másodperces zenei klipreket szöveg leírásból vagy képből
  • Stílusok: könnyedén vált jazz-től electronicáig, ambienten át
  • SynthID vízjel — az AI által gen erált zene hallható jelzéssel van ellátva (a mélyhamisítások elleni védelemre)
  • Elérhető: Google DeepMind API-on és a Gemini app premiém csomagban

A Lyria 3 elsősorban kreatív tartalom készítésre (rövid videók, social media, prototípusok) érdekes — nem versenyez a Suno/Udio-féle teljes dal-generátorokkal, de egyértelmű az irány: a Google a teljes kreatív csatornát le akarja fedni.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2 — teljes összehasonlító

Szemp Gemini 3.1 Pro Claude Opus 4.6 GPT-5.2
Reasoning (ARC-AGI-2) 77.1% ✅ ~68% ~71%
Tudományos kérdések (GPQA) 94.3% ✅ 91.3% 92.4%
Kódolás (LiveCodeBench) 2887 Elo ✅ ~2750 Elo ~2810 Elo
Emberi preferéncia Legjobb ✅
Tool use / Agent Legjobb ✅
Max kontextus 1M token ✅ 1M token (béta) 200K token
Max output 64K token ✅ 32K token 16K token
Multimodalitás Szöveg+kép+hang+videó+kód ✅ Szöveg+kép Szöveg+kép
Input ár $2/1M ✅ $15/1M $10/1M
Output ár $12/1M ✅ $75/1M $30/1M
Gondolkodási szintek Low/Medium/High ✅ Extended thinking o-sorozat
Web-keresés 5000 q/hó benne ✅ Külső eszköz Plug-in

Mikor válaszd a Gemini 3.1 Pro-t — és mikor ne?

Gemini 3.1 Pro-t válaszd, ha:

  • Költséghatékonyság fontos (7x olcsóbb Opus-nál)
  • Nagy dokumentumokat, kódbázisokat kell egyszerre elemezni (1M token)
  • Hang és videó is kerül be a workflow-ba
  • Komplex reasoning / matematika / tudományos feladatok (GPQA)
  • Sok API hívás történik és a context caching jelen s megtakarít
  • Google ökoszisztéma már használatban van (Workspace, Vertex)

Maradj Claude Opus 4.6-nál, ha:

  • Komplex agent-feladatok, megbízható tool use kell
  • Az emberi “hangzás” és stílus fontos (szövegírás, kreatív)
  • Vállalati szintű biztonság és Anthropic compliance-preferencia

GPT-5.2 még releváns, ha:

  • OpenAI ökoszisztémában vagy (Plugins, GPTs, DALL-E integráció)
  • ChatGPT-t használsz és nem akarod váltani a felületet

Összefoglalás

A Gemini 3.1 Pro visszahozta a Google-t az AI csúcsra — legalábbis a benchmark számok alapján. A +148%-os reasoning ugrás, a 12/18 mérőszámon szerzett első hely és az ~7x olcsóbb árazás a Claude Opus 4.6-hoz képest érdemi választ tételeznek az előző generációs elmaradásra.

A valós kép nuanszált: az emberi preferéncia és az agent megbízhatóság még a Claude erőssége. De ha API-n dolgozol, nagy kontextust kezelsz, vagy multimodális workflow-t építesz — a Gemini 3.1 Pro most a legjobb ár-érték arányú frontier modell a piacon.

A Lyria 3 pédig jelzi: a Google nem csak a szövegben és kódban gondolkozik, hanem a teljes kreatív tartalomi láncban.

Források: