A Google DeepMind 2026. február 19-én csendesen eleresztett egy bombaát az AI világában: megjelent a Gemini 3.1 Pro. Az első “.1” verziószám (korábban .5-ös frissítések jöttek) már önmágában jelzi, hogy valami változóban van a Google fejlesztési ritmusában. De a valodi számok még meglepetesttel szolgalnak: 31%-ról 77.1%-ra ugrótt az ARC-AGI-2 reasoning teljesítmény. Ez nem evolúció — ez egy ugrás.
A benchmark háború ismét feléledt. A Claude Opus 4.6 és a GPT-5.2 után a Google modellje visszavette az él mezőnyt — legalábbis a legtöbb mérőszámon. Hogy mit jelent ez a gyakorlatban, és mikor érdemes inkább a Gemini-t választani, azt most szétszedjük.
Mi az a “.1” verziószám — és miért fontos?
Eddig a Gemini verziók “.5” ugrásokkal jöttek (1.0, 1.5, 2.0). A 3.1 szám azt jelzi, hogy a Google gyorsabb fejlesztési ciklust vezet be: sűrűbb, apinkább frissítések, amélyek között mégis érdemi teljesítmény-ugrások történnek. Ez az OpenAI és Anthropic stratégiájához igazodó váltás: a piac nem vár negyedévekig a következő nagy bejelentésig.
Egyszerűen fogalmazva: a Google rákapcsolt.
A legnagyobb szám: ARC-AGI-2 — +148%-os ugrás
Az ARC-AGI-2 az egyik legszigorúbb reasoning (következtetési képesség) benchmark. Olyan feladatokat tartalmaz, amelyeket az ember viszonylag könnyen megold, de az AI modellek hagyományosan megszívják. Nem “tényérdés”, hanem új szituációk értelmezése.
A Gemini 3.1 Pro eredménye:
| Modell | ARC-AGI-2 eredmény |
|---|---|
| Gemini 3.0 Pro (előző verzió) | 31% |
| Gemini 3.1 Pro | 77.1% |
| Claude Opus 4.6 | ~68% |
| GPT-5.2 | ~71% |
Az ugrás mértéke: +148% egyetlen modellváltáson belül. Ez nem hasonlítható a korábbi “kicsit jobb vagyok” lépésekhez.
12/18 benchmark-on első hely — de nem mindenen
A Gemini 3.1 Pro a 18 mért szabvány benchmark közül 12-n érte el az első helyet. Ez impozáns — de a teljes kép árnyaltabb.
Ahol a Gemini 3.1 Pro vezet
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| ARC-AGI-2 Reasoning | 77.1% | ~68% | ~71% |
| GPQA Diamond | 94.3% | 91.3% | 92.4% |
| LiveCodeBench Pro | 2887 Elo | ~2750 Elo | ~2810 Elo |
| Multimodiális feladatok | #1 | #2 | #3 |
Ahol a Gemini 3.1 Pro lemarad
A TrendingTopics és a versenytársak benchmarkjai szerint a Gemini 3.1 Pro nem nyeri az összes csatát:
- Emberi értékelés (human preference): Claude Opus 4.6 jobb — az emberek határozottan preferálják a Claude stílusát és “hangsúlyt”
- Tool use & agent megbízhatóság: Claude Opus 4.6 megbízhatóbban használ eszközöket komplex agent feladatokon
- Kód review és debugging: A szárazabb AI értékelések a Claude-ot preferálják
A tanulság: a Gemini 3.1 Pro a legtöbb objektív mérőszámon vezet, de az emberi érzet és a komplex agentic munkakörnyezetek még a Claude és a GPT erőssége.
Töltsd le az AI Eszköz Összehasonlító Táblázatunkat — Gemini, ChatGPT, Claude és több — kategóriánként, árakkal és valós használati esetekkel.
Ingyenes letöltés →Az 1 millió tokenes kontextus — most mi ez a szám?
A Gemini 3.1 Pro 1 millió tokenes context window-t kínál. A versenytársakához képest ez:
| Modell | Max kontextus | Max output |
|---|---|---|
| Gemini 3.1 Pro | 1 000 000 token | 64 000 token |
| Claude Opus 4.6 | 1 000 000 token (béta) | 32 000 token |
| GPT-5.2 | 200 000 token | 16 000 token |
A GPT-5.2-höz képest a Gemini 3.1 Pro 5x nagyobb kontextussal dolgozik — és a 64 000 tokenes output (a Claude kétszerese) azt jelenti, hogy egyszerre készíthet hosszabb kódot, elemzéseket, dokumentumokat anélkül, hogy “belecsonkítaná” a válaszát.
Gyakorlatban: egy teljes regény, egy vállalat éves jelentése, vagy egy nagyobb kódbázis egy menetben elemezhető.
Gondolkodási szintek: Low / Medium / High
A Gemini 3.1 Pro bevezeti a háromszintű gondolkodás opciót:
- Low (Alacsony): Gyors válasz, egyszerű feladatokra — olcsóbb és gyorsabb
- Medium (Közepes):
- High (Magas): Mélyebb elemzés, több “gondolkodási lépés”, komplex reasoning feladatokra
Ez hasonlít az OpenAI “o” sorozatára, de a Gemini-nél nincs külön modell — ugyanabban a modellben váltsz szintet. Praktikus és költséghatékony megoldás.
Multimodalitás: szöveg, kép, hang, videó, kód — egyszerre
A Gemini 3.1 Pro natívan érti és feldolgozza:
- Szöveg — minden nyelven, óriási kontextusban
- Képek — elemzés, leírás, összehasonlítás
- Hang — átirat, elemzés, fordítás
- Videó — tartalomelemzés, felirat, összefoglaló
- Kódrepositóriumok — natívan érti a teljes GitHub repo struktúráját
A versenytársak többsége vagy csak képet ért, vagy hang/videó feldolgozáshoz külső eszközt igényel. A Gemini 3.1 Pro mindezt egy hívásban kezeli.
Ár: 7x olcsóbb mint a Claude Opus — de van egy fogás
Ez az egyik legigazibb meglepetés:
| Modell | Input ár | Output ár | Költségarány a Gemini-hez képest |
|---|---|---|---|
| Gemini 3.1 Pro | $2 / 1M token | $12 / 1M token | — |
| Claude Opus 4.6 | $15 / 1M token | $75 / 1M token | ~6-7x dragább |
| GPT-5.2 | $10 / 1M token | $30 / 1M token | ~2.5x dragább |
A context caching tovább csökkenti a költséget: $0.20–0.40 / 1M token cachelt tartalomnál — ez akár 75%-os megtakarítást jelent ismétlődő kérések esetén.
A fogás: a High gondolkodási szint drágább mint a Medium — a pontos felárat Google még nem közölte nyilvánosan, de az eredmények alapján érdemes lehet Low/Medium-on kezdeni és csak komplex feladatokra váltani High-ra.
Search Grounding: 5000 ingyen keresés havonta
A Gemini 3.1 Pro bejön a Search Grounding funkcióval: a modell valós időben keresi meg az aktuális információkat a Google-ön, és beépíti őket a válaszába.
- Ingyenes keret: 5000 keresés / hó (az API csomagban benne van)
- Felette: fizetős, de az ár egyelőre nem nyilvános
- Mit jelent: Nem szükséges külön web-search plugint kezelni — a modell maga hoz közép-aktuális adatokat
Ez érdekesen versenyez a Perplexity-vel és a ChatGPT web-böngészésjével — de a Gemini esetén ez bele van sütve a modellbe, nem egy add-on.
Hol érhető el?
A Gemini 3.1 Pro az indulástól több platformon elérhető:
- Google AI Studio — ingyenes hozzáférés API kulccsal
- Google Cloud Vertex AI — vállalati integrációkhoz
- Gemini CLI — parancssori eszköz fejlesztőknek
- Gemini app — Pro és Ultra előfizetőknek közvetlen hozzáférés
Hogyan próbáld ki ingyenesen
- Menj a Google AI Studio oldalra
- Jelentkezz be Google fiókoddal
- Hozz létre egy API kulcsot (ingyenes, korláttal)
- Modell:
gemini-3-1-pro-20260219 - Próbáld ki az “Explore” fülön közvetlen chatként is
API hívás P Python
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel(
model_name="gemini-3-1-pro-20260219",
generation_config={"thinking_mode": "high"}
)
response = model.generate_content(
"Elemezd a következő kódbázist és javasold a refaktorálási lehetőségeket..."
)
print(response.text)
Bónusz: Lyria 3 — zene szövegből és képből
A Gemini 3.1 Pro bejelentésével egy napon jelent meg a Lyria 3, a Google új zenei AI modellje:
- Generál 30 másodperces zenei klipreket szöveg leírásból vagy képből
- Stílusok: könnyedén vált jazz-től electronicáig, ambienten át
- SynthID vízjel — az AI által gen erált zene hallható jelzéssel van ellátva (a mélyhamisítások elleni védelemre)
- Elérhető: Google DeepMind API-on és a Gemini app premiém csomagban
A Lyria 3 elsősorban kreatív tartalom készítésre (rövid videók, social media, prototípusok) érdekes — nem versenyez a Suno/Udio-féle teljes dal-generátorokkal, de egyértelmű az irány: a Google a teljes kreatív csatornát le akarja fedni.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2 — teljes összehasonlító
| Szemp | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| Reasoning (ARC-AGI-2) | 77.1% ✅ | ~68% | ~71% |
| Tudományos kérdések (GPQA) | 94.3% ✅ | 91.3% | 92.4% |
| Kódolás (LiveCodeBench) | 2887 Elo ✅ | ~2750 Elo | ~2810 Elo |
| Emberi preferéncia | Jó | Legjobb ✅ | Jó |
| Tool use / Agent | Jó | Legjobb ✅ | Jó |
| Max kontextus | 1M token ✅ | 1M token (béta) | 200K token |
| Max output | 64K token ✅ | 32K token | 16K token |
| Multimodalitás | Szöveg+kép+hang+videó+kód ✅ | Szöveg+kép | Szöveg+kép |
| Input ár | $2/1M ✅ | $15/1M | $10/1M |
| Output ár | $12/1M ✅ | $75/1M | $30/1M |
| Gondolkodási szintek | Low/Medium/High ✅ | Extended thinking | o-sorozat |
| Web-keresés | 5000 q/hó benne ✅ | Külső eszköz | Plug-in |
Mikor válaszd a Gemini 3.1 Pro-t — és mikor ne?
Gemini 3.1 Pro-t válaszd, ha:
- Költséghatékonyság fontos (7x olcsóbb Opus-nál)
- Nagy dokumentumokat, kódbázisokat kell egyszerre elemezni (1M token)
- Hang és videó is kerül be a workflow-ba
- Komplex reasoning / matematika / tudományos feladatok (GPQA)
- Sok API hívás történik és a context caching jelen s megtakarít
- Google ökoszisztéma már használatban van (Workspace, Vertex)
Maradj Claude Opus 4.6-nál, ha:
- Komplex agent-feladatok, megbízható tool use kell
- Az emberi “hangzás” és stílus fontos (szövegírás, kreatív)
- Vállalati szintű biztonság és Anthropic compliance-preferencia
GPT-5.2 még releváns, ha:
- OpenAI ökoszisztémában vagy (Plugins, GPTs, DALL-E integráció)
- ChatGPT-t használsz és nem akarod váltani a felületet
Összefoglalás
A Gemini 3.1 Pro visszahozta a Google-t az AI csúcsra — legalábbis a benchmark számok alapján. A +148%-os reasoning ugrás, a 12/18 mérőszámon szerzett első hely és az ~7x olcsóbb árazás a Claude Opus 4.6-hoz képest érdemi választ tételeznek az előző generációs elmaradásra.
A valós kép nuanszált: az emberi preferéncia és az agent megbízhatóság még a Claude erőssége. De ha API-n dolgozol, nagy kontextust kezelsz, vagy multimodális workflow-t építesz — a Gemini 3.1 Pro most a legjobb ár-érték arányú frontier modell a piacon.
A Lyria 3 pédig jelzi: a Google nem csak a szövegben és kódban gondolkozik, hanem a teljes kreatív tartalomi láncban.
Források: