Google автономды агенттерді қолдайтын Gemma 4 ашық AI моделін ұсынды

Google бейсенбіде Gemma 4 жасанды интеллекттің жаңа моделін жариялады. Gemma 4 отбасының бірінші өкілі алдыңғыларға қарағанда бірқатар айтарлықтай жақсартулар алды. Егер Gemma 3 мәтіндік және визуалды тапсырмаларға баса назар аударса, компанияның айтуынша, жаңа итерация агенттік мүмкіндіктер мен жақсартылған ойлау механизмдерін опенсор моделіне әкеледі. Жаңа үлкен тіл моделі (LLM) төрт нұсқада қол жетімді, Google әзірлеуші платформалары арқылы таратылады және жергілікті іске қосу үшін үшінші тарап репозиторийлері арқылы жүктелуі мүмкін.

Ресми блогта компания Gemma 4 моделі туралы егжей-тегжейлі айтты. Ол төрт конфигурацияда қол жетімді: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) және 31B Dense. Мәтінмәндік терезе 256 мың таңбалауышқа дейін кеңейтілді — Gemma 3-тен екі есе көп, оның 128 мыңы бар. Сонымен қатар, модель 140-тан астам тілде жергілікті оқытылады.

Алдыңғы буынмен салыстырғанда негізгі өзгеріс — академиялық және коммерциялық пайдалануға мүмкіндік беретін Apache 2.0 лицензиясына көшу. Модель Google AI Studio және VERTEX AI арқылы тікелей қол жетімді, сонымен қатар Hugging Face, Kaggle және Ollama арқылы жүктеуге болады.

Gemma 4-тің үш негізгі жаңалығы-жетілдірілген ойлау механизмдері, агенттік сценарийлерді қолдау және кодты құру. Жақсартылған пайымдау көп сатылы жоспарлауды және терең логиканы білдіреді; математика және нұсқауларды орындау саласындағы жақсартулар жарияланды. Модель сонымен қатар JSON форматындағы функционалды қоңырау мен құрылымдық шығуды қолдайды, бұл оны AI агенттері үшін негіз ретінде пайдалануға мүмкіндік береді.

Бұдан басқа, Google модель офлайн режимінде пайдалану үшін сапалы код жасай алады деп мәлімдейді, дегенмен оның Claude Code және Codex сияқты меншікті құралдармен салыстырғанда позициялары әлі анық емес. Мұндағы айқын артықшылық - ақысыз пайдалану, сонымен қатар жергілікті деректерді өңдеу кезінде құпиялылық пен қауіпсіздік.

Басқа көрнекті мүмкіндіктерге ерікті ажыратымдылықты қолдайтын бейнелер мен кескіндерді жергілікті өңдеу кіреді. Google визуалды тапсырмаларды, соның ішінде мәтінді тануды (OCR) және диаграммалармен жұмыс істеуді қолдайды. E2b және E4B модельдері сөйлеуді тану және түсіну үшін жергілікті аудио кірісті қолдайды.

Бастапқы дереккөз: Akash Dutta