📌 이번 주 Gemini / Google AI 업데이트 요약
🌍 Gemini 3.1 Pro — 현재 구글 플래그십. Gemini API에서 gemini-3.1-pro-preview로 사용 가능. 코딩·데이터 분석 추론 강화.
🎙️ Gemini 3.1 Flash Live (3/26 출시) — 실시간 음성 대화 특화 모델. ComplexFuncBench Audio 90.8% 기록.
🧬 Gemma 4 (4/2 출시) — Apache 2.0 오픈소스. 멀티모달, 140개 이상 언어 지원.
🔗 Personal Intelligence — Gmail, Drive, Photos, YouTube 연동 기능 미국 사용자 전체 롤아웃 완료.
🌍 1. Gemini 3.1 Pro — 현재 구글의 최강 모델
Gemini 3.1 Pro가 4월 초 Gemini 앱을 통해 글로벌 롤아웃을 완료했습니다. API에서는 gemini-3.1-pro-preview 모델명으로 사용 가능합니다.
복잡한 코딩 작업과 데이터 분석 추론 능력이 전작 대비 크게 향상됐다고 구글은 밝히고 있습니다.
📎 출처
→ Gemini API Changelog (Google)
🎙️ 2. Gemini 3.1 Flash Live — 실시간 음성 AI
3월 26일 출시된 Gemini 3.1 Flash Live는 audio-to-audio 모델입니다. 텍스트 변환 없이 음성 입력을 직접 처리하는 구조라 실시간 대화에 최적화돼 있습니다.
📊 ComplexFuncBench Audio 벤치마크에서 90.8% 기록. 멀티스텝 function calling 능력 기준으로 현재 최고 수준입니다.
📎 출처
→ Gemini API Changelog (Google)
🧬 3. Gemma 4 — 구글 오픈소스 모델 최강 업데이트
4월 2일, Google이 Gemma 4 패밀리를 공개했습니다. AI Studio와 Gemini API를 통해 바로 사용 가능합니다.
| 항목 | 내용 |
|---|---|
| 라이선스 | Apache 2.0 (상업적 사용 가능) |
| 모달리티 | 텍스트, 비전, 오디오 멀티모달 |
| 언어 지원 | 140개 이상 |
| 출시 모델 | gemma-4-26b-a4b-it, gemma-4-31b-it 등 4종 |
| 사용 방법 | Google AI Studio, Gemini API, Hugging Face |
📎 출처
→ Gemini API Changelog — Google
💬 에디 코멘트
Gemma 4가 개인적으로는 제일 눈에 띕니다. Apache 2.0이라는 게 핵심인데, "상업적으로 자유롭게 쓸 수 있는 구글급 멀티모달 모델"이 생겼다는 뜻이거든요. 자체 AI 서비스 만들려는 스타트업이나 개발자 입장에서는 꽤 큰 선택지가 생긴 겁니다.
Gemini 3.1 Flash Live의 audio-to-audio 방식은 방향이 맞습니다. 텍스트 변환을 거치지 않으면 응답 속도와 자연스러움이 확연히 달라지니까요. 실시간 음성 AI 서비스 쪽으로 의미 있는 진전입니다.
본 포스트는 각 공식 채널 및 신뢰할 수 있는 미디어 출처를 기반으로 작성되었습니다. 정보는 작성 시점 기준이며, 이후 변경될 수 있습니다.
'AI > Gemini' 카테고리의 다른 글
| [Gemini] Gemma 4 공개 — Apache 2.0 오픈소스, 텍스트·이미지·오디오 모두 됩니다 (0) | 2026.04.10 |
|---|---|
| [Gemini] 정신건강 안전장치 대폭 강화 — 위기 감지 시 원터치 상담 연결, 300억 원 투자 (1) | 2026.04.08 |
| [Gemini] Android Auto에 Gemini 본격 확대 — 구글 어시스턴트 시대의 끝 (0) | 2026.04.04 |
| [Gemini] Gemini Nano 4 공개 — 스마트폰에서 돌아가는 AI, 4배 빨라지고 배터리 60% 절약 (0) | 2026.04.03 |