基礎理解
GCPコンソールでVertex AIを触って感覚をつかむ
🎯 このフェーズの目標
- Vertex AI Studio でGeminiと対話できる
- 各モデルの特徴を理解する
- パラメータの効果を体感する
⚠️ 最初にやること: API を有効にする
Vertex AI Studio を開くと「API を有効にする」というバナーが表示されることがあります。必ず有効にしてください。
無料クレジット vs クォータ制限の違い:
| 無料クレジット ($300) | 課金に使えるお金 |
| クォータ制限 | 1分/1日あたりのリクエスト数上限 |
APIを有効にしないと「プレイグラウンドモード」(無料お試し)で動作し、クォータが非常に厳しくなります。 APIを有効にすれば $300クレジットの範囲内で使えるので、安心して有効化してください。
確認方法: GCPコンソール → API とサービス → 有効な API
Day 1-2 Vertex AI Studio で遊ぶ
まずはコンソールでGeminiと対話して、動きを体感しましょう。
# アクセス手順
1. GCPコンソール → Vertex AI → Vertex AI Studio
2. 「チャット」でGeminiと対話
3. プロンプトを変えて出力の違いを体感
4. System Instructionの効果を確認 試してみよう: System Instruction
System Instruction(システム指示)を使うと、AIの「人格」や「役割」を設定できます。
① 右側パネルの「システム指示」欄に入力:
あなたは関西弁で話すAIアシスタントです。
② チャット欄に入力して送信:
今日の天気は? ③ 結果:関西弁で返事が返ってくる!
「天気がわからへん」と返ってきますが、これは正常です。Gemini単体ではリアルタイム情報(天気・ニュース等)は取得できません。 Phase 3 で学ぶ Grounding(Google検索連携) を使うと、最新情報も取得できるようになります。
System Instruction を変えるだけで、同じ質問でも全く違う回答になります。 いろいろ試して違いを体感してください。
Day 3-4 モデル比較
同じプロンプトを各モデルに投げて、違いを比較しましょう。
| モデル | 特徴 | 試す内容 |
|---|---|---|
gemini-3-pro-preview | 最新・最高精度・エージェント向け | 複雑な推論・コーディング |
gemini-2.5-pro | 高精度・安定版 | 複雑な推論タスク |
gemini-2.5-flash | 高速・バランス型 | 日常的な会話・検索 |
gemini-2.0-flash-lite | 超高速・低コスト | シンプルなタスク |
Gemini 3 が最新世代です。推論能力とエージェント機能が大幅に強化されています。 Gemini 1.5系は2025年4月に廃止されました。
比較タスク例
- 同じ質問を各モデルに投げて比較
- 長い文書を読ませて要約させる
- コード生成の品質比較
Day 5 パラメータ理解
同じプロンプトでパラメータを変えて、出力の違いを確認します。
| パラメータ | 範囲 | 効果 |
|---|---|---|
Temperature | 0.0 → 1.0 | 創造性(低いほど決定的) |
Top-P | 0.0 → 1.0 | 多様性 |
Top-K | 1 → 40 | 選択肢数 |
🔬 試してみよう: Temperature比較
同じプロンプトを繰り返し送信して、Temperatureによる出力の違いを体感しましょう。
プロンプト(3回繰り返し送信):
「むかしむかし」で始まる物語の書き出しを1文だけ書いてください。 Temperature = 1.0(高)
毎回全く異なる創造的な物語が生成される
Temperature = 0.1(低)
毎回似たパターンの安定した出力になる
Temperature 0.1 でも完全に同じにはなりませんが、「あるところに、〇〇な△△がいました」のように構造・パターンが揃ってくるのがわかります。 Top-P や Top-K は Temperature と似た効果があるため、まずは Temperature だけを変えて効果を確認するのがおすすめです。
Gemini 3 Pro Preview は最新モデルのため、無料枠のクォータ制限が厳しいです。 「Resource has been exhausted」エラーが出たら、gemini-2.5-flash に切り替えるか、数分〜1時間待ってから再試行してください。
Day 6-7 マルチモーダル体験
Geminiはテキストだけでなく、画像やPDFも理解できます。実際に試してみましょう。
🖼️ 試してみよう: 画像の説明
① 画像をアップロード(何でもOK)
スクリーンショット、写真、グラフなど何でも構いません。 この例ではTemperature比較のスクリーンショットを使っています。
② プロンプトを入力:
この画像を説明して ③ 結果: Geminiが画像を詳細に分析!
Geminiはスクリーンショットの内容を詳細に読み取り、Temperatureの設定値まで認識しています。 画像内のテキスト、グラフ、UI要素などを構造的に理解して説明してくれます。
その他のマルチモーダル活用例
- 📄 PDFを読ませて質問する「この資料の要点を3つ教えて」
- 📁 複数ファイルをまとめて分析「これらの資料を比較して」
- 📊 グラフや表を解釈「このデータから読み取れる傾向は?」