Google Gemini 1.5 Pro、100万トークン対応とグローバル展開を発表 2024-02-21T05:00:00Z

あなたのAI時代適応度は?
3分で診断・具体的なロードマップを提示
【ニュース: Google Gemini 1.5 Pro、100万トークン対応とグローバル展開を発表 2024-02-21T05:00:00Z】

Forbesによると、Googleは水曜日に、同社のフラッグシップAIモデルである「Gemini 1.5 Pro」が、100万トークン(AIが情報を処理する際の最小単位)のコンテキストウィンドウ(AIが一度に処理できる情報の量や範囲)を搭載し、そのグローバルでのアクセスを拡大すると発表した。これは、従来の「Gemini 1.0 Ultra」が有していた128,000トークンから大幅な進歩となる。この拡張されたコンテキストウィンドウにより、Gemini 1.5 Proは最大で約1時間の動画、約11時間の音声、約30,000行のコード、または70万語以上のテキストといった膨大な量の情報を一度に処理し、理解することが可能になる。
これまで、この機能は開発者や企業顧客向けのプライベートプレビューでのみ利用可能だったが、Googleは現在、より広範なグローバルアクセスを展開している。今回のアップデートには、新たな「Native Audio Understanding(ネイティブ・オーディオ理解)」機能も含まれており、Geminiは事前の文字起こしなしに直接音声入力を処理できるようになった。
この進歩により、長時間の講義の要約や、大規模な動画ファイルの中から特定の瞬間を分析するといった、より高度なインタラクションが容易になる。Googleは2024年6月までに100万トークンのコンテキストウィンドウをすべての開発者が利用できるようにすることを目指しており、将来的には1000万トークンへの拡張も目標としている。 > 引用元: Google Announces Gemini 1.5 Pro With 1 Million Token Context Window and Expanded Global Access
編集長の眼: 100万トークン。この数字が示すのは、Google Gemini 1.5 Proが従来の128,000トークンから約8倍も情報処理能力を向上させたという驚くべき事実です。これは、AIが1時間の動画、11時間の音声、30,000行のコードといった膨大な情報を、まるで図書館を丸ごと読み込むかのように瞬時に理解できることを意味します。つまり、人間が数日かけていた大量の資料読解が数秒で完了する構造に変わったのです。ポイントは、AIが大量の情報を瞬時に理解できるようになった今、私たちはAIに「何を分析させるか」という「問いのデザイン力」を磨く必要がある、ということです。
【ニュース: Google、インドと日本で生成AI検索「SGE」を導入し現地語対応を強化 2024-06-25 10:48:21 +0000】

E-commerce News EUによると、GoogleはAIを搭載したSearch Generative Experience(SGE、Googleが提供する実験的なAI検索機能)の提供地域をインドと日本に拡大した。この動きは、現地語のサポートを強化し、より直感的な検索体験を提供することを目的としている。SGEは、複雑な質問に対して要約を生成し、関連する追加の問いを提示することで、包括的な回答を提供できるよう設計されている。
インドでは、SGEはヒンディー語と英語をサポートし、ユーザーが両言語を切り替えることができるようになる。これは、インドの言語的多様性を考慮すると特に重要な機能であり、ユーザーは英語で検索した場合でも、検索結果をヒンディー語で表示することも可能となる。日本においては、GoogleはSGEを既存のSearch Labs(Googleの新しい検索機能を試すためのプログラム)プログラムに統合する。これにより、日本のユーザーは検索結果に対してAIが生成した概要や要約にアクセスできるようになる。
Googleは日本語の微妙なニュアンスと文化を理解することの重要性を強調しており、SGEの回答が正確かつ文化的に適切であることを目指している。GoogleはAIのグローバルなアクセシビリティ(利用可能性)を高めることにコミットしており、将来的にはより多くの国と地域、言語にSGEを展開し、多様なユーザーニーズに応えるためAIモデルの改善を継続する計画である。 > 引用元: Google Launches GenAI Search in India and Japan, Enhances Local Language Support
編集長の眼: 表面上はGoogle SGEがインドと日本で多言語対応したように見えますが、本質はAIが「言語と文化の壁」を溶解させ、情報アクセスの力学を根本から変えているという現象です。かつては言語の壁が分厚いフィルターでしたが、AIがこれを瞬時に翻訳し、要約する構造に変わりました。この変化が意味するのは、人間が「文脈の管理者」として、AIが提供する情報の「質」と「背景」を見極める能力を持つことの重要性です。つまり、AIが言葉の壁を崩す時代だからこそ、情報の『文脈』を理解し、その信頼性と関連性を自ら評価・管理する能力が、これからの情報社会で差別化を生む鍵となります。
【ニュース: Stability AI、主要研究者の大量流出に直面—CEO辞任と資金調達懸念が背景に 2024-03-26T17:00:19Z】

The Informationによると、画像生成モデルStable Diffusion(ステーブル・ディフュージョン)を提供するStability AI(スタビリティ・エーアイ)は、複数の主要研究者の大量流出に直面している。この動きは、今月初めにEmad Mostaque(エマード・モスターク)元CEOが、同社の財務安定性やリーダーシップへの疑問が浮上する中で辞任したことに続くものだ。
報告によれば、Stable Diffusion 3(ステーブル・ディフュージョン・スリー)を含む主要AIモデルに関わる複数の主任研究者が既に退職したか、退職を計画しているとされる。この頭脳流出(
非エンジニアがAIで業務自動化
この事例は、AI時代を生き抜く上で示唆に富んでいます。「非エンジニアがAIで業務自動化」が問いかけるのは、私たちひとりひとりがAIとどう向き合うかという、極めて実践的な問いです。
これまで日常的にChatGPTやGeminiなどのAIツールを利用していた非エンジニアの筆者は、毎日同じ指示を繰り返す無駄や、チャットAIだけでは業務の深い自動化に限界を感じていました。そこで、デスクトップ上のアプリやブラウザを実際に操作できるAIアシスタント「Claude Code」(または関連するClaude Cowork)を導入。日本語で業務手順を記述するだけで、AIが最適なエージェントやスキル(業務手順書)を自動生成し、ファイル操作や統合レポート作成などを自動化しました。その結果、30分を要していた作業が、AIによる処理後の最終チェック5分で完了するようになり、自身の「手を動かす時間」が激減しました。AIがタスクを並行処理することで、人間は判断業務に集中できるようになり、働き方が大きく変化したことを実感しています。
編集長の目: AIの真価は「奪う道具」ではなく「解放する道具」として機能し得るということです。重要なのは、AIをどんな問いに向けるかという、人間側の設計力です。あなたの日常業務の中にも、今日の事例と同様の「AIで解放できる制約」が必ずあります。 > 出典: