AIニュース– archive –
-
OpenAIが画像生成モデル「GPT Image 1.5」発表 ChatGPTでも高速・高精度な画像編集が可能に
OpenAIは、最新の画像生成モデル「GPT Image 1.5」を発表し、ChatGPT上での新機能「ChatGPT Images」として提供を開始しました。従来よりも4倍の高速化と、指示通りに画像を生成・編集できる精度の向上、細部の再現性の高さを特徴としており、すべてのChat... -
Metaが新AIモデル「SAM Audio」を公開 テキキスト・画像・時間指定で“欲しい音だけ”を抽出
Metaは、複雑な音の混ざった音声データから、テキストや画像、時間指定などの指示に基づいて特定の音だけを抜き出せる新しいAIモデル「SAM Audio」を発表しました。音声編集や動画制作、アクセシビリティ向上など、幅広い分野での活用が期待されています。... -
米国ウィスコンシン州に新AIデータセンター建設 4000人超の建設雇用と持続可能なインフラを目指す
米国企業が、ウィスコンシン州に新たなAI向けデータセンターを建設する計画を明らかにしました。AIの計算需要に対応するだけでなく、地域の雇用創出と環境負荷の低減を同時に実現する「エネルギー・水ポジティブ」なインフラを掲げている点が注目されてい... -
AIの「考え」をどこまで追跡できるか?OpenAIらがChain-of-Thoughtの可視化評価フレームワークを公開
AIがどのように考えて結論に至ったのか――その「思考の筋道(Chain-of-Thought, CoT)」をどこまで人間が追跡・監視できるかは、信頼できるAIの実現に欠かせないテーマです。今回、研究チームは、モデルが内部の推論過程をどれだけ正しく言語化できているか... -
ChatGPTに新機能「Images」タブ登場 画像体験がさらに身近に
対話型AI「ChatGPT」に、新たに画像関連の操作を集約した「Images(イメージ)」画面が追加されました。サイドバーから簡単にアクセスできるこの機能により、画像を使ったAI活用がこれまで以上に手軽になります。 新登場「Images」画面とは サイドバーから... -
「AIには計算資源が不可欠」米国で高まるAIインフラ投資の必要性とは
生成AIブームの裏側で、医療や科学研究など社会的インパクトの大きい分野でもAI活用への期待が急速に高まっています。その鍵を握るのが「コンピュート(計算資源)」です。米国では、AIの未来と国際競争力を左右するインフラとして、大規模計算基盤への投... -
Metaが新音声分離AI「SAM Audio」を発表 従来モデルを大幅性能超えとアピール
米Metaが、新たな音声分離AIモデル「SAM Audio」を発表しました。従来手法を多くのベンチマークで上回るとされ、雑踏の中の声や特定の楽器だけをクリアに取り出すといった、高度な音声処理の可能性を一段と押し広げる技術として注目されています。 SAM Aud... -
Metaの「Segment Anything」体験サイトに新機能 SAM Audio・SAM 3D・SAM 3で広がる可能性
画像のあらゆる部分を自動で切り出せることで注目を集めたMetaの「Segment Anything」。その体験サイト「Segment Anything Playground」に、新たにSAM Audio・SAM 3D・SAM 3が加わり、画像だけでなく音声や3Dデータまで対象を広げつつあります。 Segment A... -
Blackbox AI、4つのAIエージェントでバグ修正を自動提案 最適解をAIが選別
ソフトウェア開発の現場で、緊急度の高いバグや不具合がバックログにたまり続ける問題に対し、開発支援ツール「Blackbox AI」が、複数のAIエージェントを組み合わせて解決策を自動で提案する新しいアプローチを打ち出しています。 Blackbox AIの新アプロー... -
AIエージェントがコードを書いてそのまま自動デプロイ──BLACKBOX「Remote Agents」がリポジトリ連携を強化
AIがコードを書くだけでなく、そのままリポジトリに反映し、自動でデプロイまで完了してくれる──そんな開発フローを目指す動きが加速しています。コード支援ツール「BLACKBOX」は、新機能「Remote Agents」により、エージェントがタスク完了後にリポジトリ... -
遠隔AIエージェントが同一タスクで競争 BlackboxがClaudeやCodexと比較テストを実施
AIエージェント同士が、同じタスクに遠隔で取り組み、その成果を別のAIが審査する——そんな新しい開発スタイルの実験が進んでいます。コード生成ツール「BLACKBOX」は、自社エージェントとClaude、Codexを同一条件で競わせる遠隔エージェントテストを行い、... -
複数AIエージェントが同一タスクで競い合う「BLACKBOX CLI」とは?仕組みと可能性を解説
複数の高度なAIエージェントを同じプログラミングタスクに同時投入し、その中から最も優れた回答を選ぶ――。そんな「AI同士の競争」を手軽に試せる環境として注目されているのが、「BLACKBOX CLI」によるリモートエージェント対決です。本記事では、Claude... -
OpenAI「Sora」とディズニーが協業 人気キャラクターで映像生成が可能に?
生成AI動画モデル「Sora」などを手がけるOpenAIが、ウォルト・ディズニー社と協業し、ディズニー作品のキャラクターを活用した画像・映像生成に取り組む方針を明らかにしました。世界有数のストーリーテリング企業と先端AIのタッグは、エンタメやファンコ... -
OpenAIが次世代モデル「GPT-5.2」を公開 実務レベルの知識業務に強み
米OpenAIは、対話型AI「ChatGPT」および開発者向けAPIで利用できる次世代モデル「GPT-5.2」を公開しました。現時点で一般利用可能なモデルとしては最も高い知能をうたい、特にビジネスや研究などの実務的な知識労働タスクに強みを持つとされています。 GPT... -
OpenAIの新モデル「GPT-5.2」、API提供初日に累計1兆トークン利用を突破
OpenAIが新たに公開した大規模AIモデル「GPT-5.2」は、API提供初日に累計利用量が1兆トークンを超え、非常に速いペースで成長していることが明らかになりました。開発者や企業がどのような期待を寄せているのか、そしてこの数字が持つ意味を整理します。 G... -
GPT-5.2が専門家評価で大幅向上 スライド・表計算・コード作成まで対応強化
最新の大規模言語モデル「GPT-5.2」が、専門家による評価指標「GDPval」で大きくスコアを伸ばし、前世代のGPT-5から性能が大幅に向上したことが明らかになりました。スライド作成やスプレッドシート、プログラミングコードの生成など、ビジネスや開発の現... -
GoogleのGeminiモデル、検索と翻訳アプリに最新翻訳機能を導入 約20言語に対応
Googleは、自社のAIモデル「Gemini(ジェミニ)」を活用し、検索と翻訳アプリに最先端のテキスト翻訳機能を導入しました。対応するのは約20言語で、あわせてGeminiベースの音声モデルにもアップデートが行われています。本記事では、その概要と私たちの生... -
Googleの「Gemini」音声モデルが進化 Google翻訳アプリにリアルタイム音声翻訳ベータ提供開始
GoogleのAIモデル「Gemini」が音声分野で大きく進化し、Google翻訳アプリにリアルタイムの音声対音声翻訳機能(ベータ版)が順次導入されることが明らかになりました。人間らしいニュアンスを保ったまま翻訳できるとされ、海外旅行やオンライン会議など、... -
AIと現実世界をつなぐ標準技術「MCP」がLinux Foundation傘下の新基金に参加
AIが現実世界のサービスやデータと安全かつ柔軟につながるための重要な技術「MCP(Model Context Protocol)」が、Linux Foundation配下の新たな基金「Agentic AI Foundation」に参加しました。ロンドンの会議室でのアイデアスケッチから始まったこのプロ... -
Perplexityが「GPT-5.2」を一般提供開始 Pro/Max向けに段階導入、AI検索競争が加速
生成AIを活用した検索サービスを提供するPerplexity(パープレキシティ)は、最新モデル「GPT-5.2」の提供を開始しました。Perplexity ProおよびMaxプランの加入者であれば誰でも利用できるようになり、ChatGPTを提供するOpenAIやGoogleなどとのAI検索・AI...



