AIニュース– archive –
-
ChatGPTに音声会話機能が統合 アプリ更新だけで利用可能に
対話型AI「ChatGPT」で、音声による会話機能(ChatGPT Voice)が専用モードなしで使えるようになりました。アプリやブラウザからそのまま話しかけるだけで音声対話ができ、回答のテキスト表示や画像・地図の表示もリアルタイムで行われます。 ChatGPT Voic... -
スクリーンショットから数秒でログイン画面生成?Blackbox AIが変えるフロントエンド開発
コードを書く前に、まずはUIのスクリーンショットを用意するだけ——。開発者向けAIツール「Blackbox AI」が、画像から本格的な認証ページを数秒で生成するデモを公開し、フロントエンド開発の常識を塗り替える可能性として注目されています。 Blackbox AIと... -
言葉なしで美学を探求する「Style Creator」早期版が公開—直感的なスタイル設計の未来に一歩
新機能「Style Creator」の早期版が公開された。公式のアナウンスによれば、テキストを使わずに新しい美的スタイルを作成・探索する体験を目指す大きな一歩で、「未来を少し先取りできる」試みだという。現時点では詳細は限定的だが、クリエイティブ制作の... -
Midjourneyが「Midjourney TV」を試験公開:コミュニティ発のトレンド動画をライブ視聴、ウィンドウ形状に自動最適化
AIビジュアルプラットフォームのMidjourneyが、新たな実験「Midjourney TV」を告知しました。コミュニティの“今”を映すトレンド動画をブラウザ上でライブ視聴でき、ウィンドウ形状に自動フィット、複数ウィンドウ同時視聴にも対応するとしています。本稿で... -
標準プランにHD動画生成、小規模バッチでコスト削減も—コミュニティ提案を反映した新機能が公開
コミュニティの声を受けて、動画生成サービスが複数の新機能を同時リリースしました。標準サブスクリプションでもHD動画生成が可能になり、少量・小規模のバッチでコストを抑えた制作がしやすくなったほか、モデレーション精度とサムネイル品質も改善。個... -
MidjourneyがHD動画モード提供開始:Pro/Mega限定、ピクセル数約4倍・コスト約3.2倍
画像生成AIのMidjourneyが、新たに「HD Video」モードを公開しました。対象はProとMegaの有料プラン加入者で、従来のSD出力に比べピクセル数が約4倍に拡大。その一方でコストは約3.2倍とされ、最高品質の映像を必要とするプロフェッショナル用途に焦点を当... -
Anthropic、長時間動作するAIエージェントの新手法を公開 人間エンジニアの働き方から発想
AIエージェントを長時間動かし続け、複数のタスクや大量の情報をまたいで作業させる――そんな未来に向けて、Anthropicのエンジニアリングブログが「長時間実行エージェント」の課題と、その解決に向けた新しいアプローチを紹介しました。人間のソフトウェア... -
Gemini 3への反響受け、Sundar Pichai氏との対談が明らかに—Google AIの次章に期待集まる
最新AI「Gemini 3」に対する反響と「次は何が来るのか」という関心の高まりを受け、@OfficialLoganK 氏が GoogleおよびAlphabetのCEO、@sundarpichai 氏と対談したことが英語のSNS投稿で示された。詳細は未公表ながら、Google AIの今後に関する手がかりが... -
Perplexity、有料プランで「Grok 4.1」を提供開始—Pro/Max加入者は即日アクセス可能に
AI検索プラットフォームのPerplexityは、最新の大規模言語モデル「Grok 4.1」の提供を開始しました。対象は有料のProおよびMax加入者で、同社の発表によれば全加入者が利用可能になっています。これにより、調査・要約・作図・コーディング補助などの日常... -
カーネギーメロン大、SAM 3Dで臨床リハビリをデータ駆動化—患者ごとに最適な回復支援へ
リハビリテーションの現場で、3Dモーション解析技術「SAM 3D」の活用が進んでいます。カーネギーメロン大学(Carnegie Mellon University)の研究チームは、臨床環境でSAM 3Dを使い、人の動きを捉えて解析。回復過程をデータで見える化し、患者ごとの状態... -
ERNIE 5.0がクロスモーダル出力を公開—“オムニモーダル”AIの実演が示す次の一手
最新モデル「ERNIE 5.0」が、公式X(旧Twitter)でクロスモーダル出力のデモを公開した。テキストや画像など複数のモードを横断する“オムニモーダル”能力をうたう同モデルの実演で、利用シーンの拡大と導入上の論点が浮き彫りになった。 概要 投稿の要点 ... -
ERNIE 5.0が「読む・見る・聴く・考える」を統合 ネイティブ・オムニモーダルAIの次段階へ
テキスト・画像・音声を横断して理解し、ひとつの知能として推論する――新モデル「ERNIE 5.0」が“ネイティブなオムニモーダル”として紹介された。短い告知ながら、複数モードを前提に設計された次世代AIの方向性を示す発表で、モデル構築の解説も合わせて公... -
Anthropicが「Claude Opus 4.5」を発表—コーディング・エージェント・PC操作で“世界最高”を標榜、仕事の在り方に一石
Anthropicは最新モデル「Claude Opus 4.5」を発表し、コーディング、エージェント、コンピュータ利用(Computer Use)の分野で“世界最高”の性能を謳いました。同社は、今回のアップデートがAIの実用能力を一段押し上げ、今後の働き方の大きな転換を示唆す... -
ChatGPTに「ショッピングリサーチ」登場——対話型の製品選び支援で賢い購買判断を後押し
OpenAIはX(旧Twitter)で、ChatGPT内に製品選びを支援する新体験「ショッピングリサーチ」を発表しました。深掘り型の調査に、双方向のインターフェースを組み合わせ、より賢い購買判断を助けることを狙います。本稿では、発表内容から読み取れるポイント... -
Baiduが「Baidu World 2025」最新ハイライトを追加公開、ERNIE 5.0の実演を予告
中国のBaiduは、年次イベント「Baidu World 2025」の新たなハイライト映像をSNSで公開し、次世代AIモデル「ERNIE 5.0」の“実演”を含む内容を予告しました。詳細は今後の開示待ちですが、最新モデルの動作が確認できるとして注目を集めています。 発表の概... -
生成AI「Claude」がExcelに直接対応、チーム・企業向けにベータ提供開始
生成AI「Claude」を開発するAnthropicは、Max・Team・Enterpriseプランのユーザーが、Microsoft Excel上でClaudeを直接利用できる新機能のベータ提供を開始しました。表計算ソフトの代表格であるExcelに高度なAIが組み込まれることで、データ整理からレポ... -
OpenAIの最新モデル「Opus 4.5」が提供開始 主要クラウド3社でも利用可能に
OpenAIは、新たなモデル「Opus 4.5」の提供を開始しました。同モデルはOpenAIのAPIに加え、主要な3つのクラウドプラットフォーム上でも利用できるようになり、開発者や企業が高度なAI機能を取り入れやすい環境が整いつつあります。 Opus 4.5提供開始の概要... -
PerplexityとComet、デフォルト生成モデルを「Nano Banana Pro」「Sora 2 Pro」に刷新—Max加入者に提供
PerplexityとCometが、デフォルトの生成モデルを「Nano Banana Pro」と「Sora 2 Pro」に更新した。現時点ではPerplexity Max加入者が利用可能とされ、日常の問い合わせから高度な生成まで、標準体験の底上げが期待される。 発表の概要 発表のポイント 同社... -
Googleが最新AI「Gemini 3」を発表 Geminiアプリや検索AIモードなど複数プロダクトで展開開始
Googleは今週、最新のAIモデル「Gemini 3」を発表し、Geminiアプリ、検索のAIモード、Google AI Studio、そして“Antigravity”と呼ばれるプラットフォームなど、複数のサービスで利用可能になったとSNS投稿で明らかにした。一連のローンチのダイジェストと... -
MetaのオンデバイスAI基盤「ExecuTorch」が多数デバイスに展開、PyTorch直結で開発を加速
Metaは、オンデバイスAIの実行基盤「ExecuTorch」の展開を加速し、Meta Quest 3やRay-Ban Metaなど複数のデバイスに実装が進んでいると発表しました。モデル変換の手順を削減し、PyTorch内での事前検証をサポートすることで、研究から製品投入までのスピー...



