AIニュース– archive –
-
ChatGPTに音声会話機能が統合 アプリ更新だけで利用可能に
対話型AI「ChatGPT」で、音声による会話機能(ChatGPT Voice)が専用モードなしで使えるようになりました。アプリやブラウザからそのまま話しかけるだけで音声対話ができ、回答のテキスト表示や画像・地図の表示もリアルタイムで行われます。 ChatGPT Voic... -
ChatGPTにPelotonやTripadvisor、Target公式アプリ登場 ショッピングや旅行計画が一段と手軽に
対話型AI「ChatGPT」上で、フィットネスのPeloton(ペロトン)、旅行口コミサイトのTripadvisor(トリップアドバイザー)、米小売大手Target(ターゲット)といった公式アプリが利用可能になった。ユーザーはチャットの対話感覚のまま、ワークアウト提案や... -
ChatGPTに「ショッピングリサーチ」機能登場 無料ユーザーも利用可能に
対話型AI「ChatGPT」に、商品の比較検討を支援する新機能「ショッピングリサーチ」が導入されました。モバイルとWebの両方で、ログイン済みの無料プランを含む幅広いユーザーが順次利用できるようになります。 ChatGPT「ショッピングリサーチ」機能の概要 ... -
スクリーンショットから数秒でログイン画面生成?Blackbox AIが変えるフロントエンド開発
コードを書く前に、まずはUIのスクリーンショットを用意するだけ——。開発者向けAIツール「Blackbox AI」が、画像から本格的な認証ページを数秒で生成するデモを公開し、フロントエンド開発の常識を塗り替える可能性として注目されています。 Blackbox AIと... -
言葉なしで美学を探求する「Style Creator」早期版が公開—直感的なスタイル設計の未来に一歩
新機能「Style Creator」の早期版が公開された。公式のアナウンスによれば、テキストを使わずに新しい美的スタイルを作成・探索する体験を目指す大きな一歩で、「未来を少し先取りできる」試みだという。現時点では詳細は限定的だが、クリエイティブ制作の... -
Midjourneyが「Midjourney TV」を試験公開:コミュニティ発のトレンド動画をライブ視聴、ウィンドウ形状に自動最適化
AIビジュアルプラットフォームのMidjourneyが、新たな実験「Midjourney TV」を告知しました。コミュニティの“今”を映すトレンド動画をブラウザ上でライブ視聴でき、ウィンドウ形状に自動フィット、複数ウィンドウ同時視聴にも対応するとしています。本稿で... -
標準プランにHD動画生成、小規模バッチでコスト削減も—コミュニティ提案を反映した新機能が公開
コミュニティの声を受けて、動画生成サービスが複数の新機能を同時リリースしました。標準サブスクリプションでもHD動画生成が可能になり、少量・小規模のバッチでコストを抑えた制作がしやすくなったほか、モデレーション精度とサムネイル品質も改善。個... -
MidjourneyがHD動画モード提供開始:Pro/Mega限定、ピクセル数約4倍・コスト約3.2倍
画像生成AIのMidjourneyが、新たに「HD Video」モードを公開しました。対象はProとMegaの有料プラン加入者で、従来のSD出力に比べピクセル数が約4倍に拡大。その一方でコストは約3.2倍とされ、最高品質の映像を必要とするプロフェッショナル用途に焦点を当... -
Anthropic、長時間動作するAIエージェントの新手法を公開 人間エンジニアの働き方から発想
AIエージェントを長時間動かし続け、複数のタスクや大量の情報をまたいで作業させる――そんな未来に向けて、Anthropicのエンジニアリングブログが「長時間実行エージェント」の課題と、その解決に向けた新しいアプローチを紹介しました。人間のソフトウェア... -
Gemini 3への反響受け、Sundar Pichai氏との対談が明らかに—Google AIの次章に期待集まる
最新AI「Gemini 3」に対する反響と「次は何が来るのか」という関心の高まりを受け、@OfficialLoganK 氏が GoogleおよびAlphabetのCEO、@sundarpichai 氏と対談したことが英語のSNS投稿で示された。詳細は未公表ながら、Google AIの今後に関する手がかりが... -
Perplexity、有料プランで「Grok 4.1」を提供開始—Pro/Max加入者は即日アクセス可能に
AI検索プラットフォームのPerplexityは、最新の大規模言語モデル「Grok 4.1」の提供を開始しました。対象は有料のProおよびMax加入者で、同社の発表によれば全加入者が利用可能になっています。これにより、調査・要約・作図・コーディング補助などの日常... -
カーネギーメロン大、SAM 3Dで臨床リハビリをデータ駆動化—患者ごとに最適な回復支援へ
リハビリテーションの現場で、3Dモーション解析技術「SAM 3D」の活用が進んでいます。カーネギーメロン大学(Carnegie Mellon University)の研究チームは、臨床環境でSAM 3Dを使い、人の動きを捉えて解析。回復過程をデータで見える化し、患者ごとの状態... -
ERNIE 5.0がクロスモーダル出力を公開—“オムニモーダル”AIの実演が示す次の一手
最新モデル「ERNIE 5.0」が、公式X(旧Twitter)でクロスモーダル出力のデモを公開した。テキストや画像など複数のモードを横断する“オムニモーダル”能力をうたう同モデルの実演で、利用シーンの拡大と導入上の論点が浮き彫りになった。 概要 投稿の要点 ... -
ERNIE 5.0が「読む・見る・聴く・考える」を統合 ネイティブ・オムニモーダルAIの次段階へ
テキスト・画像・音声を横断して理解し、ひとつの知能として推論する――新モデル「ERNIE 5.0」が“ネイティブなオムニモーダル”として紹介された。短い告知ながら、複数モードを前提に設計された次世代AIの方向性を示す発表で、モデル構築の解説も合わせて公... -
Anthropicが「Claude Opus 4.5」を発表—コーディング・エージェント・PC操作で“世界最高”を標榜、仕事の在り方に一石
Anthropicは最新モデル「Claude Opus 4.5」を発表し、コーディング、エージェント、コンピュータ利用(Computer Use)の分野で“世界最高”の性能を謳いました。同社は、今回のアップデートがAIの実用能力を一段押し上げ、今後の働き方の大きな転換を示唆す... -
ChatGPTに「ショッピングリサーチ」登場——対話型の製品選び支援で賢い購買判断を後押し
OpenAIはX(旧Twitter)で、ChatGPT内に製品選びを支援する新体験「ショッピングリサーチ」を発表しました。深掘り型の調査に、双方向のインターフェースを組み合わせ、より賢い購買判断を助けることを狙います。本稿では、発表内容から読み取れるポイント... -
Baiduが「Baidu World 2025」最新ハイライトを追加公開、ERNIE 5.0の実演を予告
中国のBaiduは、年次イベント「Baidu World 2025」の新たなハイライト映像をSNSで公開し、次世代AIモデル「ERNIE 5.0」の“実演”を含む内容を予告しました。詳細は今後の開示待ちですが、最新モデルの動作が確認できるとして注目を集めています。 発表の概... -
対話AI「Claude」、コンテキスト使用率を表示できるステータスライン機能を追加
対話型AI「Claude」で、コンテキストウィンドウ(会話の履歴として保持される情報)の使用状況をステータスラインに表示できる新機能が登場しました。ユーザーはコマンドを使ってステータスラインをカスタマイズし、コンテキストの利用率をパーセント表示... -
Chrome版「Claude」がサイドパネルに登場 ブラウジングしながら常時使えるAIアシスタント
対話型AI「Claude(クロード)」が、Google Chrome上でサイドパネルとして動作する新しい形で提供されました。ブラウジング中もパネルを開いたままにでき、既存のログイン情報やブックマークと連携しながら、調べ物や要約、文章作成をシームレスに行える点... -
OpenAIが「Agent Skills」をオープン標準として公開 AIエージェントの“共通スキル”時代へ
OpenAIは、AIエージェントが利用する「Agent Skills(エージェント・スキル)」をオープン標準として公開すると発表しました。これにより、特定の企業やプラットフォームに依存しない「共通のスキル仕様」が整備され、さまざまなAIサービス間でスキルを共...



