AIニュース– archive –
-
Gemini 3が示す新境地:単一プロンプトでインタラクティブな3Dゲーム生成、コーディング能力の進化が鮮明に
生成AIモデル「Gemini 3」が、単一のプロンプトからインタラクティブな3Dデザインのゲームを構築できることを示し、コーディング能力の大幅な進化をアピールした。複雑な指示を受け止め、ゲームの設計や美的表現まで反映するデモは、開発現場のプロトタイ... -
新世代「Segment Anything」登場:SAM 3とSAM 3Dが画像・動画・3D理解を加速
画像の切り抜きで知られる「Segment Anything」に新世代モデルが登場しました。発表によると、SAM 3は画像と動画の物体検出・セグメンテーション・追跡を一体でこなせるほか、短いテキストフレーズや例示(エグザンプル)によるプロンプトにも対応。さらに... -
ワーナー・ミュージックがAI企業と提携、倫理的学習モデルでプロ向け音楽制作ツールを共同開発
ワーナー・ミュージックがAI企業との提携を発表し、倫理的に学習したモデルを活用して、アーティスト、ソングライター、プロデューサーが実験・作曲・制作できるプロフェッショナル向けツールを共同開発する。創作の新しい形を切り拓くとともに、制作現場... -
Unitreeのヒューマノイド「G1」が新動作を公開 ジークンドー風アクロバットで機敏さを披露
中国のロボティクス企業・Unitreeが、ヒューマノイドロボット「G1」の最新アップデートを公開。新たにジークンドー風のアクションを取り入れ、軽快なフットワークや素早い体重移動といったアクロバティックな所作を披露しました。SNSで公開された短編デモ... -
AIモデル「SAM 3」が野生動物の生存監視を加速 Conservation Xが絶滅リスク低減へ活用
AIビジョンモデル「SAM 3」の精密な物体検出・追跡機能が、Conservation Xの野生動物モニタリングを支援している。世界各地の動物種の「生存状況の測定」を高効率・高精度で行い、絶滅の未然防止につなげる狙いだとされる。 取り組みの概要 背景:絶滅危機... -
「SAM 3D」発表:日常画像から“わかる”3Dを生成、オブジェクトと人体の2モデルで最先端性能
SAMコレクションに新たに「SAM 3D」が加わりました。静止した2D画像から、物体・シーン、そして人体のポーズや形状までを高精度に3D再構築する2つのモデルを搭載し、日常画像に対する“コモンセンス”な3D理解を目指すとしています。 発表の概要 SAM 3Dとは ... -
単一画像から精密3D再構成「SAM 3D」登場—編集・ロボティクス・対話的生成に期待
単一の画像から高精度な3D再構成を可能にする「SAM 3D」が発表された。画像・動画編集、ロボティクス、インタラクティブなシーン生成など実世界の用途を想定し、研究者のMatt氏は人物と複雑な環境の双方に対応する二つのモデル設計が鍵だと説明している。 ... -
SAM 3D Body/Objects、チェックポイントや人体データを公開—ロボティクスなど実世界応用を後押し
3D認識の研究プロジェクト「SAM 3D Body / SAM 3D Objects」が、モデルチェックポイント、評価ベンチマーク、人体向け学習データ、推論コードをコミュニティに公開した。ロボティクス、インタラクティブメディア、科学、スポーツ医療など幅広い分野での創... -
SAM 3発表——画像・動画の検出・分割・追跡を統合、Instagram機能にも展開へ
新しい統合モデル「SAM 3」が公開されました。画像と動画をまたいで、物体の検出・セグメンテーション(領域分割)・トラッキング(追跡)を一つのモデルで実現し、テキストや類例(エグザンプラ)によるプロンプト指定で、特定カテゴリの対象を一括抽出で... -
Metaが「Segment Anything Playground」を発表—SAM 3/3Dで直感的なメディア編集体験
Metaは、最新のセグメンテーションモデル「SAM 3」「SAM 3D」を試せる新プラットフォーム「Segment Anything Playground」を発表しました。画像・動画、さらに立体コンテンツまで、対象領域の切り出しや編集をより直感的に行える体験を提案します。本記事... -
SAM 3が物体検出と追跡を単一アーキテクチャで統合—難題に挑む新アプローチ、研究者Christoph氏が開発の要点を紹介
コンピュータビジョンの長年の難題である「物体検出」と「追跡」を、ひとつのモデルアーキテクチャで統合する——そんな挑戦に取り組むのが最新研究「SAM 3」です。研究チームのChristoph氏は、どのようにして統合を実現したのか、その道のりと意義を共有し... -
ConservationXと共同開発の野生動物動画データセット「SA-FARI」公開—1万本超・100種以上をアノテーション
野生動物の保全を後押しする新たなAI向け学習素材として、ConservationXと協力して構築された動画データセット「SA-FARI」が公開された。1万本超のアノテーション済み動画を収録し、100種以上の動物をカバー。世界各地の保全活動や研究者の解析を加速する... -
Roboflowと提携でSAM 3のアノテーション・微調整・デプロイを一体提供、すぐ試用可能に
コンピュータービジョンの開発者に朗報だ。データアノテーション、モデルの微調整(ファインチューニング)、本番デプロイまでを一気通貫で行える体制が、Roboflowとの提携により「SAM 3」で実現した。発表では「すぐ試せる」リンクも公開され、現場の課題... -
AIモデル「SAM 3」が公開――専用ライセンス下でベンチマーク・チェックポイント・微調整用コードを同時提供、メディア編集や科学分析を後押し
次世代AIモデル「SAM 3」が専用のSAMライセンスの下で公開され、評価ベンチマーク、モデルチェックポイント、推論・微調整用のオープンソースコードが同時に提供されました。メディア編集や科学分析など、高度なアプリケーションの開発を後押しする狙いで... -
画像を“体験”に変えるAI「Gemini 3」登場 深層マルチモーダル理解で盤面も間取りもインタラクティブに
画像を撮るだけで、それが対話できる“体験”に変わる――AIモデル「Gemini 3」は、ボードゲームの盤面や間取り図、手描きの落書きといった静止画を解析し、ユーザーが触って試せるインタラクティブなコンテンツへと変換できるとされる。深いマルチモーダル理... -
WMT 2025で「Command A Translate」を発表、企業向け安全翻訳の新標準を掲げる
機械翻訳の国際評価会議 WMT 2025 において、開発チームが企業向けの安全な翻訳モデル「Command A Translate」の開発プロセスを発表した。論文では学習・評価の詳細に加え、データ準備パイプラインも示されており、同チームは本モデルが「安全性とエンター... -
国際ロボット展で話題 ヒューマノイドロボットがMrs. GREEN APPLE「ダンスホール」を華麗に披露
2025年の国際ロボット展で、ヒューマノイドロボットが人気バンド・Mrs. GREEN APPLEの楽曲「ダンスホール」に合わせてキレのあるダンスを披露し、会場とSNSで大きな注目を集めています。人間さながらの動きと表現力に、「ロボットってここまで踊れるの?」... -
EngineAI社の人型ロボット「PM01」が日本初披露 発光コア搭載のメタリックボディ、実運用へ準備進む
EngineAI社の人型ロボット「PM01」が日本で初披露された。メタリックな外装と胸部で発光するコアが目を引く同機は、本格稼働に向けた「火入れ」の準備が進んでいるという。限られた情報ながら、国内ロボティクス市場に新たな選択肢が登場した意味は小さく... -
GMOインターネットグループ、2025国際ロボット展で国内初のヒューマノイド3種同時展示
GMOインターネットグループは、本日から4日間開催される「2025国際ロボット展」に出展し、国内初となる3種類のヒューマノイドロボットの同時展示や、ロボットが接客するカフェ、操縦体験コーナーなどを通じて、「人とロボットが共存する未来」を来場者に体... -
百度(Baidu)、2025年Q3決算を発表—生成AIと自動運転の収益化が焦点
中国検索大手の百度(Baidu)は、2025年第3四半期(Q3)の決算を発表した。詳細な数値やセグメント別の内訳は同社の公式リリース(発表資料)で確認できる。本稿では、生成AIやクラウド、自動運転、広告の回復動向など、投資家・事業担当者が注目すべき論...




