Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
42 changes: 37 additions & 5 deletions docs.json
Original file line number Diff line number Diff line change
Expand Up @@ -311,6 +311,12 @@
}
]
},
{
"group": "ByteDance",
"pages": [
"tutorials/video/bytedance/bernini-r"
]
},
{
"group": "Hunyuan",
"pages": [
Expand All @@ -329,7 +335,8 @@
"pages": [
"tutorials/video/kandinsky/kandinsky-5"
]
}
},
"tutorials/video/bytedance/bernini-r"
]
},
{
Expand Down Expand Up @@ -367,6 +374,7 @@
"tutorials/utility/video-segment-sam3",
"tutorials/utility/remove-background-birefnet",
"tutorials/utility/moge",
"tutorials/utility/depth-anything-3",
{
"group": "Face Detection",
"pages": [
Expand Down Expand Up @@ -2836,6 +2844,12 @@
}
]
},
{
"group": "ByteDance",
"pages": [
"zh/tutorials/video/bytedance/bernini-r"
]
},
{
"group": "Hunyuan",
"pages": [
Expand All @@ -2854,7 +2868,8 @@
"pages": [
"zh/tutorials/video/kandinsky/kandinsky-5"
]
}
},
"zh/tutorials/video/bytedance/bernini-r"
]
},
{
Expand Down Expand Up @@ -2892,6 +2907,7 @@
"zh/tutorials/utility/video-segment-sam3",
"zh/tutorials/utility/remove-background-birefnet",
"zh/tutorials/utility/moge",
"zh/tutorials/utility/depth-anything-3",
{
"group": "人脸检测",
"pages": [
Expand Down Expand Up @@ -5361,6 +5377,12 @@
}
]
},
{
"group": "ByteDance",
"pages": [
"ja/tutorials/video/bytedance/bernini-r"
]
},
{
"group": "Hunyuan",
"pages": [
Expand All @@ -5379,7 +5401,8 @@
"pages": [
"ja/tutorials/video/kandinsky/kandinsky-5"
]
}
},
"ja/tutorials/video/bytedance/bernini-r"
]
},
{
Expand Down Expand Up @@ -5417,6 +5440,7 @@
"ja/tutorials/utility/video-segment-sam3",
"ja/tutorials/utility/remove-background-birefnet",
"ja/tutorials/utility/moge",
"ja/tutorials/utility/depth-anything-3",
{
"group": "顔検出",
"pages": [
Expand Down Expand Up @@ -7964,6 +7988,12 @@
}
]
},
{
"group": "ByteDance",
"pages": [
"ko/tutorials/video/bytedance/bernini-r"
]
},
{
"group": "Hunyuan",
"pages": [
Expand All @@ -7982,7 +8012,8 @@
"pages": [
"ko/tutorials/video/kandinsky/kandinsky-5"
]
}
},
"ko/tutorials/video/bytedance/bernini-r"
]
},
{
Expand Down Expand Up @@ -8020,6 +8051,7 @@
"ko/tutorials/utility/video-segment-sam3",
"ko/tutorials/utility/remove-background-birefnet",
"ko/tutorials/utility/moge",
"ko/tutorials/utility/depth-anything-3",
{
"group": "얼굴 감지",
"pages": [
Expand Down Expand Up @@ -10390,4 +10422,4 @@
"destination": "/zh/:slug*"
}
]
}
}
124 changes: 124 additions & 0 deletions ja/tutorials/utility/depth-anything-3.mdx
Original file line number Diff line number Diff line change
@@ -0,0 +1,124 @@
---
title: "ComfyUI Depth Anything 3 公式サンプル"
description: "ComfyUI で Depth Anything 3 を使用した画像と動画の単眼・多視点深度推定を学びましょう。"
sidebarTitle: "Depth Anything 3"
translationSourceHash: d646a0e3
translationFrom: tutorials/utility/depth-anything-3.mdx
---

import UpdateReminder from '/snippets/ja/tutorials/update-reminder.mdx'

# ComfyUI Depth Anything 3 概要

[Depth Anything 3 (DA3)](https://github.com/ByteDance-Seed/Depth-Anything-3) は、ByteDance Seed が開発したビジョントランスフォーマーで、カメラポーズの有無にかかわらず、任意のビジュアル入力から空間的に一貫したジオメトリを復元します。単一の DINO エンコーダと統一された深度-レイ表現により、同一モデルファミリーで単眼深度、多視点深度、カメラポーズ推定、3D 再構築をカバーします。

主な機能:

- **統一された単眼・多視点深度**:単一または複数の画像から深度を推定
- **カメラポーズ推定**:順序なし画像セットからカメラ位置を復元
- **3D 再構築**:多視点入力をサポート
- **動画深度推定**:動画入力のフレームごとの深度シーケンスを生成
- **複数のモデルバリアント**:Small、Base、Mono/Metric Large

<UpdateReminder/>

<Tip>
ComfyUI は Depth Anything 3 ノードをネイティブサポートしています。始める前に [ComfyUI](https://github.com/Comfy-Org/ComfyUI) を最新バージョンに更新してください。
</Tip>

## モデルインストール

Depth Anything 3 チェックポイントをダウンロードし、対応する ComfyUI フォルダに保存します:

- **Small** ([depth_anything_3_small.safetensors](https://huggingface.co/Comfy-Org/Depth-Anything-3/resolve/main/geometry_estimation/depth_anything_3_small.safetensors)) — 軽量で高速な推論
- **Base** ([depth_anything_3_base.safetensors](https://huggingface.co/Comfy-Org/Depth-Anything-3/resolve/main/geometry_estimation/depth_anything_3_base.safetensors)) — バランスの取れた性能
- **Mono-Large** ([depth_anything_3_mono_large.safetensors](https://huggingface.co/Comfy-Org/Depth-Anything-3/resolve/main/geometry_estimation/depth_anything_3_mono_large.safetensors)) — 単眼深度に最適(空検出対応)
- **Metric-Large** ([depth_anything_3_metric_large.safetensors](https://huggingface.co/Comfy-Org/Depth-Anything-3/resolve/main/geometry_estimation/depth_anything_3_metric_large.safetensors)) — メートル単位の物理深度(空検出対応)

```
ComfyUI/
├── models/
│ ├── geometry_estimation/
│ │ ├── depth_anything_3_small.safetensors
│ │ ├── depth_anything_3_base.safetensors
│ │ ├── depth_anything_3_mono_large.safetensors
│ │ └── depth_anything_3_metric_large.safetensors
```

## サンプルワークフロー

---

## 1. 画像深度推定

**機能説明:** 1 枚の画像をアップロードし、**Image Depth Estimation (Depth Anything 3)** を実行して深度マップを生成します。**Depth Preview** に元画像と深度出力のサイドバイサイド比較が表示されます。

<CardGroup cols={2}>
<Card title="ワークフローをダウンロード" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/utility_depth_anything3_image_depth_estimation.json">
JSON をダウンロード または テンプレートライブラリで "Depth Anything 3" を検索
</Card>
<Card title="サンプル画像をダウンロード" icon="image" href="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/input/retro_futuristic_home.png">
このワークフローのサンプル入力画像を取得
</Card>
</CardGroup>

<div style={{display: 'flex', gap: '1rem', flexWrap: 'wrap'}}>
<img src="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/utility_depth_anything3_image_depth_estimation-1.webp" alt="画像深度推定出力" style={{maxWidth: '48%', height: 'auto'}} />
<img src="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/utility_depth_anything3_image_depth_estimation-2.webp" alt="画像深度推定比較" style={{maxWidth: '48%', height: 'auto'}} />
</div>

### 実行手順

1. **LoadImage** — 入力画像を読み込む
2. **LoadDA3Model** — Depth Anything 3 バリアントを選択
3. **実行** — Queue をクリックするか `Cmd+Enter` を押す
4. ワークフローが深度マップと並列比較を出力

<Card title="サブグラフについて" icon="book-open" href="/ja/interface/features/subgraph">
このワークフローはモジュール処理にサブグラフノードを使用しています。サブグラフのカスタマイズと拡張についてはサブグラフのドキュメントをご覧ください。
</Card>

---

## 2. 動画深度推定

**機能説明:** 動画をアップロードし、**Video Depth Estimation (Depth Anything 3)** を実行してフレームごとの深度シーケンスを生成します。サブグラフ内では **GetVideoComponents** が入力動画をフレームに分割し、**LoadDA3Model** がモデルを読み込み、**SetVideoComponents** が深度フレームを動画に再構成します。

<CardGroup cols={2}>
<Card title="ワークフローをダウンロード" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/utility_depth_anything3_video_depth_estimation.json">
JSON をダウンロード または テンプレートライブラリで "Depth Anything 3" を検索
</Card>
<Card title="Comfy Cloud で実行" icon="cloud" href="https://cloud.comfy.org/?template=utility_depth_anything3_video_depth_estimation&utm_source=docs&utm_medium=referral&utm_campaign=depth-anything-3">
Comfy Cloud で開く
</Card>
</CardGroup>

![動画深度推定プレビュー](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/utility_depth_anything3_video_depth_estimation-1.webp)

### 実行手順

1. **LoadVideo** — 入力動画を読み込む
2. **モデルを選択** — **Small**、**Base**、**Mono-Large**、**Metric-Large** から選択
3. **実行** — Queue をクリックするか `Cmd+Enter` を押す
4. ワークフローがフレームごとの深度マップ動画を出力

<Card title="サブグラフについて" icon="book-open" href="/ja/interface/features/subgraph">
このワークフローはモジュール処理にサブグラフノードを使用しています。サブグラフのカスタマイズと拡張についてはサブグラフのドキュメントをご覧ください。
</Card>

## モデルバリアント

| バリアント | head_type | 空検出 | 信頼度 | カメラデコーダ | 最適な用途 |
|-----------|-----------|:-------:|:------:|:--------------:|------------|
| **Small** | dualdpt | ❌ | ✅ | ✅ | 高速推論、モバイル/エッジ |
| **Base** | dualdpt | ❌ | ✅ | ✅ | バランスの取れた性能 |
| **Mono-Large** | dpt | ✅ | ❌ | ❌ | 空検出対応の単眼深度 |
| **Metric-Large** | dpt | ✅ | ❌ | ❌ | メートル単位の物理深度 |

- **Small** と **Base** は `dualdpt` ヘッドタイプを使用し、信頼度推定とカメラデコーダをサポート(多視点アプリケーション向け)。
- **Mono-Large** と **Metric-Large** は `dpt` ヘッドタイプを使用し、空検出に対応。Metric-Large はメートル単位の生深度を出力。

## コミュニティリソース

- [Depth Anything 3 GitHub (ByteDance-Seed)](https://github.com/ByteDance-Seed/Depth-Anything-3) — 研究論文とコード
- [Comfy-Org/Depth-Anything-3](https://huggingface.co/Comfy-Org/Depth-Anything-3) — 公式 ComfyUI モデル重み
Loading
Loading