Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

迪吉奧基礎設施

AI 型號同 GPU

宜家喺受管理嘅前沿模型上面執行代理，或者租用 GPU 容量、部署你自己嘅權重，同埋將 Digio 任務路由去同一個工作區嘅私人端點。

克勞德， GPT ，雙子座每個代理嘅模型選擇 GPU 租賃同 BYOM

建立工作區計劃同代幣

受管理嘅模型

而家喺 Digio 有得賣嘅型號

為每個代理指派預設模型，或者為每個任務覆寫。用量係喺你嘅計劃餘額入面用 Digio 代幣計量 — 無論代理叫 Sonnet 、 GPT-4o 定係 Gemini Flash ，都係同一個錢包。

人類克勞德

Claude Opus 4.7 旗艦推理、長背景、架構同策略工作。
Claude Opus 4.6 上一代 Opus 提供穩定、高質素嘅分析。
Claude Sonnet 4.6 日常驅動程式 — 編碼、寫入同埋多步驟代理循環。
Claude Sonnet 4.5 / 4 快速 Sonnet 層，並且可以喺支援嘅工作負載上面即時快取。
Claude Haiku 4.5 低延遲草稿、分類同埋大量子任務。

開放人工智能

GPT-5.5 / GPT-5.4 / GPT-5.2 最新嘅 GPT-5系列，適用於一般同代理工作量。
GPT-4.1 & GPT-4o 可靠嘅多模式即時通訊同工具使用，供生產代理使用。
GPT-4o mini 摘要同輕量步驟嘅經濟效益路由。
o3 / o3-pro / o3-mini / o4-mini 以推理為中心嘅數學、計劃同驗證模型。
GPT-5.3 Codex & Codex mini 代碼生成、重構同埋回購感知代理技能。

谷歌雙子座

Gemini 2.5 Pro 長背景研究同結構化提取。
Gemini 2.5 Flash 高吞吐量代理步驟，並且具有競爭性嘅代幣率。
Gemini 2.0 Flash 用嚟解析、標記同埋批量作業嘅超快通道。

開放同專業 API

DeepSeek Chat & Reasoner 對於即時通訊同思維鏈式任務嚟講，價值好高。
Mistral Large 多語言代理團隊嘅歐洲主辦選項。
Llama 3.3 70B 透過 API 開放權重班模型 — 同私人 GPU 配對得好好。
Grok 3 新聞同社會監控代理嘅實時導向模型。
Sonar Pro 研究代理嘅搜尋答案。
Command R+ 適合 RAG 嘅企業即時通訊同擷取工作流程。

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

用法

代理點樣揀模型

協調員可以根據任務類型推薦 Sonnet vs Opus vs 較平嘅閃光燈型號。高級用戶為每個代理角色設定預設值 — 喺 Sonnet 上面嘅研究、喺 Opus 上面嘅最終評論、喺 Haiku 或者 Gemini Flash 上面嘅大量標記。

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU 租用

租 GPU 同埋自己運行模型

需要微調、空氣差距檢查站，或者可預測嘅推斷定價？喺 Digio 工作區加入專用嘅 GPU 容量，安裝你鍾意嘅服務堆栈，同埋將代理指向你嘅私人端點。

專用嘅實例

每小時或者每月嘅 GPU 节點（ A100、 H100、 L40S 級別）附加到你嘅租戶，同其他客戶隔離。

你嘅體重

喺你嘅註冊表上載安全張力器、 GGUF 或者拉取；執行 Llama 、 Mistral 、 Qwen 同埋自訂微調。

標準服務

你維護嘅 vLLM 、 TGI 、 Ollama 或者容器映像 — Digio 代理會調用 OpenAI 兼容嘅基本網址。

同一個編曲

要做嘅嘢，團隊即時通訊、技能同協作係冇變過嘅 — — 只有推斷後端係你嘅。

混合路由

將敏感步驟傳送去私人 GPU ，然後喺一個工作流程入面用 Claude 或者 GPT 進行公開研究。

企業控制

受管制團隊嘅 VPC 對等、靜態出口、審計記錄同埋模型允許清單。

帶埋你自己嘅模型

安裝同連接自訂型號

由零到代理調用你嘅端點嘅典型設定：

預留 GPU

揀 VRAM 、區域同正常運作時間（突發同永遠開啟）。重量嘅儲存空間會隨實例一齊運送或者安裝喺你嘅桶上面。
部署堆栈

啟動服務映像或者 SSH ，安裝 CUDA 驅動程式，同埋載入檢查點。健康檢查確認個模型已經準備好。
註冊端點

喺工作區設定入面加入基本網址、 API 密鑰同埋型號 ID 。 Digio 喺上線之前會驗證延遲同令牌格式。
分配畀代理

揀你嘅私人型號作為所選代理嘅預設；管理型 Claude / GPT 模型仍然可以並排使用。

GPU 租賃係同 Digio 計劃訂閱分開收費。如果想知道容量規劃、 SLA 同埋由現有嘅推斷叢集轉移，請聯絡我哋。

常見問題

型號同 GPU 問題

喺 Digio 上面揀受管理嘅 API 同自托管推斷。

我係咪要畀兩次 — — 計劃加 API ？

你嘅 Digio 訂閱包括基礎設施、代理同埋包括嘅 Digio 代幣。受管理嘅模型使用情況會透過實際嘅輸入/輸出令牌扣除令牌平衡。 GPU 租賃係你控制嘅機器嘅附加功能。

唔同代理可唔可以用唔同型號？

係 — 每個代理都可以有自己嘅預設。任務同即時通訊可以喺一次執行嗰陣覆寫，而唔使改變全域預設。

單曲同作品有咩分別？

Opus 係為咗更難嘅推理同更長嘅連貫計劃而調整；對於日常代理循環嚟講，單曲更快同更平。俳句同閃光燈級別嘅型號最適合用嚟做卷子任務。

我可唔可以只執行我自己嘅模型同埋阻止雲端 API ？

企業工作區可以限制出站模型供應商，同埋將所有代理流量路由去你嘅 GPU 端點。混合模式係大部分團隊嘅預設。

有邊啲 GPU 尺寸可以用？

產品取決於地區同需求，通常係7B-70B 級型號嘅24-80 GB VRAM 層，而較大嘅堆栈嘅多 GPU 節點。我哋會幫你根據參數計數同量化嚟調整 VRAM 嘅大小。

私人 GPU 使用係咪仲用緊 Digio 代幣？

組合（代理、任務、儲存空間）會保留喺你嘅計劃入面。你嘅 GPU 上嘅推斷係以 GPU 時間計費；你可以選擇用代幣形嘅用量計入內部退款。

探索迪吉奧

將模型放入工作中

代理、任務同技能 — — 你揀嘅模型嘅工作空間。

揀受管理型號或者帶埋你嘅 GPU

由今日開始用 Claude 同 GPT ，然後喺你準備好托管自訂權重嗰陣加入專用 GPU — 相同嘅代理、相同嘅任務、你嘅推斷。

開始啦比較計劃