人類克勞德
- Claude Opus 4.7 旗艦推理、長背景、架構同策略工作。
- Claude Opus 4.6 上一代 Opus 提供穩定、高質素嘅分析。
- Claude Sonnet 4.6 日常驅動程式 — 編碼、寫入同埋多步驟代理循環。
- Claude Sonnet 4.5 / 4 快速 Sonnet 層,並且可以喺支援嘅工作負載上面即時快取。
- Claude Haiku 4.5 低延遲草稿、分類同埋大量子任務。
為每個代理指派預設模型,或者為每個任務覆寫。用量係喺你嘅計劃餘額入面用 Digio 代幣計量 — 無論代理叫 Sonnet 、 GPT-4o 定係 Gemini Flash ,都係同一個錢包。
Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.
協調員可以根據任務類型推薦 Sonnet vs Opus vs 較平嘅閃光燈型號。高級用戶為每個代理角色設定預設值 — 喺 Sonnet 上面嘅研究、喺 Opus 上面嘅最終評論、喺 Haiku 或者 Gemini Flash 上面嘅大量標記。
Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.
需要微調、空氣差距檢查站,或者可預測嘅推斷定價?喺 Digio 工作區加入專用嘅 GPU 容量,安裝你鍾意嘅服務堆栈,同埋將代理指向你嘅私人端點。
每小時或者每月嘅 GPU 节點( A100、 H100、 L40S 級別)附加到你嘅租戶,同其他客戶隔離。
喺你嘅註冊表上載安全張力器、 GGUF 或者拉取;執行 Llama 、 Mistral 、 Qwen 同埋自訂微調。
你維護嘅 vLLM 、 TGI 、 Ollama 或者容器映像 — Digio 代理會調用 OpenAI 兼容嘅基本網址。
要做嘅嘢,團隊即時通訊、技能同協作係冇變過嘅 — — 只有推斷後端係你嘅。
將敏感步驟傳送去私人 GPU ,然後喺一個工作流程入面用 Claude 或者 GPT 進行公開研究。
受管制團隊嘅 VPC 對等、靜態出口、審計記錄同埋模型允許清單。
由零到代理調用你嘅端點嘅典型設定:
揀 VRAM 、區域同正常運作時間(突發同永遠開啟)。重量嘅儲存空間會隨實例一齊運送或者安裝喺你嘅桶上面。
啟動服務映像或者 SSH ,安裝 CUDA 驅動程式,同埋載入檢查點。健康檢查確認個模型已經準備好。
喺工作區設定入面加入基本網址、 API 密鑰同埋型號 ID 。 Digio 喺上線之前會驗證延遲同令牌格式。
揀你嘅私人型號作為所選代理嘅預設;管理型 Claude / GPT 模型仍然可以並排使用。
GPU 租賃係同 Digio 計劃訂閱分開收費。如果想知道容量規劃、 SLA 同埋由現有嘅推斷叢集轉移,請聯絡我哋。
喺 Digio 上面揀受管理嘅 API 同自托管推斷。
你嘅 Digio 訂閱包括基礎設施、代理同埋包括嘅 Digio 代幣。受管理嘅模型使用情況會透過實際嘅輸入/輸出令牌扣除令牌平衡。 GPU 租賃係你控制嘅機器嘅附加功能。
係 — 每個代理都可以有自己嘅預設。任務同即時通訊可以喺一次執行嗰陣覆寫,而唔使改變全域預設。
Opus 係為咗更難嘅推理同更長嘅連貫計劃而調整;對於日常代理循環嚟講,單曲更快同更平。俳句同閃光燈級別嘅型號最適合用嚟做卷子任務。
企業工作區可以限制出站模型供應商,同埋將所有代理流量路由去你嘅 GPU 端點。混合模式係大部分團隊嘅預設。
產品取決於地區同需求,通常係7B-70B 級型號嘅24-80 GB VRAM 層,而較大嘅堆栈嘅多 GPU 節點。我哋會幫你根據參數計數同量化嚟調整 VRAM 嘅大小。
組合(代理、任務、儲存空間)會保留喺你嘅計劃入面。你嘅 GPU 上嘅推斷係以 GPU 時間計費;你可以選擇用代幣形嘅用量計入內部退款。
代理、任務同技能 — — 你揀嘅模型嘅工作空間。