迪吉奧基礎設施

AI 型號同 GPU

宜家喺受管理嘅前沿模型上面執行代理,或者租用 GPU 容量、部署你自己嘅權重,同埋將 Digio 任務路由去同一個工作區嘅私人端點。

克勞德, GPT ,雙子座 每個代理嘅模型選擇 GPU 租賃同 BYOM
受管理嘅模型

而家喺 Digio 有得賣嘅型號

為每個代理指派預設模型,或者為每個任務覆寫。用量係喺你嘅計劃餘額入面用 Digio 代幣計量 — 無論代理叫 Sonnet 、 GPT-4o 定係 Gemini Flash ,都係同一個錢包。

人類克勞德

  • Claude Opus 4.7 旗艦推理、長背景、架構同策略工作。
  • Claude Opus 4.6 上一代 Opus 提供穩定、高質素嘅分析。
  • Claude Sonnet 4.6 日常驅動程式 — 編碼、寫入同埋多步驟代理循環。
  • Claude Sonnet 4.5 / 4 快速 Sonnet 層,並且可以喺支援嘅工作負載上面即時快取。
  • Claude Haiku 4.5 低延遲草稿、分類同埋大量子任務。

開放人工智能

  • GPT-5.5 / GPT-5.4 / GPT-5.2 最新嘅 GPT-5系列,適用於一般同代理工作量。
  • GPT-4.1 & GPT-4o 可靠嘅多模式即時通訊同工具使用,供生產代理使用。
  • GPT-4o mini 摘要同輕量步驟嘅經濟效益路由。
  • o3 / o3-pro / o3-mini / o4-mini 以推理為中心嘅數學、計劃同驗證模型。
  • GPT-5.3 Codex & Codex mini 代碼生成、重構同埋回購感知代理技能。

谷歌雙子座

  • Gemini 2.5 Pro 長背景研究同結構化提取。
  • Gemini 2.5 Flash 高吞吐量代理步驟,並且具有競爭性嘅代幣率。
  • Gemini 2.0 Flash 用嚟解析、標記同埋批量作業嘅超快通道。

開放同專業 API

  • DeepSeek Chat & Reasoner 對於即時通訊同思維鏈式任務嚟講,價值好高。
  • Mistral Large 多語言代理團隊嘅歐洲主辦選項。
  • Llama 3.3 70B 透過 API 開放權重班模型 — 同私人 GPU 配對得好好。
  • Grok 3 新聞同社會監控代理嘅實時導向模型。
  • Sonar Pro 研究代理嘅搜尋答案。
  • Command R+ 適合 RAG 嘅企業即時通訊同擷取工作流程。

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

用法

代理點樣揀模型

協調員可以根據任務類型推薦 Sonnet vs Opus vs 較平嘅閃光燈型號。高級用戶為每個代理角色設定預設值 — 喺 Sonnet 上面嘅研究、喺 Opus 上面嘅最終評論、喺 Haiku 或者 Gemini Flash 上面嘅大量標記。

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU 租用

租 GPU 同埋自己運行模型

需要微調、空氣差距檢查站,或者可預測嘅推斷定價?喺 Digio 工作區加入專用嘅 GPU 容量,安裝你鍾意嘅服務堆栈,同埋將代理指向你嘅私人端點。

專用嘅實例

每小時或者每月嘅 GPU 节點( A100、 H100、 L40S 級別)附加到你嘅租戶,同其他客戶隔離。

你嘅體重

喺你嘅註冊表上載安全張力器、 GGUF 或者拉取;執行 Llama 、 Mistral 、 Qwen 同埋自訂微調。

標準服務

你維護嘅 vLLM 、 TGI 、 Ollama 或者容器映像 — Digio 代理會調用 OpenAI 兼容嘅基本網址。

同一個編曲

要做嘅嘢,團隊即時通訊、技能同協作係冇變過嘅 — — 只有推斷後端係你嘅。

混合路由

將敏感步驟傳送去私人 GPU ,然後喺一個工作流程入面用 Claude 或者 GPT 進行公開研究。

企業控制

受管制團隊嘅 VPC 對等、靜態出口、審計記錄同埋模型允許清單。

帶埋你自己嘅模型

安裝同連接自訂型號

由零到代理調用你嘅端點嘅典型設定:

  1. 預留 GPU

    揀 VRAM 、區域同正常運作時間(突發同永遠開啟)。重量嘅儲存空間會隨實例一齊運送或者安裝喺你嘅桶上面。

  2. 部署堆栈

    啟動服務映像或者 SSH ,安裝 CUDA 驅動程式,同埋載入檢查點。健康檢查確認個模型已經準備好。

  3. 註冊端點

    喺工作區設定入面加入基本網址、 API 密鑰同埋型號 ID 。 Digio 喺上線之前會驗證延遲同令牌格式。

  4. 分配畀代理

    揀你嘅私人型號作為所選代理嘅預設;管理型 Claude / GPT 模型仍然可以並排使用。

GPU 租賃係同 Digio 計劃訂閱分開收費。如果想知道容量規劃、 SLA 同埋由現有嘅推斷叢集轉移,請聯絡我哋。

常見問題

型號同 GPU 問題

喺 Digio 上面揀受管理嘅 API 同自托管推斷。

我係咪要畀兩次 — — 計劃加 API ?

你嘅 Digio 訂閱包括基礎設施、代理同埋包括嘅 Digio 代幣。受管理嘅模型使用情況會透過實際嘅輸入/輸出令牌扣除令牌平衡。 GPU 租賃係你控制嘅機器嘅附加功能。

唔同代理可唔可以用唔同型號?

係 — 每個代理都可以有自己嘅預設。任務同即時通訊可以喺一次執行嗰陣覆寫,而唔使改變全域預設。

單曲同作品有咩分別?

Opus 係為咗更難嘅推理同更長嘅連貫計劃而調整;對於日常代理循環嚟講,單曲更快同更平。俳句同閃光燈級別嘅型號最適合用嚟做卷子任務。

我可唔可以只執行我自己嘅模型同埋阻止雲端 API ?

企業工作區可以限制出站模型供應商,同埋將所有代理流量路由去你嘅 GPU 端點。混合模式係大部分團隊嘅預設。

有邊啲 GPU 尺寸可以用?

產品取決於地區同需求,通常係7B-70B 級型號嘅24-80 GB VRAM 層,而較大嘅堆栈嘅多 GPU 節點。我哋會幫你根據參數計數同量化嚟調整 VRAM 嘅大小。

私人 GPU 使用係咪仲用緊 Digio 代幣?

組合(代理、任務、儲存空間)會保留喺你嘅計劃入面。你嘅 GPU 上嘅推斷係以 GPU 時間計費;你可以選擇用代幣形嘅用量計入內部退款。

揀受管理型號或者帶埋你嘅 GPU

由今日開始用 Claude 同 GPT ,然後喺你準備好托管自訂權重嗰陣加入專用 GPU — 相同嘅代理、相同嘅任務、你嘅推斷。