1. 登入官網 forge.vyvo.com,並前往「Explore (探索)」頁面
2. 選擇您想使用的工具,例如「Quick Image Generator (快速圖像生成器)」
3. 於「Prompt (提示詞)」欄位中,詳細描述您希望 Forge 生成的圖像內容
4. 如有「Negative Prompt (反向提示詞)」欄位,可於此說明您不希望出現的元素,此欄位為選填,但填寫後有助於提升生成效果
5. 設定選項中,依據所選工具,可調整媒體尺寸、結果與提示詞的貼合程度、內容品質、影片長度等參數,部分工具亦提供進階設定,標示紅色星號為必填欄位,未標示者則為選填
6. 當您完成設定後,請確認點數餘額充足,接著點選「Run (執行)」按鈕,最終生成結果將顯示於畫面右側視窗中
如欲使用 Forge 進行創作,您需要使用點數,不同工具會消耗不同數量的點數。
而您只需訂閱 Vyvo AI 方案,每項方案皆包含固定數量的點數,每月提供 2,000 或 10,000 點,並會在每次續訂時重置您的點數餘額。
您可在各工具頁面查看所需點數,例如,在「Video Creator (影片製作)」頁面中,向下滑動至「Run (執行)」按鈕,即可在其上方看到預估所需點數,實際扣除點數以最終產出時的計算值為準。
若任務執行失敗,將不會扣除任何點數。
您可在首頁或頁面右上角查看剩餘點數餘額。
How can I top up Credits to use in Vyvo Forge? →
創作具備同步音效與音訊的影片內容。只需描述您的場景,即可生成完整且音畫同步的影片——包含腳步聲、音樂、環境氛圍音等多種聲音元素,支援以文字或圖片作為輸入來源。
進入該頁面後,您會來到 Playground 頁面。在此,您可向 Forge 指示您想要建立的內容。在畫面左側,您會看到「Inputs」和「Settings」,並可在此輸入相關指示。
輸入
- 提示詞(必填): 在此描述您希望最終影片呈現的場景、動作及整體風格。
範例:一位機車騎士在霓虹燈照亮的隧道中疾馳,側向跟拍鏡頭,濕滑路面上的反射光快速掠過,伴隨脈動的合成器低音、引擎轟鳴聲與隧道混響,呈現高對比的賽博龐克氛圍。
- 首幀畫面(選填): 在此上傳您想要製作成動畫的圖片;Forge 會根據該圖片生成整個場景。清晰的人像通常效果最佳。支援格式:jpg、png、gif、webp。
- 結尾畫面(選填): 若您希望影片包含不同場景或主體,可在此上傳結尾畫面,或上傳另一張圖片,讓影片從一張圖過渡至另一張圖。支援格式:jpg、png、gif、webp。
- 音訊輸入模式: 您可上傳已完成的語音音軌(上傳音訊,選填),或輸入文字讓 Forge 自動生成語音(生成語音;選擇此項時需填寫 Speech Text)。
- Voice ID(選填): 您可從多種聲音(男性或女性)中選擇語音。
- 參考音訊(選填): 您可上傳語音錄音作為參考,Forge 會生成與其盡可能相似的語音。支援格式:mp3、wav、ogg、flac。
設定
- 模式:您可選擇影片的生成方式,例如文字生成影片、圖像生成影片或補幀動畫。
- 解析度:在此選擇輸出解析度。解析度越高,所需時間越長,資源消耗也越高。
- 影片長度:設定影片長度,最短為 2 秒,最長為 20 秒。影片越長,生成時間越久。
- 提示詞增強:啟用後,Forge 會自動擴展提示內容。若您希望精確控制結果,建議保持關閉。
進階
- 種子值:用於控制 AI 生成內容時的隨機性。若留空或設為隨機值,即使提示相同,每次生成的結果仍會不同。若設定固定的種子值(例如 12345),並保持其他參數一致,則每次生成結果將相同。變更種子值則可在相同概念下產生不同變化。
在頁面底部,您還可以找到一系列可供選擇的預設提示。
當您對設定感到滿意後,點擊「執行」按鈕,生成結果將顯示在畫面右側的視窗中。
將您的創意轉化為影片。只需描述場景,即可讓畫面栩栩如生呈現,從電影感風景到動畫式敘事皆可實現,最高可生成長達 1 分鐘的高品質影片
進入該頁面後,您會來到 Playground 頁面。在此,您可向 Forge 指示您想要建立的內容。在畫面左側,您會看到「Inputs」和「Settings」,並可在此輸入相關指示。
輸入
- 提示詞(必填):在此描述您希望最終影片呈現的場景、動作及整體風格。
範例:日出時分,電影感的無人機鏡頭滑過層層梯田,薄霧瀰漫於田野之間,溫暖的金色光線,細緻的視差效果,真實的植被細節,呈現高質感的旅遊影片風格。
- Image(選填):在此上傳您想要製作成動畫的圖片;Forge 會根據該圖片生成整個場景。支援格式:jpg、png、gif、webp。若您希望僅根據文字提示生成場景,請將此欄位留空。
設定
- 幀數:設定影片的總幀數。例如,一段 60 秒、30 fps 的影片包含 60 × 30 = 1,800 幀。幀數越多,動作越流暢,但檔案大小也可能增加。
- 解析度:選擇影片的輸出解析度。若選擇「Auto」,Forge 會在可能的情況下使用輸入圖片的比例。目前 Helios 流程不支援精確的 1280 × 720,建議改用 1280 × 704。
- 播放幀率(FPS):設定每秒顯示的幀數(單張影像)。標準幀率為 24 fps。
進階
- 種子值(Seed):用於控制 AI 生成內容時的隨機性。若留空或設為隨機值,即使提示內容相同,每次生成的結果仍會不同。若設定固定的種子值(例如 12345),並保持其他參數一致,則每次生成結果將相同。變更種子值則可在相同概念下產生不同變化。
- 推理步數:Forge 的影片引擎採用「金字塔階段(pyramid stages)」技術,影片會從較低解析度的草稿開始,逐步提升至完整解析度。此參數用於設定每個階段的優化步驟數量。除非有特定需求,建議維持預設值 2。
- 是否啟用首段增強:Forge 會以分段方式生成影片,而第一段最為關鍵,因為它決定整體風格、光線與色調。設為「true」可保留強化效果(預設且建議設定);設為「false」可稍微加快生成速度,但開頭畫面的細緻度會降低。
在頁面底部,您還可以找到一系列可供選擇的預設提示。
當您對設定感到滿意後,點擊「執行」按鈕,生成結果將顯示在畫面右側的視窗中。
在一秒內,將文字轉化為驚艷視覺。只需描述您想呈現的畫面——無論是風景、人像、藝術創作或產品攝影,即可立即生成高品質圖像
進入該頁面後,您會來到 Playground 頁面。在此,您可向 Forge 指示您想要建立的內容。在畫面左側,您會看到「Inputs」和「Settings」,並可在此輸入相關指示。
輸入
- 提示詞(必填):在此描述您想要生成的圖像內容。
範例:在情緒感柔光箱燈光下,一位穿著奶油色西裝的拳擊手人體藝術肖像,皮膚帶有細微汗水,布料質感清晰,呈現中畫幅時尚攝影風格與濃厚電影感對比。
- 來源圖片(選填):在此上傳參考圖片,Forge 會將其作為範本使用。您可要求 Forge 對其進行編輯,或以該圖片為基礎生成最終結果。
進階
- 推理步數:Forge 的影像引擎採用「金字塔階段(pyramid stages)」技術,影像會從較低解析度的草稿開始,逐步提升至完整解析度。此參數用於設定每個階段的優化步驟數量。除非有特定需求,建議維持預設值 4。
- 引導強度:設定影像生成過程中對文字提示的遵循程度。數值越高,生成的影像越貼近輸入的文字描述。
- 寬度:設定影像寬度(以像素為單位)。
- 高度:設定影像高度(以像素為單位)。
- 種子值(Seed):用於控制 AI 生成內容時的隨機性。若留空或設為隨機值,即使提示內容相同,每次生成的結果仍會不同。若設定固定的種子值(例如 12345),並保持其他參數一致,則每次生成結果將相同。變更種子值則可在相同概念下產生不同變化。
在頁面底部,您還可以找到一系列可供選擇的預設提示。
當您對設定感到滿意後,點擊「執行」按鈕,生成結果將顯示在畫面右側的視窗中。
透過文字描述創作原創音樂。只需描述您想要的情緒、曲風與風格,即可生成包含人聲與樂器的完整歌曲,支援 30 種以上語言與多元音樂類型,從流行到古典皆可實現
進入該頁面後,您會來到 Playground 頁面。在此,您可向 Forge 指示您想要建立的內容。在畫面左側,您會看到「Inputs」和「Settings」,並可在此輸入相關指示。
輸入
- 參考音訊:在此上傳參考音訊,Forge 會將其作為範本生成最終結果。
- 提示詞(必填):在此描述您想要生成的音樂,請說明風格、類型、情緒、節奏及使用的樂器。
範例:Afro house 節奏、深沉低音、層次豐富的打擊樂、催眠感的人聲切片、溫暖的夜店氛圍、優雅的鋪陳、深夜屋頂派對能量。
- 歌詞:若您想創作包含歌唱的歌曲,可輸入歌詞,或點擊「用 AI 產生歌詞」由 Forge 自動生成。
- 標籤:輸入如 Lo-fi、upbeat、groovy 等標籤以指定音樂風格。
設定
- 長度:設定音軌長度,範圍為 10 秒至 300 秒(5 分鐘)。
- 節奏(BPM):代表每分鐘節拍數(Beats Per Minute)。數值越高代表節奏越快(例如舞曲 150+ BPM),數值越低則代表較慢或較平靜的音樂(例如抒情曲 60–80 BPM)。若不設定,可填 0,由 Forge 自動決定。
- 任務類型:選擇生成方式。僅使用文字輸入時選擇「文字轉音樂」;上傳參考音訊時選擇「音訊轉音訊」。
- 音訊風格強度:設定 Forge 參考輸入音訊的程度。數值越高,生成結果越接近原始音訊。
進階
- 種子值(Seed):用於控制生成內容時的隨機性。若留空或設為隨機值,即使提示相同,每次結果仍會不同。若設定固定種子值(例如 12345),並保持其他參數一致,則每次結果將相同。變更種子值可產生相同概念下的不同變化。
- 音調:設定音樂的調性(大調或小調),例如 C major、A minor;也可留空由 Forge 自動決定。
- 拍號:設定每小節的節拍結構,用於決定音樂的節奏形式。
- 推理步數:此參數描述 Diffusion Transformer(DiT)將音訊提示轉換為結構化音樂的過程。每一步會逐步去除雜訊並貼近提示、風格與旋律。數值越高,優化步驟越多。
- 節奏偏移:用於調整音樂生成過程中結構、平滑度與細節之間的平衡(不影響提示本身)。數值越高,越偏向先建立整體結構再細化細節;數值越低則較平均分配。範圍為 1.0 至 5.0,預設為 3.0。
- 求解方式:一種取樣演算法,用於將雜訊音訊轉換為最終結果。ODE/Euler 適合需要速度、穩定性與可重現性的情境;SDE 則適合變化更豐富但一致性較低的結果。
- 音訊格式:選擇輸出音訊格式。
- 批次生成:設定生成音軌的數量,最少 1 首,最多 4 首。
- 隨機性控制:影響生成歌詞、音樂結構或符號時的創意程度。數值越低結果越穩定;數值越高則更具創意,但可能較不穩定。
- LM CFG 強度:控制語言模型在生成內容(如歌詞、結構)時遵循提示的程度。數值越高越貼近提示;數值越低變化越多。若不需限制,可設為 1.0。
- LM Top K:影響語言模型生成內容時的取樣範圍。數值越低結果越穩定;數值越高變化越多。設為 0 則停用此限制。
- LM Top P:與 LM Top K 類似,用於控制生成內容的多樣性。數值越低越穩定,越高則更具變化。設為 1.0 則停用此限制。
在頁面底部,您還可以找到一系列可供選擇的預設提示。
當您對設定感到滿意後,點擊「執行」按鈕,生成結果將顯示在畫面右側的視窗中。
透過自然語言即可完成圖片編輯。只需說明您想調整的內容,其餘交由系統自動處理——非常適合快速修圖、創意改造與風格轉換
進入該頁面後,您會來到 Playground 頁面。在此,您可向 Forge 指示您想要建立的內容。在畫面左側,您會看到「Inputs」和「Settings」,並可在此輸入相關指示。
輸入
- 來源圖片:在此上傳您希望 Forge 進行編輯的圖片。
- 提示詞(必填):在此描述您想要對來源圖片套用的編輯內容。
範例:高端無線耳機漂浮於柔和漸層背景之上,精準邊緣光,材質清晰銳利,呈現奢華產品主視覺與乾淨的廣告美學。
設定
- 推理步數:Forge 採用「金字塔階段(pyramid stages)」技術,影像會從較低解析度的草稿開始,逐步提升至完整解析度。此參數用於設定每個階段的優化步驟數量。除非有特定需求,建議維持預設值 4。
- 引導強度:設定影像生成過程中對文字提示的遵循程度。數值越高,生成的影像越貼近輸入的文字描述。
- 種子值(Seed):用於控制 AI 生成內容時的隨機性。若留空或設為隨機值,即使提示內容相同,每次生成結果仍會不同。若設定固定的種子值(例如 12345),並保持其他參數一致,則每次結果將相同。變更種子值則可在相同概念下產生不同變化。
在頁面底部,您還可以找到一系列可供選擇的預設提示。
當您對設定感到滿意後,點擊「執行」按鈕,生成結果將顯示在畫面右側的視窗中。
透過文字描述,在數秒內生成精美圖像。非常適合快速概念發想、社群內容製作與創意腦力激盪,操作簡單且生成快速
進入該頁面後,您會來到 Playground 頁面。在此,您可向 Forge 指示您想要建立的內容。在畫面左側,您會看到「Inputs」和「Settings」,並可在此輸入相關指示。
輸入
- 提示詞(必填):在此描述您想要生成的圖像內容。
範例:一位自信的街頭服飾設計師倚靠在首爾的霓虹自動販賣機旁,雨後濕潤發亮的地面,動漫寫實風格,鮮明的青色與珊瑚色高光。
- 負面提示詞:在此描述您不希望出現在圖像中的元素。
範例:解剖結構扭曲、重複特徵、服裝繪製粗糙、不自然的姿勢、多人、群體、幼態外觀、卡通風格。
設定
- 寬度:設定影像寬度(以像素為單位)。
- 高度:設定影像高度(以像素為單位)。
- 推理步數:Forge 採用「金字塔階段(pyramid stages)」技術,影像會從較低解析度的草稿開始,逐步提升至完整解析度。此參數用於設定每個階段的優化步驟數量。除非有特定需求,建議維持預設值 4。
- 引導強度:設定影像生成過程中對文字提示的遵循程度。數值越高,生成的影像越貼近輸入的文字描述。
- 種子值(Seed):用於控制 AI 生成內容時的隨機性。若留空或設為隨機值,即使提示內容相同,每次生成結果仍會不同。若設定固定的種子值(例如 12345),並保持其他參數一致,則每次結果將相同。變更種子值則可在相同概念下產生不同變化。
在頁面底部,您還可以找到一系列可供選擇的預設提示。
當您對設定感到滿意後,點擊「執行」按鈕,生成結果將顯示在畫面右側的視窗中。