請輸入想查詢的單字或片語
US
・UK
然後我會進到 AI Studio,選擇 audio,挑選單人說話,然後貼上腳本。
這個聲音聽起來很自然,比大多數 text to speech tools 好太多了。
如果說有一件事讓我覺得,對我來說,我看到的其中一個演示讓我大開眼界,那就是在 23 年初,當時我在印度,我看到一個當地的開發者 Daisy Chain,基本上在那個時候,要麼是 GPT-3 要麼是 3.5,帶有這些印度堆棧之一,語音轉文本、文本轉語音,開源的東西,然後展示了一個印度當地的農民,他能夠使用在 WhatsApp 中構建的哈拉機器人,通過訪問政府網站獲得一些農業補貼。
我很好奇,因為你在 Windows 中的 "副駕駛"(Copilot)經常是這樣,在科技領域,也許人們真的很痴迷於最新的前沿機型,但這很容易被遺忘。
你也可以點擊加號圖示來上傳更多圖片。
在「文字轉語音」下方,輸入角色的對白。
所以 11 Labs AI 就是在做語音複製,有點像文字轉語音。
但這並不是為了偷偷摸摸。
它不只告訴我 OpenAI 的新 FM 文字轉語音最近在我的頻道被提到了,它還引用了我上傳的逐字稿文件。
所以在我的 agent instructions 的初始步驟裡,我會說給兩個回應,然後我們在這裡選擇輸出格式,不是以文字回覆使用者,而是
它找到了這次活動的投資報酬率,抓出了預算明細,
進入 AI Studio 後,點擊左邊的「首頁」分頁,然後點這裡就可以使用 Gemini 的文字轉語音模型了。
是以,今年我們透過稱為「神經網路文字轉換語音」的尖端機器學習,向前邁出了一大步,這是史上第一次,您聽到的聲音完全由軟體生成。
但現在讓我們試試 iOS 13 的神經網路文字轉換語音。