Suno 的目標是讓人們將腦海中的歌曲變為現實。兩種人工智慧模型對此有所幫助:音樂是由 Suno 神經網路創建的,文字和標題是由 OpenAI 的 ChatGPT 發明的。與Suno創作的曲目已經以其真實感給網友留下了深刻的印象。
光是去年,生成式人工智慧就在創建文字、圖像(例如透過 Midjourney)甚至影 巴西商務傳真列表 片方面取得了重大進展,這主要是透過 OpenAI 的新 Sora 神經網路實現的。然而,在聲音領域,特別是音樂領域,存在著滯後。
Suno似乎解決了這個問題。這家新創公司的創辦人有著幾乎無限的野心——他們看到了一個每個人都可以創作音樂的世界。
37 歲的 Suno 聯合創始人之一、哈佛大學物理學博士學位的 Mike Shulman 相信,未來全球將有 10 億人每月支付 10 美元與 Suno 一起創作歌曲。據他介紹,現在音樂聽眾多於創作者,Suno 將糾正這種不平衡。
Suno 於兩年前推出。其創辦人舒爾曼、基南·弗賴伯格、喬治·庫斯科和馬丁·卡馬喬都是機器學習領域的專家。直到 2022 年,他們在劍橋的另一家公司 Kensho Technologies 一起工作,該公司致力於為複雜的業務任務尋找基於人工智慧的解決方案。舒爾曼和卡馬喬都是音樂家,在 Kensho 時代就喜歡一起演奏。
Suno 發電機如何運作?
Suno 使用與 ChatGPT 等大型語言模型相同的通用方法:它將人類語音分解為單獨的片段(標記),學習數百萬種用法、風格和結構,然後根據需要進行重構。
然而,創建音頻,尤其是音樂,比文字困難得多。就在去年,人工智慧生成的音樂專家告訴滾石雜誌,像 Suno 這樣的服務可能需要數年時間才能建立。
「分享音訊並不像分享文字那麼容易,」舒爾曼說。 - 這是一波。這是一個連續訊號。高品質聲音的取樣頻率通常為 44 或 48 Hz,即根據 Shulman 的說法,為 48,000。每秒的令牌數。所以你必須弄清楚如何將其簡化為更聰明的東西,」他說,並補充說還有很多工作要做。
最終,Suno 希望提供不僅基於文字請求生成曲目的能力,而且還能夠基於用戶自己的演唱生成曲目。
會不會有版權問題?
OpenAI 因其使用受版權保護的書籍、新聞文章和其他資料來訓練 ChatGPT 而面臨多起訴訟。
Suno 的創辦人並沒有透露他們訓練模型的數據。他們說,它可以產生逼真的人類聲音,部分原因在於它不僅可以從音樂中學習,還可以從語音錄音中學習。
Suno 表示,它與主要唱片公司保持著關係,並尊重藝術家和智慧財產權。她的工具不允許您在請求中指定特定藝術家的風格,也不會使用他們的聲音。
甚至在 Suno 之前,音樂家、製作人和詞曲作者就對人工智慧將如何影響他們的業務表示擔憂。然而,Suno 的創始人認為沒有什麼好害怕的,他們用這樣的比喻:即使人們會寫,他們也會繼續閱讀。
「我們正在努力讓十億人比現在更熱愛音樂,」舒爾曼說。 “如果人們對音樂更加感興趣,那麼他們就會更加專注於創作音樂,並且變得更加挑剔,這對藝術家來說可能是件好事。”
“我們並不是想取代藝術家,”他補充道。
在哪裡使用該工具?
儘管Suno僅針對那些想要創作歌曲來娛樂的音樂愛好者,但該工具仍然可以在行業中產生很大的影響。從短期來看,這可能會影響為廣告和電視節目創作歌曲等有利可圖的市場領域。
Milk and Honey 創辦人 Lucas Keller 指出,這不會影響知名歌曲。
「但這肯定會損害市場的其他部分,」他說。 “我認為,最終,這將允許許多廣告公司、電影製片廠、電視頻道和其他機構放棄他們的許可證。”
此外,如果人工智慧內容不受嚴格監管,像 Suno 這樣的模型的用戶可能會在串流媒體服務中填充數百萬個他們的創作。 Shulman 表示,有一天 Spotify 可能會禁止此類下載,但他指出,目前 Suno 用戶更願意將歌曲發送給少數朋友。
Suno 目前約有 12 名員工,但該公司計劃擴大規模。在目前臨時辦公室所在的大樓頂層,正在建造一個更大的永久總部——甚至包括一個功能齊全的錄音室。
「它主要用作聽音室,」舒爾曼說。 — 我們需要一個隔音效果好的房間。但我們也喜歡在沒有人工智慧的情況下創作音樂。
目前,Suno 最大的潛在競爭對手可能是Google的 Dream Track,該公司已獲得許可,可以根據需要使用著名藝術家的聲音創作歌曲。然而,到目前為止,Dream Track 只對少數用戶開放,而且發布的樣本聽起來並不像 Suno 的那麼令人驚嘆。
「我認為未來人們不會想要使用人工智慧與音樂互動來創作新的比利喬爾歌曲,」舒爾曼說。 — 我們希望人們創作出五年內不存在的音樂。他們腦海中響起的聲音。