作者:伊萬?梅塔
當下,開發者與各類企業正愈發頻繁地在應用程序中接入人工智能智能體與聊天機器人,但這類產品的交互形式至今仍大多局限于文本。數字虛擬人生成技術企業檸檬切片(Lemon Slice)正試圖改變這一現狀:該公司研發出一款全新擴散模型,僅憑一張圖片即可生成數字虛擬人,為這類智能對話產品疊加視頻交互層。
這款名為檸檬切片二代(Lemon Slice-2)的模型,生成的數字虛擬人可對接知識庫,勝任人工智能智能體的各類指定角色 —— 既能解答客戶咨詢、輔導課后作業,甚至還能擔任心理健康疏導顧問。
該公司聯合創始人莉娜?科盧奇表示:‘生成式人工智能發展初期,我和聯合創始人們就開始嘗試各類視頻模型,當時我們便意識到,視頻交互終將走向智能化、可互動化。像聊天生成預訓練轉換器這類工具的核心吸引力,就在于其強交互屬性,而我們的目標,正是讓視頻也具備這樣的交互能力。’
檸檬切片公司介紹,這款模型的參數量達 200 億,單塊圖形處理器即可運行,能以每秒 20 幀的速率生成視頻流。企業可通過應用程序編程接口調用該模型,也可借助一款嵌入式組件,僅需一行代碼就能將虛擬人功能集成至自有網站。虛擬人生成后,用戶還能隨時調整其背景畫面、風格設計與面部外觀。
除高度擬人化的虛擬人形象外,該公司還著力研發非人類虛擬角色的生成技術,滿足多元化場景需求。這家初創企業采用十一實驗室(ElevenLabs)的技術,為旗下所有虛擬人定制語音。
檸檬切片由莉娜?科盧奇、西德尼?普萊馬斯與安德魯?韋茨于 2024 年聯合創立。公司的核心競爭思路是:憑借自研的通用型擴散模型打造虛擬人產品,以此形成差異化競爭力。這類生成式模型的原理是,從帶噪聲的訓練數據中逆向學習規律,進而生成全新的數據內容。
‘時至今日,我接觸到的多數虛擬人解決方案,非但沒能為產品賦能,反而拉低了體驗感。’科盧奇直言,‘這些虛擬人形象要么違和怪異,要么動作僵硬呆板。靜態畫面看上幾秒還算精致,可一旦開啟交互,那種強烈的違和感撲面而來,根本無法讓用戶產生舒適的體驗。虛擬人技術之所以始終未能真正落地普及,核心原因就是產品體驗始終達不到合格水準。’
為支撐技術研發與業務擴張,檸檬切片于本周二官宣完成1050 萬美元種子輪融資,投資方包括經緯創投、硅谷創業孵化器 Y Combinator,還有云端存儲服務商多寶箱首席技術官阿拉什?費爾多西、游戲直播平臺 Twitch 首席執行官埃米特?希爾,以及美國電子音樂組合煙鬼樂隊。
檸檬切片表示,公司已搭建完善的風控機制,可有效防范未經授權的人臉、聲音克隆行為;同時還依托大型語言模型,對虛擬人產出的內容進行合規審核。
該公司并未披露具體的合作客戶名單,但透露其技術已落地應用于多個領域,包括教育教學、語言學習、電子商務與企業員工培訓。
檸檬切片目前面臨激烈的行業競爭,賽道內的對手既包括數字視頻生成領域的初創企業(如 D-ID、HeyGen、深曦科技),也有一眾數字虛擬人研發商(如精靈科技、靈魂機器、普拉奇卡、虛擬人操作系統公司)。
經緯創投合伙人伊利亞?蘇哈爾認為,虛擬人技術將在視頻場景為主的領域迎來爆發。舉例來說,相比長篇文字,人們更愿意通過視頻平臺學習知識。他指出,檸檬切片的技術硬實力與研發思路,將成為其突圍的核心優勢。
‘這支團隊深耕技術研發,擁有成熟的機器學習產品落地經驗,絕非只做技術演示與理論研究的團隊。行業內不少競品的技術方案僅適配特定場景或垂直領域,而檸檬切片選擇遵循人工智能領域的“慘痛教訓”原則,采用規模化的研發路徑 —— 通過海量數據與算力投入打磨通用模型,這一思路在其他人工智能賽道均已被驗證有效。’伊利亞?蘇哈爾評價道。
Y Combinator 合伙人賈里德?弗里德曼則表示,相較于部分只專注研發擬人虛擬人或游戲角色類虛擬人的同行,檸檬切片采用的擴散類模型,使其具備生成全品類虛擬形象的能力。
‘我認為,檸檬切片是業內唯一一家立足機器學習底層邏輯研發技術的企業,其方案終有一天能突破“恐怖谷效應”,通過虛擬人領域的圖靈測試。’弗里德曼說,‘他們訓練的模型,與視頻生成工具 Veo3、Sora 同屬一類 —— 視頻擴散轉換器。這款通用型模型可實現端到端的全流程生成,其技術上限永無止境;而行業內其他競品的技術天花板,都止步于超寫實畫質之下。該模型不僅能生成人類形象,也可打造非人類面孔,且僅需一張圖片,就能快速生成全新的虛擬人臉形象。’
檸檬切片目前僅有 8 名員工,本輪融資資金將主要用于兩大方向:一是擴招算法研發與商業化落地團隊,二是支付模型訓練所需的算力成本。