今年618,AI硬件銷售榜成為備受關注的榜單之一。而其中有一匹剛推出市場不久的“黑馬”——連續十多天登陸AI玩具熱賣榜榜首,直播十分鐘銷售過百萬,那就是LING靈宇宙“AI 伴學小方機”。此前,這款AI硬件終端也獲得了2025德國紅點設計大獎。
在AI應用的商業化依舊為人所熱議的時期,“靈宇宙”今年618亮眼的銷售數據無異于一劑強心劑,展現出AI加持下消費硬件的無限可能性。
但對于“靈宇宙”的創始人顧嘉唯而言,這并非是他做的第一個“爆款”。這位連續創業的“技術天才”,曾在28歲入選百度“少帥計劃”,深度參與包括BaiduEye、DuBike等在內的多個重大創新項目。他后來亦創辦了物靈科技,其代表產品兒童繪本閱讀機器人Luka盧卡全球銷售近千萬臺。還作為投資人,投資了包括全球最知名陪伴機器人Jibo、 Rethink Robotics、KnightScope在內的多個產品。
穿越過消費硬件的周期,2023年顧嘉唯又開始了他的再次創業,其創立的“靈宇宙”半年內完成了來自線性資本、耀途資本、清華SEE Fund、銀杏谷、商湯科技、三七互娛、學大教育等機構和產業方的三輪融資,最新一輪正在與多家頭部投資機構進行交割。
在小方機618霸榜之前,線性資本曾與顧嘉唯進行了一次深度訪談,他向我們詳細聊了他做“靈宇宙”的底層思考邏輯。于他而言,真正的交互革命不是讓設備更智能,而是讓設備“消失”在生活中。“AI伴學小方機”只是一個良好起步,“靈宇宙”未來希望可以“重新定義人與世界連接方式”。
PART 01 決定做靈宇宙時,看到了什么特別機會
人類與工具相伴百萬年,創新浪潮始終推動文明前行。從石器時代的肢體延伸,到工業革命的動力輔助,如 AI 正推動第三次質變——我們有幸見證從“使用工具”到“與其成為伙伴的”的智能時代。
無論是在微軟亞洲研究院、百度IDL深度學習研究院,還是以創業者身份深耕產業,聚焦人與機器的交互,我始終思考一個命題:未來十年,機器如何主動適應人類,而非人類遷就技術?大模型AI技術的突破給出了答案:當AI具備長短期記憶、主動推理與擬人交互能力時,人機關系的底層邏輯正在重構,這正是靈宇宙誕生的時代背景。以大模型為開端的技術躍升打開了一個全新的世界,在今天人與AI、與真實世界的連接正發生根本性變革,這種變革將徹底顛覆我們熟知的交互模式。
通過對過去兩年大模型技術的深入觀察與研究,我們洞察到一個顯著的趨勢。生成式 AI 時代,從過去的“推薦算法”進化成為新一輪的“關系算法”,引發內容生產的「極致個性化」:
這不僅是將過去的用戶畫像標簽升維成基于長期交互4D時空序列(時間、空間、行為、情感)的高度精準刻畫,實現“更懂你”、“當下只為你而作”,例如,靈宇宙的AI學伴能記住孩子三天前在公園問過的植物問題,并在今日路過相似場景時主動延伸知識鏈,這種“記憶-關聯-啟發”的交互模式,超越了傳統“關鍵詞匹配”的被動服務。
更疊加了Agent交互智能體,具備關系鏈網絡化屬性,實現交互載體的去平臺化。傳統原先依賴內容創作者生態的PUGC內容平臺正在衰落,而AIGC技術實現了“內容平權”——技術公司可通過Agent直接生成適配場景的交互式內容。比如靈宇宙AI小方機里的“達爾文”能實時將眼前的樹葉轉化為科普劇本,這種“場景-內容-交互”的閉環,讓AI硬件終端成為獨立的內容生成與交互中心,而非平臺流量的附庸。交互體驗的躍遷與內容的技術平權化,使人機交互公司提供了重新調整 “交互與內容” 杠桿的契機,全新的AIGC交互式內容平臺正在崛起。
我希望帶領靈宇宙把握這一機遇:讓AI陪伴智能時代原住民更好地成長。AI和機器人技術將深刻變革下一代與內容和服務與真實世界的交互關系,我們希望通過靈宇宙的技術和產品創新,給這個新時代創造一些美好的改變。依托Agentic AI(賦予AI學伴“角色人格”)和Physical AI(通過視覺識別、語音交互與空間感知,將現實世界轉化為“可交互的知識庫”),打破虛擬與現實的界限,讓用戶在真實場景中與AI智能體自然交互,激活物理世界的知識與體驗,使AI真正成為用戶探索世界、學習成長的伙伴,重塑人與內容和服務、人與真實世界的連接方式。
將會講故事的屏幕里的AI帶入到物理世界,是讓AI成為孩子探索世界的“感官延伸”,正如Luka從“讀萬卷書”到小方機“行萬里路”的進化,本質是從“知識搬運”到“認知共建”的升級。
靈宇宙的核心目標,是成為下一代人與世界連接的“操作系統”。
PART 02 交互在今天具體發生了怎樣的變化
在AI技術從 “工具屬性” 向 “伙伴屬性” 躍遷的浪潮中,靈宇宙正以AgentOS為支點,撬動人機交互的第四次革命——從 “人適應機器” 轉向 “設備適應人”和“機器理解真實世界”,最終實現Physical AI“萬物有靈”。
我們是一家做交互OS的公司,去“定義人機交互規則”,而非制造硬件設備,這是靈宇宙的目標。通過「物理世界AI-OS」,我們正在構建一個類似iOS/Android的生態系統,即4D時空交互智能操作系統 LingOS——硬件是載體,交互是靈魂,數據是燃料。具體體現在:
空間建模(3D環境理解):通過攝像頭與傳感器識別物體(如植物、建筑),構建實時「世界知識庫」。例如小方機拍攝一朵花,自動關聯植物學知識并生成互動問題,將現實場景轉化為「可交互的教材」。
時間序列(成長記憶沉淀):基于Luka盧卡時期積累的千萬級兒童交互數據,LingOS記錄用戶從幼兒到少年的認知軌跡。如孩子3天前問過“螞蟻如何搬家”,系統會在今日路過蟻穴時主動推送延伸實驗方案,形成「歷史記憶-現實場景-知識拓展」的閉環。
行為預測(主動交互觸發):區別于傳統語音助手的被動響應,Agent智能體(如李白、愛因斯坦)會根據用戶狀態主動發起交互。例如孩子在公園寫生時,「李白」角色會以FaceTime形式介入,結合眼前風景即興吟詩并引導創作,實現“交互找人”的主動服務。
情感共鳴(關系算法驅動):通過4D時空數據訓練「關系算法」,AI不再是工具,而是具備“角色人格”的伙伴。如「白澤」角色能識別孩子語氣中的低落情緒,主動發起故事分享或情緒疏導,這種「情感-行為」的關聯響應,超越了傳統推薦算法的標簽化邏輯。
我們正在通過 “點物賦靈”技術,讓物理世界成為交互界面。其核心邏輯在于讓物理實體本身成為智能載體,用戶無需通過手機、電腦等中間設備,直接與環境中的物體(如繪本、玩具、家具)進行自然交互。從Luka盧卡一開始的無屏觸控技術在桌面上形成的繪本閱讀及桌面交互場景,到Ling!小方機將世界變成課堂,這種“無設備感”的交互體驗,本質上是將整個物理世界轉化為可交互的界面,實現“世界即課堂,世界即教材” 的愿景。
AI會在人的身邊持續關注人看到的物理世界。無論是Always on的全天候設備還是Instant on的設備,記錄人每天周圍發生的事情;但在短期可見的時間內,更可落地、可商業化的是我們這種帶著攝像頭、較高交互密度信息輸入的產品,就像在“肩膀上的鸚鵡”一樣,以第一視角記錄人的生活。
今天AI跟用戶的互動方式是搜索框,是對話,但這都是階段性的。智能體Agentic AI時代,我認為AI跟用戶的互動形式應該是類似“Facebook的形式”,AgentOS的互動對象是多智能體構建的智能體宇宙,以及這些智能體跟用戶共同創建的內容feeds流構建的內容宇宙,共同構建了有靈魂的靈宇宙。
沒有AI之前,即便有很好的記錄,也無從找到和這些真實空間數據的交互方式,現在可以是實時的交互場景,比如我們的產品里有一個角色是「李白」,他發起一個和你的FaceTime的視頻通話,可以第一視角地看到你身處的世界并寫成詩,跟你直接在物理世界里探索和持續交互。
PART 03 靈宇宙如何思考并尋找核心切入點
在Agentic AI時代之前,對于效率提升靠原有設備通過AI升級改造,而這些AI升級的PC、手機等已無法滿足「機器適應人」的交互需求,所以顯然會出現AI Native新物種的機會。每一代交互方式的出現,相較于上一代,其切入的年齡層越來越低。所以我認為現階段想要找到AI Native獨立計算終端的正確切入點,就不要第一天就想要替代手機,因為家長其實本能上排斥孩子過早接觸手機。
對于從出生就與AI共生的這代人來說,與AI角色對話如同與真人聊天一樣自然。那靈宇宙就要為他們的這種“新社交直覺”打造基礎設施——讓每個物理場景都能激活智能伙伴,讓每次探索都成為“結識新朋友”的旅程。我們想要切入的是專屬于AI native人群的第一款AI-OS設備,能夠提供「即時場景化交互」,并基于硬件不斷產生持續的交互數據。
人機交互的“圣杯”是找到手機之后的下一代交互。我們都希望能找到下一代類似手機這樣的獨立計算設備終端,但這么多年過去了,依舊沒有能替代 GUI(Graphical User Interface,圖形用戶界面)成為主流交互范式的產品。因此,手機中心的地位牢牢不可撼動。我認為可能在未來5-10年里,手機這個設備中心位置仍很難被替換,上一波智能眼鏡公司就常常講替代手機,但其實它目前還很難脫離手機配件的角色。
因此,我們思維的起點并不是要做一款硬件,核心切入點是由軟件交互來定義硬件設備。我們的做法是先定義場景、定義軟件,然后看如何將AI與人的交互嵌入進場景。通過場景驅動的交互創新,將靈宇宙小方機打造成全天候的學習載體。
想象一下,最早的學習是依賴書籍,直到瀏覽器時代才有了稍方便的信息檢索,但仍然需要人去過濾篩選信息。通過不同Agents實現主動交互,我們稱作主動交互,把世界變成交互界面,讓AI在物理世界的空間中發揮作用,在各類生活場景中激活多角色智能體,提供個性化學習與互動體驗。
PART 04 下個時代的交互會是怎樣的交互
喬布斯早在40年前就在斯坦福有一個分享,讓我感觸很深。他講到想做計算機,舉了一個例子,說我們可能看到過亞里士多德的書,但是當我們讀書的過程中有問題想和先哲探討的時候,如何讓這位先哲給我們反饋?有沒有可能通過什么方式來讓當代人和亞里士多德對話?在那個時代喬布斯就已經在暢想這件事情了。
Ling!小方機的AgentOS主動交互——讓智能時代原住民孩子通過和不同的Agents對話,找不同的人幫他們答疑解惑,我認為“找人解決問題”是第一性的。找人的方式,一種是像以前的通訊軟件或Facebook上找到一個真人,通過所謂六度人脈找到人。
我認為AI和人的交互是要找到合適的、有趣的、熟識的多個角色去解決問題,比如當孩子去游玩岳飛廟,這時候就會激活岳飛角色,親口給他講一段岳飛的歷史典故;孩子在小區的花園里可能激活一個達爾文角色,根據他拍下來的樹苗,和達爾文聊生物知識等等。我們在產品的設計里做了許多游戲化的設定,基于地點場景激活AI Agent角色,可以參考以前Pokeman Go的玩法。
以AI Agents網絡重構交互模式,實現“找人 + 做事”的一體化,使交互更貼合人性直覺與實際需求。我們嘗試構建出Agents網絡,讓這些原生的Agents去完成以前APP執行的工作。回顧2014年我提出的 “APP已死,智能永生”概念,移動互聯網時代,用戶需要下載大量APP來滿足細分需求;而AI時代,智能體應通過自然語言、場景感知主動提供服務——無需打開“天氣APP”,AI會根據你出門時的著裝提醒帶傘;無需搜索翻譯工具,看到外文標識時AI Agent角色會實時解讀。 這種 “去APP化” 的交互,本質是讓技術回歸 “服務于人” 的初心,而非讓人適應技術的規則。
我們最近都關注到李飛飛創辦的WorldLabs。早年我在百度研究院工作時,曾與余凱、吳恩達共事,也與李飛飛多有交集,當時在百度美研這邊與Stanford AI Lab也有很多互動。如今許多技術通過3D映射,將人類對世界的感知能力呈現在圖面上,在游戲、MR/XR、機器人等領域,重新詮釋了未來理解世界的能力,優化了原有方法,而非單純依賴不可控的技術涌現。
PART 05 過去在AI硬件領域的積累如何影響今天
第一是對于空間交互智能AI的認知與實踐積累。當時BaiduEye就是第二個大腦、第三只眼。當然那時候承載的硬件設備的軟件算法不夠成熟,上個AI時代也沒有大模型能完成主動式交互,即便這樣我們也用CV小模型定義了很多BaiduEye在博物館、商場等場景有趣的功能。
那受益于今天大模型帶來的全新機會,我堅持選擇的是基于下一代年輕人的第一視角進行迭代路徑。這與我早年在百度的嘗試息息相關,當時BaiduEye的核心思考在于探尋一種方式,以第一視角高密度陪伴人們的生活,引入第一視角的 “直播” 數據。
十多年前,MobileEye的創始人Ziv Aviram在為特斯拉構建的大尺度物理空間上的數據后,建構了Oracam固定在眼睛腿上作為弱視和盲人群體的助視器,來構建以人為尺度的生活空間的數據。這個想法當時就深深影響了我,那一年都沒有scale-law這一說法,對于數據涌現智能的思考卻已經深深埋在了我的腦中。
這些經歷或多或少都為后來Luka盧卡的誕生埋下伏筆。常有不少人詢問我們做靈宇宙的靈感來源,其實皆源于過往長期的積累。從BaiduEye到十多年后的靈宇宙小方機,都源于對于人類同源第一視角的視覺、聽覺、語音等感知到處理的數據,隨時隨地獲得細顆粒度信息。從pocket-in到instant-on再到always-on,小方機里的多角色智能體Multi-Agent能看到孩子看到的世界,成為用戶的第二大腦、第三只眼睛,持續獲取實時的交互數據。
第二是找到我們的用戶,并做真正具備PMF的應用。在商業上,這些年來我學會了換個視角來看問題,觀察不同公司思考問題的方式,給自己帶來很多啟發。例如 Facebook兩次要收購Snapchat,顯然是后者帶來了威脅——后者抓住了年輕用戶。這一次AI的發展,在年輕人中的滲透非常快。越小的孩子越沒有學習成本和習慣包袱,他們更容易接受新技術,從觸摸屏開始,到語音交互,再到大模型、Agent,越來越接近人最自然的交互方式這是必然趨勢。
只不過如今作為連續創業者,在選擇賽道時我會保持謹慎的樂觀,而非盲目樂觀。在判斷一項技術的發展前景時,無論是瞄準垂直人群,還是如剛才所提及的探尋大廠尚未察覺的盲區(就像Snapchat剛出來時候撼動Facebook的案例),將這兩個維度相結合,我認為這是創業公司較為理想的切入方式。
PART 06 機會來源于阿爾法世代里的顛覆式創新
每一代信息產品到智能終端,都是從更年輕的人群市場起始,這些年沉淀下來,發生在智能時代原住民群體(2010年后出生的人群,即Alpha阿爾法世代)里的重大顛覆式創新會創造大的新機會,因為這個人群對新交互的接受度很高,反過來甚至會影響主流人群。
另外,之所以從下一代年輕人群體開始做,還有兩個重要方面,第一是壁壘。在中國做類似AI眼鏡這類硬件的門檻不低,但可能面臨手機廠商也會去跟進。我們作為一個創業團隊已經在上一個周期里積累了非常強的軟硬件一體的經驗,我認為最核心的就是來自軟件的壁壘——垂直人群所積累的垂直數據(文本語言、空間圖像、成長軌跡),數據不斷內化到LingOS并迭代。比如和兒童的交互,有獨特的基于數據迭代的技術挑戰;安全類的電子護欄也和普通的AI產品不一樣;內容層AI Agents作為我們內容最直接的內容分發載體,積累更多和小朋友的真實交互數據和有趣的內容。這是通用大模型不具備的垂直能力。
第二是考慮用戶付費以及相應的商業模式。教育本身是投資,不是單純的消費。家長有對教育付費足夠強的動力,比起過去填鴨式的“應試教育”,在今天,小朋友們已經可以在玩、在交互中、甚至在室外場景中學習。家長買單的并不是一個“玩具”。市面上一些融資的 AI 玩具是沒有講清楚家長付費、孩子去用的核心價值。對比各種各樣的興趣班、線上課等這些有明確付費點的教育產品,今天的AI Agents帶來了10倍不止的體驗,但價格可能只是1/10。說到這也講下我們的商業模式,硬件只是第一步,后面會有大量基于軟件、基于內容付費的持續性收入。也因此我們要做到最好的體驗。
總結來說,我覺得小方機并不是基于功能的產品,而是一個容器,每個人基于這套界面,可以是主動也可以是被動地和角色互動,AI也會反過來跟你進行交互。它帶領你基于時間、空間來找到“人”,這一層能力,我們做了一套中臺,我們稱之為造人、造境、造記憶。
PART 07 終極愿景是讓機器擁有理解人類的靈性
我的終極愿景是打造「能真正理解人類」的家庭機器人——這需要解決當前機器人領域最核心的痛點:讓機器實現「言出法隨」,即精準理解意圖并即時響應。但現階段,我們離這個目標仍有巨大鴻溝,核心瓶頸在Physical AI具身物理智能數據的缺失。
我們的長期戰略是構建家庭機器人的「智能基石」,構建一套覆蓋真實生活場景的空間交互數據集,為家庭機器人研發提供核心「智能組件」。
我一直在講「萬物有靈」這個詞,現在是和這個目標比較遙遠,核心原因就是數據的缺失。長期來看,我想推進的是讓數據輸入這個事情到下一個階段,把Physical AI的數據集構建起來,成為真正的懂人類的AI。這件事要實現有非常長的路徑,不同公司都在做也有不同的方法,這也是創業的樂趣。我始終認為要讓AI理解人類,需要真實的交互數據的構建,垂直人群的真實數據會是我們越做越厚的護城河。
我們的短期策略是用Personal AI隨身終端鋪量,搭建人機交互閉環,積累數據。為實現長期目標,我們需要一個「數據采集 + 商業驗證」的切入點,這就是正在推進的Ling!小方機,打造「個人AI伙伴」爆品,在阿爾法世代的年輕人中高頻使用,實時積累「人與物理世界交互」的數據,比如掃描植物時的提問、博物館中的探索行為,形成「用戶需求-AI 響應-數據反哺」的人機協同(Human-in-the-loop)閉環。
短期目標不僅是銷量,更要通過規模化用戶驗證技術可行性。類似特斯拉 Tesla 先通過電動車鋪量積累真實的駕駛數據,我們需要 Ling!小方機商業化快速鋪量,獲取千萬級用戶行為,為后續家庭機器人的場景理解能力提供訓練素材。
避開通用人形機器人的紅海,聚焦差異化是我的思路,我們明確不涉足運控類技術(如機械臂操作、雙足運動控制研發),這類硬件技術一旦成熟,如大模型能力溢出,行業會快速共享成果。我們的核心目標壁壘是「讓機器看懂空間、理解人類」的具身大腦智能,聚焦交互感知和空間智能——這才是家庭機器人能否「有靈魂」的關鍵。
家庭機器人的研發注定是一場十年磨一劍的遠征,行業內各有路徑:有人主打硬件形態創新,有人聚焦算法突破。但我們堅信,真實場景中的「人機交互數據」才是通往AGI的燃料。短期的小方機是鋪路石,長期的家庭機器人是目的地,而中間的每一步,都是在為「讓機器擁有理解人類的靈性」積累拼圖。
正如我常說的,創業的樂趣,就在于選擇一條少有人走的路,然后堅定地走下去。
免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網發布,可與本網聯系,本網視情況可立即將其撤除。
中宏網版權申明:凡注有“中宏網”或電頭為“中宏網”的稿件,均為中宏網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為“中宏網”,并保留“中宏網”的電頭。