“大多數(shù)人工智能初創(chuàng)公司注定無法成功”的說法可能聽起來平淡無奇。畢竟,僅從數(shù)字來看,大多數(shù)初創(chuàng)公司都注定無法成功。
我想說一些更具挑釁性的話:幾乎所有在ChatGPT之后的炒作中誕生的初創(chuàng)公司以及專門給自己貼上“人工智能初創(chuàng)公司”標(biāo)簽的公司都注定無法成功。
現(xiàn)在,我是一位長期聚焦人工智能投資的VC投資人,事實(shí)上,我最初放棄對沖基金的工作,是因?yàn)槲铱吹饺斯ぶ悄茴I(lǐng)域發(fā)生了如此多的事情。所以,我絕對不是人工智能的懷疑論者。
話雖如此,從根本上,我認(rèn)為在投資人看來,當(dāng)前炒作周期中獲得融資的大多數(shù)公司都是毫無價(jià)值的。
1.你一個(gè)周末打造出來,別人也可以
我見過很多初創(chuàng)公司,他們基本上只是簡單地將幾個(gè)生成式人工智能API整合在一起,做一些提示工程開發(fā),然后添加一個(gè)前端用戶界面。有一些產(chǎn)品做得很精致,功能方面也令人印象深刻。
但這些公司也都注定不會(huì)成功,要么成為普通的公司(但不是保羅·格雷厄姆定義的典型初創(chuàng)公司),要么消亡。
顯然,如果這家公司是你在一個(gè)周末打造出來的,別人也可以做到。假設(shè)你是一名編程天才,是名副其實(shí)的10X級別的程序員神童!其他人可能需要幾個(gè)周末的時(shí)間……但最終會(huì)打造出來。
如果你的項(xiàng)目只是提供免費(fèi)分享的產(chǎn)品,只是為了娛樂,那沒什么問題。
但是,如果你開始收費(fèi),并且客戶開始非常依賴它,其他競爭者可能會(huì)以更低的價(jià)格介入進(jìn)來。也許你的產(chǎn)品還是更好,并且用戶往往會(huì)選擇更好的產(chǎn)品。
但如果產(chǎn)品確實(shí)很重要(即客戶有很高的支付意愿并且經(jīng)常使用),那么經(jīng)濟(jì)學(xué)和競爭的規(guī)律就會(huì)發(fā)揮作用:其他人會(huì)模仿你并爭奪你的利潤。
沒有防御性和沒有差異化就等于沒有利潤。這是基本的經(jīng)濟(jì)學(xué)原理。
2.連Alphabet、Meta或OpenAI都沒有任何防御能力
這些就是基礎(chǔ)的經(jīng)濟(jì)學(xué)知識和創(chuàng)業(yè)常識,對于人工智能這個(gè)領(lǐng)域來說也并不新鮮。每個(gè)創(chuàng)業(yè)熱點(diǎn)的炒作周期,其本質(zhì)特征都是人們忘記了這些基本規(guī)則的存在,然后在周期結(jié)束時(shí)懊惱地重新認(rèn)識到它們。
不過,請注意,我主要談?wù)摰氖悄切﹥H僅簡單地將ChatGPT等API集成到用戶界面的初創(chuàng)公司。這些公司顯然沒有什么差異化和防御性。即使你的用戶界面做得更好,其他人也可以輕易模仿。
不過,我的觀點(diǎn)不局限于這些淺顯的例子。
現(xiàn)在,同樣的邏輯應(yīng)用到ChatGPT、Bard、LlaMA等大語言模型(LLM)底層技術(shù)本身也是成立的。
如果我告訴你,我有一項(xiàng)出色的技術(shù),所有人都想使用,要?jiǎng)?chuàng)造它,我必須做的事情包括:
-
收集網(wǎng)上所有文本
-
使用大量的GPU、花費(fèi)數(shù)百萬美元對其進(jìn)行訓(xùn)練
-
基于眾所周知的技術(shù)(其中大部分是開源的)打造它
這樣就具備防御性了嗎?對于小規(guī)模初創(chuàng)公司來說,第1點(diǎn)和第2點(diǎn)可能會(huì)遇到一定程度的技術(shù)或保障困難,但對于其他大公司來說,這些都不是特別難以克服的,尤其是與第3點(diǎn)的事實(shí)相結(jié)合時(shí)。所有這些技術(shù)都建立基于變型器(Transformer)和大語言模型(LLM)的相同底層架構(gòu)上。這些LLM沒有真正的護(hù)城河,任何一家大型的互聯(lián)網(wǎng)公司都有能力復(fù)制它們。
事實(shí)上,甚至連Alphabet/Google內(nèi)部也有類似的說法。
對于所有圖像和視頻生成式人工智能(生成式AI)也是如此。只需用圖像或視頻替換第1點(diǎn)(注:如果Alphabet可以限制對YouTube的訪問,則視頻可能是一個(gè)例外)。
但如果我擁有最佳版本的人工智能會(huì)如何呢?
現(xiàn)在,我們已經(jīng)確定,基于其他人的技術(shù)打造API并不是非常有用(我們的淺顯案例)。我們現(xiàn)在還討論了,為什么LLM這個(gè)不那么微不足道的案例,從根本上來說也是不具備防御性的。
如果我靈活運(yùn)用上面的第3點(diǎn),并提出LLM的最佳版本會(huì)怎么樣?或者在人工智能的其他領(lǐng)域也有類似的創(chuàng)新呢?
從理論上講,這很有吸引力。但問題是,整個(gè)行業(yè)的技術(shù)前沿發(fā)展速度太快了。
這就像在上世紀(jì)90年代擁有最快速度的CPU
如果在20世紀(jì)90年代告訴你,我擁有最好的CPU會(huì)怎么樣?比如說,它的速度是英特爾的3倍!
考慮到開發(fā)CPU的成本和難以置信的難度,這在技術(shù)上確實(shí)令人難以置信!但接下來的問題是,你能年復(fù)一年地重復(fù)這一壯舉嗎?因?yàn)榭紤]到當(dāng)時(shí)半導(dǎo)體技術(shù)的發(fā)展速度(摩爾定律),你(也許)有一兩年的優(yōu)勢。英特爾和其他公司將很快拿出可以媲美的產(chǎn)品。如果你有一些特殊的手段可以不斷保持領(lǐng)先,這是一回事,但更有可能的是,你只是偶然發(fā)現(xiàn)了一些優(yōu)化技術(shù),其他人很快也會(huì)采用。
今天的人工智能領(lǐng)域也存在同樣的問題。前沿技術(shù)發(fā)展得太快了,整個(gè)人工智能學(xué)術(shù)界和行業(yè)研究界的前沿幾乎肯定比你一家公司的實(shí)力更強(qiáng)。
順便說一句,當(dāng)我們談?wù)撗邪l(fā)實(shí)力時(shí),即便在最大規(guī)模的情況,這一挑戰(zhàn)仍然存在。例如,據(jù)傳聞稱,中國在人工智能上的發(fā)展速度并沒有跟上全球(主要是美國)研究界的步伐?;旧希歇?dú)立發(fā)展專有模型的公司都會(huì)很快落后,并最終不得不采用全球最棒的技術(shù)。人工智能比半導(dǎo)體更糟糕,因?yàn)樗腥斯ぶ悄芏純A向于開源,這使得在算法能力方面保持任何長期優(yōu)勢變得更加困難。
因此,除非你能夠利用那一兩年的優(yōu)勢真正構(gòu)建一條持久的護(hù)城河,否則你不會(huì)獲得任何持久的價(jià)值——如果你仔細(xì)想想,要做到這一點(diǎn)實(shí)際上是非常困難的。
3.那么什么具備防御性呢?
那經(jīng)過這個(gè)篩選過程,到底還剩下什么?
你可以從事一些計(jì)算密集型的東西,只有你才能以經(jīng)濟(jì)可行的方式進(jìn)行訓(xùn)練或推理。在我看來,這種情況不太可能發(fā)生,因?yàn)槿斯ぶ悄茉跍p少實(shí)現(xiàn)特定結(jié)果所需的數(shù)據(jù)量和計(jì)算量方面取得了長足的進(jìn)展。但請注意,我的這個(gè)觀點(diǎn)并不太受歡迎。你可以自己判斷這一點(diǎn)是否正確。不過,至少從投資人的角度來看,即使這確實(shí)是一個(gè)優(yōu)勢,我也對一家初創(chuàng)公司積累比谷歌、Facebook、百度等巨頭更多的GPU/ASIC/FPGA的策略不感到興趣…
2)真實(shí)世界的專有數(shù)據(jù)
另一方面,你可以進(jìn)入一個(gè)無法簡單地從互聯(lián)網(wǎng)上獲取數(shù)據(jù)的領(lǐng)域。例如,醫(yī)療健康數(shù)據(jù)被孤立在醫(yī)院里,甚至現(xiàn)在根本沒有被收集起來;另外,蛋白質(zhì)折疊或藥代動(dòng)力學(xué)反應(yīng)數(shù)據(jù)等,都必須通過現(xiàn)實(shí)世界的實(shí)驗(yàn)精心收集。還有很多其他的數(shù)據(jù)…所有這些都有一個(gè)共同的特點(diǎn),那就是這些數(shù)據(jù)不存在于純粹的數(shù)字世界中,并且不能簡單地從互聯(lián)網(wǎng)上爬取。
這就是我認(rèn)為大多數(shù)人工智能初創(chuàng)公司的價(jià)值所在。在這些領(lǐng)域,你無法簡單地收集數(shù)據(jù),而是需要應(yīng)對高昂的成本、時(shí)間和物理世界混亂性。這些初創(chuàng)公司可以簡單地順應(yīng)人工智能技術(shù)進(jìn)步的浪潮——這并不重要,因?yàn)樗惴ǘ家呀?jīng)商品化了——但它們卻唯一擁有并掌握那些幾乎不可能獲取的真實(shí)世界的專有數(shù)據(jù)。
4.創(chuàng)造的價(jià)值并不意味著獲取的價(jià)值
請注意,上文我提到了初創(chuàng)公司。很多人忘記了,僅僅因?yàn)樵谏鐣?huì)層面上創(chuàng)造了價(jià)值,并不一定意味著該價(jià)值完全被一家公司獲取。20世紀(jì)90年代的互聯(lián)網(wǎng)繁榮期,打造了大量的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,但這些公司實(shí)現(xiàn)的卻是巨大的負(fù)值投資回報(bào)率(ROI)。雖然這些基礎(chǔ)設(shè)施對于社區(qū)的線上化來說大有裨益,但這是社會(huì)效益,而不是公司的投資回報(bào)率。
在近期的一個(gè)案例中,你是否知道Azure實(shí)際上運(yùn)行著大量的私有區(qū)塊鏈?出于多種種原因,很難真正在公司的財(cái)務(wù)報(bào)告上公開這些內(nèi)容,但很多大公司在Azure上運(yùn)行這些區(qū)塊鏈,使微軟成為區(qū)塊鏈的大贏家之一。(當(dāng)然,還有一個(gè)單獨(dú)的問題,即私有區(qū)塊鏈?zhǔn)欠裾娴呐c數(shù)據(jù)庫存在不同。但這與本文觀點(diǎn)無關(guān)。)
類似的情況也可能發(fā)生在OpenAI身上,OpenAI看起來就像是微軟的研發(fā)實(shí)驗(yàn)室。微軟在Azure中提供計(jì)算資源,作為回報(bào),OpenAI開發(fā)工具,再由Azure將其作為托管服務(wù)提供。然后,Azure可以通過ChatGPT和其他可以按需付費(fèi)的API調(diào)用方式賺大錢。當(dāng)然,這與Bard和谷歌云技術(shù)(Google Cloud Compute)等看起來也是一樣的。
這一原則貫穿了當(dāng)今人工智能領(lǐng)域的大部分領(lǐng)域。這些領(lǐng)域?qū)?huì)產(chǎn)生大量價(jià)值,但這些價(jià)值只會(huì)歸社會(huì)所有,不會(huì)被任何私人參與者攫取。順便說一句,這實(shí)際上太棒了——這就是技術(shù)成為我們社會(huì)和宏觀經(jīng)濟(jì)中為數(shù)不多的“免費(fèi)午餐”之一的方式。
當(dāng)然,會(huì)有大量的價(jià)值將會(huì)被現(xiàn)有的行業(yè)巨頭攫取,它們利用其市場影響力和規(guī)模優(yōu)勢。雖然這對社會(huì)而言不是免費(fèi)的午餐,但也是資本主義的運(yùn)作方式,并且通常仍然為社會(huì)創(chuàng)造“剩余價(jià)值”(經(jīng)濟(jì)學(xué)上的“好東西”)。
最后,只有一小部分的價(jià)值,既會(huì)被創(chuàng)造出來,又會(huì)被新的、年輕的公司所獲取,理想情況下,這些公司可以不斷發(fā)展并最終取代現(xiàn)有的巨頭企業(yè)(這就是健康的市場更替方式)。
這些公司將產(chǎn)生巨額的回報(bào),并成為未來的知名科技公司——當(dāng)然,這正是VC投資人在理論上追求的目標(biāo)。但現(xiàn)實(shí)中,大多數(shù)投資人在向人工智能初創(chuàng)公司(甚至是聲稱擁有“人工智能戰(zhàn)略”的大型上市公司)投資時(shí)卻過于隨意。因此,大多數(shù)的資金都被直接沖進(jìn)了下水道,白白浪費(fèi)掉了。
人工智能將改變世界。但絕大多數(shù)人工智能初創(chuàng)公司都注定無法成功。
---------------(正文結(jié)束)-----------------
原文作者:James Wang, Creative Ventures
原文地址:https://weightythoughts.com/p/most-ai-startups-are-doomed