2022-09-21 4:06 LJY2345   评论关闭   0 

與三四年前國內雲端 AI 芯片公司們在發布會的 PPT 上超越英偉達的豪言壯志形成鮮明對比,如今這些公司在現實里到處碰壁,許多連北都找不着。

“剛過完年,我們把芯片送到客戶那裡測試時,才發現我們的軟件根本沒辦法滿足客戶應用場景的需求,因為有些功能設計的時候就沒考慮到,我們當場就傻眼了。”

這還是擁有 AI 芯片的公司才能感受到的痛楚,產品還沒出來的公司,在 2022 年的資本寒冬里,奮力融資。

我只能用腥風血雨來形容搶融資的可怕。”目睹 AI 芯片公司間爭搶融資的從業者露西說,“為了能夠拿到融資,有些初創公司寫抹黑競爭對手的盡調報告,再單獨發給投資人阻礙競爭對手融資。”

當然,為了拿到融資,還有 AI 芯片公司講起了 GPU 的新故事。

“不懂的人不會投了,真正懂的人只會投真能落地的 AI 芯片公司。”這幾乎是業界的共識。

但云端 AI 芯片公司們落地的時候,才真切體會到設計出芯片只拿到了“入場券”,才真切體會到軟件有多難做。

現實讓雲端 AI 芯片創業者們更加心知肚明的是,不要說超越英偉達,賣出一張 AI 加速卡才是最現實的目標。

這就留下了一個值得深思的問題,如果 AI 芯片的參與者們和投資人們都只是想賺快錢,那狂歡結束能給國內半導體產業留下什麼?

資本寒冬里,為搶融資不擇手段

對於單款芯片開發成本就高達數億元,每年員工的薪資支出高達上億元的大芯片創業公司,大量融資成為了活下去的關鍵。“擁有更多融資,就有更大熬死競爭對手的機會,最終就能活下來。”數位投資界和芯片業界的人都對雷峰網說。

融資能力成為了一家大芯片創業公司掌舵人重要的能力,在 2022 年的資本寒冬里,就更加考驗大芯片公司的創始人們。

“市場上的資金是有限的,為了能夠獲得融資,除了拼實力,有的公司也耍起了手段。”露西有些憤慨,“為了阻礙競爭對手融資,一家芯片公司找競爭對手公司的離職員工挖黑料,找第三方機構出一份盡調報告一對一發給投資人,投資人收到盡調報告后質疑其可信度,找撰寫報告的機構確認,機構支支吾吾回復說是實習生寫的,這種手段有些拙劣。”

這家為了搶融資的 GPGPU(通用圖形處理器,屬於 AI 芯片的一類)初創公司不擇手段其實也容易理解,畢竟作為為數不多還沒正式發布產品的公司,處境尷尬,為了拿到參賽入場券,只能先拿融資,特別是在投資人愈加謹慎和理性的 2022 年。

“還好當時創始人‘騙’了我們,如果當時創始人特別理智的給我們分析投資大芯片創業的風險,我們也不敢投大芯片。現在我們也‘上船’了,就大家一起划船。”一位回過味的 AI 芯片投資人在 2022 年變得更加謹慎。

這與幾年前的情況大不相同。

“在 AI 大熱的 2016 年前後,AI 芯片公司創始人甚至連完整的商業計劃書都沒有就能獲得幾億融資。後來,AI 芯片公司的創始人靠着在 PPT 上超越英偉達也能獲得融資。但到了如今,投資人不僅要看產品,還要看芯片的 MLPerf Benchmark(一套用於測量和提高機器學習軟硬件性能的通用基準),更實際的投資人直接看芯片落地的訂單的發票。”AI 芯片從業者張偉(化名)看得很清楚。

“陪 AI 芯片初創公司真正跑出來難度太大了,即便我們天使輪就投資了一家非常有潛力的 AI 芯片公司,他們的產品也在落地過程中,但是高估值沒有足夠的支撐,對我來說是一個很大的壓力,我們在考慮退出。”投資了多個早期項目的投資人王軍(化名)表達了自己真實的想法。

關於 AI 芯片公司的估值,放棄投資 AI 芯片初創公司的投資人 Blake 說,“給 AI 芯片公司估值沒有一個很好的錨,提高或者降低 50% 都可以,這對投資人而言算不上好機會。”

為什麼資本還是湧入了 AI 雲端芯片領域?“一個是賽道邏輯,看到英偉達生意好、市值高就投資。另一個是一級市場投資人抱團。還有就是很多投資人並不專業,特別是跨領域的投資人和機構。”Blake 認為。

實際上,不止是沒有產品的公司在搶融資,有產品但資金緊張的 AI 芯片公司也參與了“搶融資”。

起個大早,趕了個晚集的「早鳥」

說來有趣,有產品但還要搶融資的公司 A 此前面臨過一次融資危機,公司的兩次動蕩為這家公司的前景蒙上一層陰影。另一家起個大早的 AI 芯片初創公司 B 早早準備好產品,卻被困在了軟件里,先發優勢消耗殆盡。

兩家起了大早趕了晚集的 AI 芯片公司,一個從公司經營的維度,另一個從產品的維度,展現了大芯片創業的巨大挑戰。

兩次動蕩,前途未卜

A 公司成立很早,2018 年就發布了首款產品,佔據了先發優勢,但這家公司的前員工向雷峰網透露,在公司發布首款產品的一年多之後,融資一直處於 B 輪,融資進度跟不上研發需求,於是開始縮減業務、欠薪、裁員,連 CEO 也被“裁”了。

A 公司的前員工透露,“那次的大變動,公司只保留了芯片團隊,公司管理層和業務大洗牌。不過融資也只是公司動蕩的其中一個因素,實際是各種因素的共同作用。”

業界的說法是,這家公司的 CEO 和聯合創始人在技術路線上理念不合,聯合創始人和投資人一起讓 CEO 出局。

創始人被踢出局的戲碼算不上新鮮,但不幸的是公司的關鍵人物變動似乎成了這家公司的“劫”。

A 公司在第一次動蕩之後重整旗鼓,發布了新產品,迎來新的掌舵人,正當一切都重回正軌之時,再次遭遇動蕩。

“A 公司新任 CEO 氣焰有些囂張,聲稱某公司的項目勢在必得,2022 年能落地 2 億的項目。”多位 AI 芯片業界人士都向雷峰網 (公眾號:雷峰網) 提及。

但這位經驗豐富的 CEO 還沒實際創造 2 億的營收就遭遇了調查。

一時間,香餑餑 CEO 好像成了燙手山芋,不說 2 億,不知道 A 公司今年能不能實現幾千萬的營收?”這成了同行會關注的話題。

揚言「吊打」英偉達的 AI 芯片公司,快被現實打趴了

每代產品不同樣,沒有高質量落地項目

A 公司因為人的因素沒能佔盡先機之時,B 公司被局限在了創始團隊的認知里。

“軟件做的真的太差,客戶沒辦法用起來,自然難落地。”幾位 B 公司前員工以及業內同行都如此評價。

軟件沒做起來,是因為硬件設計也有問題。

B 公司的芯片迭代到了第三代,但每一代芯片架構思路都在變,甚至首席架構師都不同,設計出的硬件微架構也有很大的不同,硬件架構沒有延續性,就算軟件的工程師再努力,軟件也難以復用,每一代產品軟件就像是從零開始。”了解 B 公司的馬超(化名)說:“另一方面,B 公司沒有能真正掌控整個軟件棧的技術大牛。”

一位 B 公司的前員工透露,公司沒有業界頂尖的大牛,軟件團隊的人背景雖然都還不錯,但就背景差不多造成了相互看不上,怎麼可能做出好產品。當然,公司請過一個業內某技術領域的高手,但面對 AI 芯片這麼大一攤子軟件,估計也很難把控,待了一個多月兩個月就離開了。

對於這種情況,幾位業界人士有一些共識,這家公司的創始人確實是有深厚積累的芯片專家,但畢竟不是芯片架構方面的專家,有局限性也很正常。但這家公司的創始團隊中沒有軟件的大牛,外部招來的人即便能力再強,也很難被“接納”,在核心管理團隊中沒有話語權,也很難發揮合力做出好產品。

沒有高效、好用的軟件,也是 B 公司的投資人雖然購買了少量芯片測試,但沒能通過灰度測試,進入大規模採購環節的關鍵原因。當然,B 公司也拿到了政府項目,訂單金額不小,但實際能不能產生真實利潤都存疑,算不上高質量、可複製的落地項目。

其實,目前國內 AI 雲端芯片公司大部分創始團隊都是有深厚的芯片從業背景,在對軟件的理解和重要性的認知上有明顯的局限。

一位國內 AI 芯片公司軟件的負責人直言:“CEO 和 CTO 都聽不懂我的工作。一些國內 AI 公司創始人對軟件的認知,相比領先的國際大公司,我認為有十幾年的差距。

那麼,AI 芯片的軟件到底難在哪?

被 AI 軟件棧困擾的 AI 芯片公司負責人陳俊(化名)指出,一方面,AI 芯片的軟件是從零開始,具有天然的複雜性,與 CPU 不同,各家的 AI 芯片計算架構和指令都不同,從編譯器到庫再到框架的適配,都不像 CPU 一樣有開源可以復用的東西。

另一方面,AI 的軟件生態實際上就是英偉達生態,但英偉達的軟件生態,尤其是 CUDA 相關的核心部分都是閉源、封閉的,想要將自家的軟件與英偉達的生態兼容的難度可想而知,想要短期內自己建立一個新的 AI 生態,無異於痴人說夢。

最後,雲端 AI 推理應用的多變性。目前 AI 的算法和模型仍然在快速發展和迭代,好不容易實現了圖像分類 ResNet 50 模型的優化,新的語言模型 BERT 模型又開始流行,自然語言處理模型又開始越變越大,BERT 的各種變形枝繁葉茂,這也增加了 AI 芯片軟件的開發難度。

尤其是編譯器相關的開發難度,以及針對不同模型不依賴手工優化,僅通過編譯器完成自動化性能優化的模型泛化能力,這個能力的缺失幾乎成了大多數 AI 芯片停留在“送測”而不能獲取訂單的核心原因。

這些是所有英偉達的挑戰者面對的技術難題,同時還有人才的挑戰。

馬超和大多數 AI 芯片的從業者有相同的觀點,“要打造一個完整易用的 AI 軟件棧,必須要有一個不僅熟悉驅動、固件等基礎軟件,既能夠從上向下看,也要能從下往上看,對整個 AI 軟件生態有全面認識,有足夠經驗和能力的軟件大牛。”

AI 芯片火起來之前,在國內做編譯器是個非常冷門的職業。”陳俊說:“編譯器是 AI 芯片軟件棧中重要的部分,國內芯片相關軟件人才非常匱乏。”

手握入場券,敗倒在客戶「變態」的模型里

AI 芯片創業公司軟件棧的問題並非無解,已經在百度落地的崑崙芯,以及在字節跳動落地的希姆計算,是國內為數不多被商業市場檢驗通過的 AI 芯片公司,摸索出了一條具備可複製性的商業化道路。

熟悉希姆計算的王雷(化名)說,“軟件都是和場景相關的,想要把軟件做好,只能接近客戶,深入業務。不僅要和客戶負責系統的人談,還要和運維、業務場景、算法的人深入溝通,否則很難把軟件做好。”

“想把軟件做好哪有捷徑可以走,國內 AI 芯片公司都在一個起跑線上,也都有互聯網大廠的投資人,希姆計算能稍微跑的快一點,還是負責市場落地的人天天泡在客戶辦公室和工廠里磨出來的,但即便這樣,也不能保證未來的成功。”王雷認為。

但 AI 芯片公司也不是輕輕鬆鬆就能獲得與客戶深入溝通的機會。一般的情況是,有需求的公司(比如 BAT 和移動運營商)會公開招標,AI 芯片公司尋求合作,經過初步篩選之後,符合需求的 AI 芯片公司可以送測產品,在現場運行客戶給的 AI 模型。

很多公司連編譯那一關都過不去。”王雷說,“即便能編譯,不少公司聲稱算力是英偉達同級別產品的 2 倍,實際還不到其性能的 1/4。

張偉表示,“主要還是因為編譯器做的不夠好,通常都是依據芯片存算特徵針對特定的模型手動做了優化,不具備泛化能力。所以在遇到客戶特別‘變態’模型的時候,就會遇到困難,就算手動編譯通過,性能也會受限。比如一般情況下,96*96 尺寸的圖片,可以順利編譯,吞吐性能還不錯,但客戶會根據自身業務需要對輸入的圖片尺寸進行調整,比如調整到 1280*720,那性能就會受到大幅度影響,甚至編譯不通過。更有甚者,模型結構都會發生諸如基礎算子和邏輯的變化,那編譯器的泛化能力是很難支撐直接跑起來的。”

這就是 AI 芯片編譯器的另一個難點所在,由於客戶的 AI 模型與其業務密切相關,涉及商業機密,因此並不會直接把模型給芯片公司,AI 芯片公司很難提前做有針對性的優化。

但即便進展更快一點,崑崙芯也需要更多時間完善其軟件棧。張偉了解的情況是,崑崙芯的 AI 芯片在搜索場景對比英偉達的產品有一倍多的性能優勢,但在其它場景優勢很小甚至沒有優勢。

“有聽到崑崙芯的客戶反饋離開了崑崙芯的人幫忙調試,芯片還是很難用起來。”陳俊說,“軟件還是不夠好用,所有 AI 芯片公司都還需要時間去打磨,這需要一個過程。

這對所有雲端 AI 芯片公司而言都是一個需要花非常多時間和精力的工作,在落地的過程中可能需要為客戶開發數百項特性,這是在設計硬件和開發軟件棧之初都無法完全明確的需求,甚至都意識不到用戶會有哪些應用場景和需求。

揚言「吊打」英偉達的 AI 芯片公司,快被現實打趴了

今年交卷,2024 年開始淘汰

雲端 AI 芯片公司們的落地競賽已經開啟。馬超認為,AI 芯片公司今年下半年是給投資人和市場交答卷的時候了,今年如果還不能上量落地,可能今年底明年初就會有公司開始收縮。

陳俊認為,雲端推理 AI 芯片的格局明年會更加明朗。

王雷則認為,即便是融資幾十億的 AI 芯片公司,按照千人規模,人均百萬的薪資計算,融資最多能撐到 2024 年,那時候就能看到真正裸泳的人。

想要在 AI 市場的競爭中不被淘汰,產品和選擇一樣重要。AI 雲端芯片公司們優先把目光投向了採購規模在億美元級別頭部互聯網公司以及政府的項目。

張偉說:“政府的項目看起來需求很大,但實際比預想的需求小很多。”

“政府的項目看起來金額很大,芯片公司自己要承擔的成本也很高,實際上利潤不高。更重要的是,政府的 AI 項目不具備延續性和可複製性。”張超表示,“寒武紀近幾年每年都有政府項目簽單,如今的市值也不到 300 億,這足以說明資本的態度。”

“那些一個項目沒落地,估值快趕上寒武紀的公司,未來怎麼持續發展?”多位 AI 芯片圈人士都質疑。

因此,當下檢驗一家雲端 AI 芯片公司,無論是採用 DSA(領域專用架構)還是 GPGPU 架構,能在互聯網公司落地才是有硬實力的體現。

互聯網公司對於 AI 芯片有嚴苛的性能和穩定性要求,能夠在互聯網公司的場景中落地,不僅證明了產品的可用性,也說明了其 AI 芯片落地的可複製性。

但也要看到,BAT 的增長在放緩,AI 算法的迭代速度也在變慢,AI 芯片的前途雖然光明,但道路依舊曲折,特別是還有英偉達這個難以超越的領導者。

英偉達耗費十多年打造了以 CUDA 為基礎的 AI 生態,有大量的合作夥伴共同優化軟件和適配最新算法,有業內頂尖的硬件團隊不斷迭代產品,客戶也早已習慣英偉達的軟件平台。“我們怎麼可能用幾年時間就趕超別人十幾年的成功?夢都不敢這麼做。”這是一位 AI 芯片創業公司 CEO 的心聲。

“差距和難度確實存在,但許多人都只是為了賺快錢,先把公司做大,不好好打磨產品,趕着商業化,然後儘快上市變現,最後能留給中國半導體產業什麼?”這是從業者留下的還沒有答案的問題。

🌙
😃

切换注册
忘记密码 ?

×

您也可以使用第三方帐号快捷登录

切换登录

×
扫一扫二维码分享
下载海报
  切换主题 | SCHEME TOOL