時間:2024-06-20 16:32:09來源:21ic電子網(wǎng)
自ChatGPT發(fā)布之后,AI開始出圈,我們都切實感受到了AI的能力。近年來,AI一方面在模型能力上不斷加速演進(jìn),在處理更復(fù)雜的語言任務(wù)方面變得更加有效;另一方面在應(yīng)用領(lǐng)域逐步拓展,幫助專業(yè)人員在各自的垂直領(lǐng)域內(nèi)提高生產(chǎn)效率。不僅于此,最近更是出現(xiàn)了“主權(quán)AI”的概念,這進(jìn)一步上升到了國家安全的層次,各國也開始更加關(guān)注自己的AI基礎(chǔ)設(shè)施能力。
而對于我國而言,挑戰(zhàn)和機遇并存。我們有著豐富的應(yīng)用場景和用戶數(shù)據(jù),能夠?qū)崿F(xiàn)AI率先落地實踐;但同時由于地域政治摩擦、芯片禁令的限制,迫使我們更需要構(gòu)建自己的AI端到端生態(tài),擁有底層AI芯片的能力。
近日,Gartner針對“中國企業(yè)突破人工智能芯片限制”這一話題召開了記者分享活動。 Gartner研究副總裁盛陵海(Roger Sheng)進(jìn)行了精彩的分享。
AI時代到來,美國對中國的高性能AI芯片限制不斷加碼
為了在即將到來的AI時代保持技術(shù)主導(dǎo)權(quán),近年來美國對中國AI領(lǐng)域的限制措施逐步升級,從最初的黑名單、禁令到現(xiàn)在的全面禁運和技術(shù)封鎖,涉及到多個層面,尤其是高性能計算和芯片制造領(lǐng)域。
【芯片禁運和限制】
美國政府早在幾年前就開始對中國的高科技企業(yè)實施限制,特別是針對芯片領(lǐng)域的出口禁令。2020年,美國出臺了針對人工智能芯片的禁令,直接影響了中國企業(yè)對高性能計算資源的獲取。為了應(yīng)對這些限制,英偉達(dá)推出了專門為中國市場設(shè)計的 A800 和 H800 GPU,這些產(chǎn)品在原有 A100 和 H100 基礎(chǔ)上進(jìn)行了性能削減以符合出口規(guī)定。例如,A800 和 H800 的通信帶寬被限制在 400 GB/s 以下,但它們?nèi)员A袅藦姶蟮挠嬎隳芰,能夠滿足大多數(shù) AI 和高性能計算需求。
然而,這些措施顯然不足以滿足美國的限制意圖。2022年,美國進(jìn)一步降低了對高性能計算芯片的限制閾值,將禁令適用的性能上限設(shè)定為每秒 300 萬億次浮點運算(300 TFLOPS),幾乎等同于 A100 的水平。去年下半年,禁令范圍再次收緊,不僅限制總體計算性能,還開始關(guān)注單位芯片面積的性能密度,超過每平方毫米 370 GFLOPS 的芯片也被列入受限范圍。這些嚴(yán)格的限制措施,顯著打擊了中國在超級計算和 AI 訓(xùn)練領(lǐng)域的進(jìn)步能力。
【制造工藝和供應(yīng)鏈的封鎖】
除了芯片本身的禁運,美國還在芯片制造工藝和供應(yīng)鏈上進(jìn)行嚴(yán)厲封鎖。高端芯片的制造依賴于先進(jìn)的工藝和設(shè)備,例如 TSMC 等公司提供的 14nm 及以下的技術(shù),這些技術(shù)對提升芯片的性能和降低能耗至關(guān)重要。美國的禁令禁止國際先進(jìn)制造工藝向中國出口,這使得中國在追趕全球芯片制造技術(shù)水平上面臨巨大的挑戰(zhàn)。
同時,美國還禁止其公民參與中國的先進(jìn)制造業(yè)設(shè)備相關(guān)領(lǐng)域,這直接打擊了中國吸引頂尖人才和技術(shù)的能力。例如,最近的一個案例顯示,中微公司的一位高管為了專注于中國的半導(dǎo)體設(shè)備制造,選擇了出售一部分股票,以支付美國的離境稅。這表明,即使在巨大的經(jīng)濟(jì)和個人壓力下,中國的企業(yè)和個人仍在努力推進(jìn)本土半導(dǎo)體制造技術(shù)的發(fā)展。
“從整體上來看,美國不斷地是在‘補漏洞’,中國這邊也是不斷地在看有沒有機會利用現(xiàn)有的資源打一些‘游擊戰(zhàn)’,當(dāng)前是不斷地‘補漏洞’和‘打游擊戰(zhàn)’的狀況!笔⒖偡窒淼。
為了突破封鎖,中國企業(yè)和研究機構(gòu)正在積極尋找應(yīng)對之策,一方面努力發(fā)展自主創(chuàng)新技術(shù),另一方面積極尋求國際合作和替代方案。對于中國的芯片廠商而言,即使當(dāng)下提供的替代方案并不盡如人意,但唯有政府和企業(yè)堅定地選擇和支持,才能有機會獲得市場實踐,通過不斷地技術(shù)迭代來實現(xiàn)追趕。
當(dāng)下國內(nèi)產(chǎn)業(yè)變局和未來端側(cè)推理發(fā)展,給中國AI芯片廠商帶來新機遇
國內(nèi)企業(yè)要在被封鎖的局面中構(gòu)建AI基礎(chǔ)設(shè)施,可能有三種不同的選擇。第一是選擇本土供應(yīng)商的替代方案。尤其是對于國內(nèi)大型云服務(wù)商、政府機構(gòu)和國有企業(yè)而言,長期受制的局面無法改變,必須尋找國產(chǎn)替代方案來保證國內(nèi)的基礎(chǔ)關(guān)鍵民生、政務(wù)業(yè)務(wù)不會受到影響。而選擇本土供應(yīng)商的替代方案,存在著訓(xùn)練效率、性能受限和生態(tài)不完備的難題,要讓當(dāng)前業(yè)務(wù)盡量平滑地遷移到新的國產(chǎn)替代平臺上,也有很多的額外工作量。
第二種選擇是選擇NVIDIA的降級方案,這對于互聯(lián)網(wǎng)公司、跨國公司和中小型企業(yè)可能是一個合適的選擇。優(yōu)點在于平臺成熟,缺點在于性能受限、價格較高。
第三種選擇是通過非官方渠道來使用NVIDIA的芯片。例如直接購買市場上的整機或直接進(jìn)行算力租賃等。這種方式只適用于中小型公司,缺點也很明顯,就是沒有官方保障和技術(shù)支持。
從長期來看,掌握AI底層芯片能力,構(gòu)建本土GenAI生態(tài)系統(tǒng),是我們不得不走的道路。長期的局勢倒逼著我們的應(yīng)用者必須要選擇國產(chǎn)的替代方案,來構(gòu)建本地化的場景和應(yīng)用;而對于本土芯片供應(yīng)商而言,就一定要抓住這一機遇,從芯片底層做好主流大模型的適配,為開發(fā)者提供高效的開發(fā)體驗。
“不管如何的原因、怎么樣的原因,現(xiàn)在已經(jīng)走到這一步上、大勢所趨吧!笔⒖偪偨Y(jié)道。
在這種大變局的背景下,還有一個來自應(yīng)用推動的重大機遇,中國芯片廠商必須要抓住。那就是根據(jù)Gartner推測,從2025年開始,云端的推理芯片需求將超越訓(xùn)練芯片需求;而從2026年開始,隨著端側(cè)的AI能力也持續(xù)推動GenAI應(yīng)用增長,所以端側(cè)的推理芯片需求也會越來越大。
從2024年OpenAI的幾次服務(wù)崩潰我們可以感知到,人們對于生成式AI的使用量和頻率越來越高,而隨著越來越多的人會去用這個生成式AI,必然在云端上的推理訴求、對算力的需求會不斷地、極速級地增加。而為了提高能效,降低云端的負(fù)載,有一部分的推理算力會遷移到端側(cè)來運行,那么端側(cè)AI能力將會被持續(xù)推高。
“就是設(shè)備端可以支持十億到一百億規(guī)模的模型,然后邊緣端它支持一百億到一千億的這個參數(shù)規(guī)模的大模型,它都可以實際來支持一定的企業(yè)或者個人的應(yīng)用。所以這個從技術(shù)上,它其實也是可行的!笔⒖偪偨Y(jié)道,“邊緣側(cè)和端側(cè)的生成式人工智能應(yīng)用會從智能手機、電腦,不斷地擴(kuò)散、到消費物聯(lián)網(wǎng)、智能家居,然后進(jìn)一步到汽車上。”
當(dāng)前市場上主要的芯片制造商如高通、聯(lián)發(fā)科和英特爾等都在積極開發(fā)端側(cè)AI芯片,而我國的AI芯片廠商要如何抓住設(shè)備端和邊緣側(cè)的GenAI機遇?盛總強調(diào)了硬件標(biāo)準(zhǔn)化的重要性,為了更好地利用生成式AI的潛力,中國的芯片制造商應(yīng)該考慮合作建立一個統(tǒng)一的標(biāo)準(zhǔn),從而促進(jìn)AI芯片的兼容性和軟件生態(tài)的發(fā)展。這樣的標(biāo)準(zhǔn)化不僅有助于技術(shù)的推進(jìn),還能簡化后續(xù)的軟件開發(fā)和生態(tài)系統(tǒng)建設(shè)。
“其實對照過去的歷史來看,我們現(xiàn)在的情況其實并不是非常糟!笔⒖偺寡缘溃爸袊拇竽P,其實現(xiàn)在也不會差到哪里去。我們還是要根據(jù)過去的這樣一個歷史借鑒,從‘一無所有’再到‘自主研發(fā)’,一定要有這個堅定的信心,我們才能把AI芯片這個事情、AI產(chǎn)業(yè)能夠搞起來。”
中國傳動網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
產(chǎn)品新聞
更多>2024-10-18
2024-10-15
2024-09-13
2024-09-09
2024-09-06
英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI...
2024-09-05
推薦專題
更多>