xx色综合,国产午夜亚洲精品不卡网站,成年在线欧美,最近免费中文字幕mv在线视频3 ,亚洲综合人成网免费视频

半導(dǎo)體

AI PC新突破 端側(cè)首次支持128K上下文窗口 實(shí)現(xiàn)2.2倍推理優(yōu)化

ainet.cn   2025年06月07日

今天,面壁智能正式發(fā)布并開(kāi)源了「面壁小鋼炮」端側(cè)系列最新力作——MiniCPM 4.0 模型,實(shí)現(xiàn)了端側(cè)可落地的系統(tǒng)級(jí)軟硬件稀疏化的高效創(chuàng)新。英特爾與面壁智能從模型開(kāi)發(fā)階段就緊密合作,實(shí)現(xiàn)了長(zhǎng)短文本多重推理效率的提升,端側(cè)AI PC在Day 0全面適配,128K長(zhǎng)上下文窗口等多方面突破。

雙方開(kāi)展了深度技術(shù)協(xié)同,基于英特爾硬件架構(gòu)定制投機(jī)解碼配置。通過(guò)硬件感知的草稿模型優(yōu)化策略,結(jié)合英特爾加速套件與KV Cache內(nèi)存增強(qiáng)技術(shù),實(shí)現(xiàn)端到端推理效率的2.2倍提升,攜手為業(yè)界帶來(lái)了全新的模型創(chuàng)新和端側(cè)性能體驗(yàn)。

此次,面壁推出的MiniCPM 4.0系列LLM模型擁有 8B、0.5B 兩種參數(shù)規(guī)模,針對(duì)單一架構(gòu)難以兼顧長(zhǎng)、短文本不同場(chǎng)景的技術(shù)難題,MiniCPM 4.0-8B采用「高效雙頻換擋」機(jī)制,能夠根據(jù)任務(wù)特征自動(dòng)切換注意力模式:在處理高難度的長(zhǎng)文本、深度思考任務(wù)時(shí),啟用稀疏注意力以降低計(jì)算復(fù)雜度,在短文本場(chǎng)景下切換至稠密注意力以確保精度,實(shí)現(xiàn)了長(zhǎng)、短文本切換的高效響應(yīng)。

目前,具有CPU、GPU、NPU三個(gè)AI運(yùn)算引擎的英特爾酷睿Ultra處理器已迅速對(duì)此適配,并借助OpenVINO™ 工具套件為MiniCPM 4.0系列模型提供優(yōu)化的卓越性能表現(xiàn)。英特爾再次在NPU上對(duì)模型發(fā)布提供第零日(Day 0)支持,為不同參數(shù)量模型和應(yīng)用場(chǎng)景提供更多樣化的、更有針對(duì)性的平臺(tái)支持。

* 上述測(cè)試評(píng)估了在int4混合精度和fp16精度設(shè)置下1K輸入的首詞元延遲和平均吞吐量。每項(xiàng)測(cè)試在預(yù)熱階段后執(zhí)行三次,選取平均值作為報(bào)告數(shù)據(jù)。性能結(jié)果基于以下SKU1或SKU2配置

在長(zhǎng)上下文窗口的技術(shù)創(chuàng)新方面,英特爾也有了新的突破。依托分塊稀疏注意力機(jī)制,結(jié)合深度算子融合與硬件驅(qū)動(dòng)的算法優(yōu)化,實(shí)現(xiàn)了長(zhǎng)文本緩存的大幅銳減,和推理效率的進(jìn)一步提升。 在保證輸出質(zhì)量的前提下,我們首次在基于英特爾銳炫™ Pro B60上將長(zhǎng)上下文窗口擴(kuò)展至128K。相較于稠密模型,首Token延遲降低了38%3,Token速率提升多達(dá)3.8倍3。經(jīng)過(guò)這樣的提升,一整部300多頁(yè)的哈利波特小說(shuō),可以在90秒內(nèi)完成閱讀、分析和總結(jié)。這不僅極大地提升了AI PC的用戶體驗(yàn),也為解鎖更多端側(cè)AI新應(yīng)用建立了強(qiáng)大的基礎(chǔ)。未來(lái),英特爾將持續(xù)保持與面壁的深度合作和協(xié)同研發(fā),進(jìn)一步提升長(zhǎng)上下文窗口應(yīng)用的性能。

在當(dāng)今數(shù)字化時(shí)代,人工智能技術(shù)正以前所未有的速度發(fā)展,英特爾作為全球領(lǐng)先的科技企業(yè)和AI PC的發(fā)起和倡導(dǎo)者,始終致力于推動(dòng)端側(cè)AI模型的創(chuàng)新發(fā)展。

此次合作不僅彰顯了英特爾在AI領(lǐng)域的強(qiáng)大技術(shù)實(shí)力,也體現(xiàn)了其對(duì)創(chuàng)新生態(tài)系統(tǒng)的堅(jiān)定承諾。通過(guò)整合雙方的技術(shù)優(yōu)勢(shì)和資源,英特爾平臺(tái)和MiniCPM 4.0系列模型聯(lián)合解決方案的廣泛應(yīng)用和落地部署已經(jīng)奠定了堅(jiān)實(shí)的基礎(chǔ),有望在智能生活、生產(chǎn)力提升等多個(gè)場(chǎng)景中發(fā)揮關(guān)鍵作用。

展望未來(lái),英特爾將繼續(xù)與面壁智能保持緊密合作,同時(shí)積極拓展合作關(guān)系,不斷探索AI技術(shù)的新邊界。英特爾致力于通過(guò)持續(xù)創(chuàng)新,推動(dòng)人工智能技術(shù)的普及與發(fā)展,構(gòu)建更加智能、高效的未來(lái)社會(huì)。

(來(lái)源:英特爾中國(guó))

標(biāo)簽:英特爾 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書(shū)下載
億萬(wàn)克
專題報(bào)道
2025全景工博會(huì)
2025全景工博會(huì)

第二十五屆中國(guó)國(guó)際工業(yè)博覽會(huì)(簡(jiǎn)稱“中國(guó)工博會(huì),CIIF”)將于今年9月23至27日在國(guó)家會(huì)展中心(上海)舉行。 [更多]

智能制造標(biāo)桿企業(yè)展播
智能制造標(biāo)桿企業(yè)展播

為了講述我國(guó)實(shí)體經(jīng)濟(jì)推進(jìn)高質(zhì)量發(fā)展的鮮活實(shí)例,發(fā)揮好典型企業(yè)實(shí)施智能制造的示范作用,提振廣大制造業(yè)企業(yè)推進(jìn)轉(zhuǎn)型升級(jí)的信心... [更多]

2025世界人工智能大會(huì)
2025世界人工智能大會(huì)

2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(簡(jiǎn)稱“WAIC 2025”)將于7月在上海世博中心和世博展覽館舉行... [更多]