英伟达于4月28日正式颁布发表新一代多模态AI模子Nemotron 3 Nano Omni,这是该公司初次在单个模子中完成视觉、音频和说话的同一处置。该模子可以或许同时懂得图象、声响和文本等多模态信息,使AI智能体的运转效力比拟前代晋升高达9倍。Nemotron 3 Nano Omni面向边缘计较和端侧推理场景优化,可以或许在资本受限的设备下流畅运行,合用于小语种翻译、智能座舱语音交互、财产视觉检测等多样化利用处景。从4月28日起,该模子已在Hugging Face、GitHub等多个开辟者平台上开放下载。

英伟达开创人兼CEO黄仁勋表现,多模态才能是AI智能体走向通用化的关头一步,Nemotron 3系列的颁布发表将进一步下降开辟者构建智能利用的门坎。与此同时,工信部克日颁布发表将启动“模数共振”步履,鞭策野生智能高程度赋能新型财产化,并展开“野生智能+软件”专项步履。在政策与手艺的两重鞭策下,AI大模子的财产利用正加快落地。英伟达还将持续完美其CUDA生态和推理优化东西链,为开辟者供给从模子练习到安排的全流程撑持。业内估计,多模态AI将成为2026年野生智能财产的焦点协作赛道。




























