7月11日,华中科技大学人工智能与自动化学院赴长三角“智启新程· AI赋能”暑期实践队15名师生走进上海无问芯穹科技有限公司,开展了一场沉浸式的“技术解码”调研活动。团队通过实时推理测试、场景化任务模拟、核心技术团队座谈等沉浸式方式,深度探究LPU芯片突破大模型推理瓶颈的创新逻辑,感受人工智能算力普惠的实践路径。
“自成立以来,我们始终聚焦一个目标——让大模型推理成本降至原来的十分之一”,产品方案解决专家李长敏向实践队介绍核心技术时语气坚定。
在实时推理体验区,上海行政负责人汪嘉芮操作平台发起Llama2-70B模型推理任务。屏幕上实时跳动的数据令人惊叹:单块LPU芯片的推理效率相当于8块英伟达H800GPU,延迟从传统的数十毫秒压缩至毫秒级,推理成本降低90%。计算研发平台总监夏磊揭开技术面纱:“这得益于核心技术实现了算力的智能调配——就像处理专业术语时激活‘专项算力’,日常对话则切换‘节能模式’。”
队员们现场体验了模型压缩全流程:从130B参数大模型经蒸馏技术压缩至1B以内,再部署到千元级边缘设备,直观感受“大模型轻量化”的技术魔力。“以前总在课本里学‘算力优化’,但直到亲眼看到模型压缩,看着130B参数的大模型一步步‘瘦身’到能在千元设备上运行,才真正理解什么是技术落地。”实践队员朱进感慨道,这种从算力核心到终端设备的全链条体验,让抽象的芯片技术变得触手可及。
图为实践队员观看LPU芯片大模型推理任务。 朱进 供图
2023年起,无问芯穹的LPU芯片与DeepSeek-R1一体机已在金融、人力资源、医疗等领域落地。一组组应用数据引发师生热议。某量化基金搭载该方案后,高频交易响应时间从5毫秒压缩至0.3毫秒,年度创收达2.3亿美元;猎聘通过其MaaS平台实现混训调度,简历分析成本降低40%,模型部署周期缩短70%;某三甲医院的医疗大模型基于LPU技术,病历分析时间从40分钟缩至5分钟,推理成本仅为传统方案的1/5。
实践队员韩骜说:“从金融的高频交易到医疗的病历分析,LPU芯片像一把‘万能钥匙’,打开了不同行业的效率瓶颈。我算了笔账:猎聘的成本降40%、部署周期缩70%,这意味着中小企业也能负担得起AI工具了;医院成本降到1/5,可能让更多基层医疗机构用得上大模型辅助诊断。技术不只是冷冰冰的参数,当它能适配不同场景的需求,能真正帮行业解决问题时,才算是‘活’的技术。
图为师生观看LPU芯片与DeepSeek-R1一体机的推理演示。 朱进 供图
交流环节中,李长敏重点介绍了无问芯穹的“算力青苗计划”。“我们已与清华、上海交大等 8 所高校共建联合实验室,每年投入数千万元用于前沿研究。”谈及人才标准,他强调:“大模型算力领域需要三类人才——懂芯片架构的‘硬件专家’、能优化推理引擎的‘软件工程师’、会结合场景落地的‘跨界通才’。数学基础、工程落地能力、产业洞察力,一个都不能少。”
“这三类人才标准像一面镜子照出了我们的短板。”实践队员张砾为坦言,以前觉得学好编程、算法就够了,这次才发现不懂芯片架构难寻优化瓶颈,不了解产业场景设计的模型可能不实用,“企业开放的算力平台和开发套件太珍贵了,能让我们在校园里就接触到真实的产业级问题。”
图为实践队成员与李长敏进行技术座谈。 胡挥宇供图
李长敏还向展示了一款千元级嵌入式设备:“通过模型量化、剪枝技术,我们已实现1B参数模型在树莓派等低成本硬件上运行,未来3年将推动手机终端运行130B大模型,让每个家庭都能用得起 AI 算力。”他特别强调:“技术创新的终点是普惠——中小企业能负担的推理成本、个人开发者可触及的算力工具,才是算力革命的真正价值。”
实践队员童恒说:“看到树莓派上能跑1B参数模型时,我突然想起老家的小超市——老板连复杂的收银系统都用不明白,如果未来手机能运行大模型,或许能帮他自动盘点库存、分析销售数据。李经理说‘技术终点是普惠’,这句话戳中了我。以前觉得AI算力是大企业的‘奢侈品’,但现在明白,真正的革命不是让强者更强,而是让弱者也能搭上便车。中小企业、个人开发者、普通家庭都能用得起,这样的算力才是有生命力的。”社会实践队队长郭瀚泽也深有感触:“千元级设备就能运行大模型,这个成本控制太惊人了。夏总监说的模型量化、剪枝技术,我们课堂上也学过,但从课本上的‘可行’到产业里的‘能用’,中间隔着无数次调试和优化。未来3年要让手机运行130B大模型,这个目标听起来疯狂,但想想他们已经把推理成本降了90%,又觉得充满可能。技术向善不只是理念,更是一步步把‘不可能’变成‘每个人都能用’的行动,这才是最打动我的地方。”
图为实践队员与企业合影。 朱进 供图
这场调研不仅是一次技术认知的升级,更搭建了高校科研与产业需求的对接桥梁。师生们深刻体会到:算力革命既需要“硬核”的技术突破,更需要“向下”的普惠情怀;既要有追赶国际前沿的决心,更要有扎根本土场景的智慧。实践队员吴杨思淼感触颇深:“最震撼的是‘技术落地的速度’和‘普惠的决心’。不到两年时间,从芯片到多行业应用,这种执行力背后是对产业痛点的精准把握;而坚持让普通人用得起算力,又体现了企业的格局。这让我明白,学习AI不只是为了发论文、拿学位,更是要像他们这样,盯着国家和社会的需求做研究,让技术真正服务于更多人。”大家纷纷表示,将以此次调研为契机,在学习中聚焦国家算力战略需求,为国产AI芯片的发展贡献青春力量。
(通讯员 郭瀚泽 刘典辉)