Tsinghua University的Zheng Weimin:国内芯片的主要问题
发布时间:2025-05-19 11:15
Tsinghua University的Zheng Weimin:国内芯片的主要问题不是硬件质量,而是生态弱;需要加速CUDA的国内系统和基本软件的开发 5月17日,由SOHU经营的2025年SOHU技术年度论坛在北京开业。许多学者,科学家和内部行业都聚集在一起,以激发科学和技术明星海中的智慧和喧嚣的深刻碰撞。 该论坛将在线和离线结合起来,开放一个全天的意识形态节。下午,Tsinghua大学计算机科学与技术系Zheng Weimin,中国工程学院的学术学学院发表了题为“探索基础设施建设和人工智能大型模型的应用”的演讲。 n学术郑文说,2025年人工智能的发展具有两个主要特征:第一个是多模式,大型模型可以处理文本,图像和视频。第二种适用于与GDP密切相关的行业,中国在促进AI实施方面具有重要好处。 他甚至向您介绍,人工智能的生命周期大型模型包括五个链接:数据提取,预处理,模型培训,维修和推理。前三个链接需要许多计算资源和存储资源,通常由阿里巴巴,华为,DeepSeek等大型技术公司完成。只需使用现有的Onesmain模型,就需要适当地适应域和随后的推理应用程序。 学术郑维明(Zheng Weimin)建议,当前的大型培训模型在很大程度上取决于两种类型的系统:一种是Nvidia GPU,具有领先的硬件性能和生态成熟度,但面临禁止销售,高价和难以找到卡的困境;其他是国内筹码,超过30,000家纳蒂公司跨越遍布的研究和开发投资,硬件性能逐渐改善,但主要障碍在于生态和谐不足。 在这方面,学术的郑维明建议从两个方面取得成功。一方面,它是由“像CUDA”的系统构建的,以确保开发人员可以通过通常的举动来学习更少的学习并重塑生态。另一方面,NIT最好在海外60%以上的类似产品中改善国内卡的硬件性能(如果达到70%至80%的话)。尽管它开始迟到并且很难开发,但只要性能通常符合标准并合作生态优化,它仍然可以吸引用户。此外,需要集中资源以生成一些基本的软件。 最终,学术Weimin还提出了当前模型培训和理解面临的一些挑战理解的漫长背景和计算资源的矛盾作为示例。 Zheng Weimin,Tsinghua大学计算机科学技术系教授,中国工程学院学者 以下是演讲的摘录: 当今大型AI 2025型号的功能有两个。第一个功能是多模式。这个大型模型可以处理文本,图像和视频。其次,它被使用,并用于与GDP直接相关的行业。正如我今天说的那样,中国人最好这样做,并将这件事应用于与GDP直接相关的行业。 片刻让我知道人工智能的五个主要周期以及与生命周期的五个链接。 首先,对于大型型号而言,最重要的是模型培训。训练的是数据,数据是由机器训练的。第一件事是获取数据。从整个mundod中,您可以获取数据并将其带到我们的硬盘驱动器的数据实验室。 第二件事是Thedata预处理。我刚收到的数据是双重的,广告,格式不同,这意味着质量不高。通过预处理可以提高这种质量。这样做时,GPT4需要进行半年的预处理。预处理后,高质量的数据。 第三是模型培训。这次也是很长的时间,而且设备很多。最后,经过培训,您将获得基本模型。 第四是正确调整的模型。如果您使用医院的第三个过程的主要模型,那不是很好,也不会看医生。主要原因是当模型培训时,医院的数据很少。因此,基于主要的大型模型,第二次培训医院数据,称为微调,并制作了医院模型,可以对其进行治疗。主要的大型型号需要在财务上使用,但不足以直接使用它们,尤其是因为Fina几乎没有Ncial数据培训。因此,基于主要的大型模型,我们将第二次培训财务数据培训以适当地获得大型财务模型。模型微调实际上是基于基本模型的特定字段中的第二个数据培训,以在特定字段中获得大型模型。 后者是推理的模型,真正使用了它。 在这五个链接中,第一,第二和第三链接需要大型机器和大型存储空间,而普通单元不应这样做。例如,如果您是医院,医院不应该这样做,也不要做前三件事。谁能做到?做与Thedeepseek相同的事情,阿里巴巴也这样做,华为也是如此。他们最终将来自基本模型。我们将根据基本模型下载基本模型,并且医院模型很好。前三个不是由单位完成的。我们只为医院做到这一点,这是一个很棒的调整模型。这就是我们需要做的。 第四和第五推理,都有一个相关离子。为国内自然系统开发主要软件非常重要。现在有三个支持大型模型培训的系统。首先是基于Nvidia的GPU,具有出色的硬件性能和良好的生态,但问题是他们不会再出售它,价格昂贵的倍,很难找到卡。第二,国内系统。近年来,全国近30,000家公司生产AI芯片,而且开发非常好。但是当前情况如何?国内卡不想使用它们。这不是他们硬件的质量很困难,但是他们的生态不好。 这个问题非常重要。我认为改变生态有两件事要做。首先是CUDA系统的开发。什么是生态学?这意味着,如果您习惯它并想使用它,则称为生态系统。有一个名为CUDA的NVIDIA系统。发现CUDA后,您将能够编译软件。今天,米任何像库达这样的人。如果国内系统不是CUDA,那么人们就不喜欢它,也不喜欢它。因此,我认为我们需要构建像Cuda这样的系统。尽管它是国内卡系统,但在收集软件时与CUDA相同。这件事可以做到,也没问题。第二,如果国内卡的硬件系统可以在海外获得60%的类似系统,那不是6。0%足够,最好达到70%或80%,但是我们迟到了,并且过程更加困难。只要达到60%,每个人都想使用它,如果生态学很好。现在,我们认为使用它并不容易,不是因为硬件性能不佳,而是因为生态系统不良。一种是像CUDA一样做,另一个是执行10个软件。