《天津市人工智能学会&至顶科技:2024年全球AIGC产业全景报告(58页).pdf》由会员分享,可在线阅读,更多相关《天津市人工智能学会&至顶科技:2024年全球AIGC产业全景报告(58页).pdf(58页珍藏版)》请在薪酬报告网上搜索。
1、120242024年全球年全球AIGCAIGC产业全景报告产业全景报告2024 Global AIGC Industry Report20242024年年1111月月2报告背景报告背景天津市人工智能学会、至顶科技、至顶智库天津市人工智能学会、至顶科技、至顶智库20242024年年1111月月2024.11 ZD Insights 2024年,生成式AI已全面进入应用规模化推广,探索新场景和商业模式的新发展阶段。伴随AI大模型的普及程度不断加深,AIGC产业发展重点从去年关注度最高的模型层向场景应用层转变。AIGC为营销、传媒、金融、医疗、教育、娱乐、办公、制造、科学发现等多个领域带来前所未有的
2、变革。搭载大模型的AI PC、AI手机、智能汽车相继推出,为用户带来更加便捷的使用体验。此外,具身智能也成为今年关注度颇高的领域,未来AI模型与人形机器人将密切融合,产生更多应用场景与商业机会。在此背景下,天津市人工智能学会、至顶科技、至顶智库联合发布2024年全球AIGC产业全景报告,报告从人类语言和机器语言的发展历程出发,全面展现全球AIGC产业的发展历程,对AIGC典型技术及产品成熟度进行研判,对AIGC产业投融资情况进行梳理,具体展现AIGC各细分场景的应用情况,最后报告提出全球AIGC产业的八大前沿趋势。为政府部门、行业从业者、教育工作者以及社会公众更好了解2024年AIGC的发展进
3、程提供参考。3报告目录报告目录1.产业概况篇2.基础设施篇3.场景应用篇5.前沿趋势篇4.用户调研篇4公元前公元前1010万年万年-公元前公元前1616世纪世纪19401940年代年代公元公元105105年年-2020世纪世纪4040年代年代2020世纪世纪5050年代至今年代至今19721972年年19901990年代年代20222022年年19501950年代年代 2024.11 ZD Insights 开篇:伴随人类语言的发展,机器语言演进到自然语言阶段资料来源:至顶智库结合公开资料整理绘制。语言发展历程分为三大阶段。语言语言1 1.0 0时代:时代:从人类语言诞生到公元前16世纪殷商时
4、期甲骨文的出现,文字成为人类交流的重要方式;语言语言2 2.0 0时代:时代:从蔡伦发明造纸术到世界第一台电子计算机诞生,语言开始通过各类机器实现传播;语言语言3 3.0 0时代:时代:伴随NLP及生成式AI等技术的快速发展与应用落地,机器生成和创造语言的方式成为了可能。机器语言发展历经五大阶段,从二进制代码发展到自然语言时代,新的“机器语言机器语言”交互方式诞生。新石器时代中期以新石器时代中期以后:后:中国象形文字公元前公元前29002900年:年:古埃及象形文字公元前公元前1616世纪:世纪:甲骨文公元前公元前32003200-26002600年:年:楔形文字公元前公元前1010万年万年:
5、人类原始语言诞生18371837年:年:美国人摩尔斯和两个英国工程师库克、怀斯顿同时发明电报18761876年:年:贝尔发明第一部电话19461946年:年:第一台电子计算机公元公元105105年:年:汉朝蔡伦发明造纸术公元公元10411041-10481048年间:年间:毕昇发明活字印刷术MOVMOVXCHXCHINCINCDECXRLXRLCLRANLANL19501950年:年:艾伦图灵提出图灵测试20012001年:年:Bengio等人提出前馈神经网络19691969年:年:互联网出现20172017年:年:Transformer架构提出20222022年:年:OpenAI发布Chat
6、GPT二进制代码助记符号高级编程语言机器语言机器语言1.01.0时代时代人类语言人类语言1.01.0时代时代人类语言人类语言2.02.0时代时代机器语言机器语言2.02.0时代时代机器语言机器语言4.04.0时代时代机器语言机器语言3.03.0时代时代人类语言人类语言3.03.0时代时代机器语言机器语言5.05.0时代时代解释型高级编程语言解释型高级编程语言解释型高级编程语言如Python、Ruby 等,不需要预编译,可以在运行时解释执行,加快了开发速度。通常具有丰富的库和框架,使得开发者能够更容易地实现各种功能。自然语言自然语言伴随人工智能技术的发展,使用自然语言替代原有机器语言编程的方式成
7、为可能,开发者可以使用自然语言编写指令,然后由大型语言模型将其转换为计算机可以执行的代码。未来将使更多人无需学习复杂的编程语法也能轻松创建程序。自然语言自然语言5产业概况篇AIGC产业全景图谱AIGC成熟度曲线AIGC发展路线图AIGC领域最新进展AIGC产业政策环境AIGC产业投融资情况61.1 2024年全球AIGC产业全景图谱天津市人工智能学会天津市人工智能学会、至顶科技至顶科技、至顶智库至顶智库联合发布20242024年全球年全球AIGC产业全景图谱产业全景图谱。图谱主要分为基础设施层基础设施层(AI服务器、AI计算集群、AI芯片、MaaS平台、AI数据服务);模型层模型层(通用大模型
8、、行业大模型);场景应用层场景应用层(智能助手、金融、医疗、办公、教育、奥运、智能汽车、营销、影视、法律、政务)。图谱中涉及各领域全球代表性企业和相关机构,为读者提供更为详实的参考信息。相比去年,基础设施层新增MaaS平台平台和AI数据服务数据服务;模型层新增通用大模型通用大模型和行业大模型行业大模型的类别划分;场景应用层按细分场景进行划分。2024.11 ZD Insights 模型层模型层通用大模型通用大模型行业大模型行业大模型4151基础设施层基础设施层AI服务器服务器AI计算集群计算集群AI芯片芯片MaaS平台平台AI数据服务数据服务69121210场景应用层场景应用层智能助手智能助手
9、金融金融医疗医疗办公办公教育教育奥运奥运智能汽车智能汽车营销营销影视影视法律法律政务政务24171514146771085资料来源:至顶智库整理绘制。20242024年全球年全球AIGCAIGC产业全景图谱所涉及的企业数量分布产业全景图谱所涉及的企业数量分布71.2 至顶AIGC成熟度曲线(2024)2024.11 ZD Insights 合成数据合成数据数字人数字人人形机器人人形机器人AIGC技术产品萌芽阶段AIGC技术产品爬升阶段AIGC技术产品成熟阶段图表来源:至顶智库结合公开资料及专家调研整理绘制。端侧模型端侧模型视频生成视频生成模型模型图像生成图像生成模型模型RAGRAG提示工程提示
10、工程AI AgentAI AgentAIAI手机手机AI PCAI PC大语言模型大语言模型社会关注度6.69亿图表说明:图表说明:萌芽阶段:萌芽阶段:技术/产品处于早期,推出时间短,应用场景少,普及度不高。爬升阶段:爬升阶段:技术/产品持续迭代,有相关应用场景,有一定普及度。成熟阶段:成熟阶段:技术/产品成熟稳定,应用场景多,普及度高。AIAI手机手机/PC/PC/智能汽车:智能汽车:特指搭载AI大模型的各类终端AIGC应用的成熟度。社会关注度:社会关注度:选取2024年微信指数最高点数值,体现社会对于某项技术/产品的关注程度。图中圆圈大小反映社会关注度高低。统计数据截至2024年11月。社
11、会关注度1020万社会关注度9.6万社会关注度43万社会关注度11万社会关注度761万社会关注度33万社会关注度120万社会关注度7322万社会关注度7446万社会关注度4.39亿智能汽车智能汽车社会关注度7200万微调微调社会关注度630万社会关注度3亿81.3 规模定律(Scaling Law)将持续推动AIGC产业发展 2024.11 ZD Insights 规模定律是指随着训练数据、模型大小和计算资源的增加,大语言模型的性能会有所提升的规律,2020年由OpenAI提出;2022年,GoogleDeepMind研究固定成本下最优的模型参数量和训练数据量,得出训练数据量应当和参数量同等提
12、升,并训练出Chinchilla模型。伴随OpenAI o1模型的发布,Scaling Law从模型训练扩展演进到推理扩展阶段。资料来源:MMLU,Epoch AI,至顶智库整理绘制。MMLU评分U-PaLM 540BGopher 280BChinchillaGemini Ultra 1760B8090101001000100004050607010203010010700亿参数,1.4万亿token,5.76e23 Flops2800亿参数,3000亿token,6.31e23 Flops参数量Qwen1.5 72B全球主流大模型性能表现符合规模定律全球主流大模型性能表现符合规模定律LLaM
13、A 65BLLaMA 33BLLaMA 2 34BMistral 7BQwen 7BLLaMA 2 7BRoBERTa-base 125MGopher 0.4BLLaMA 2 13B70亿参数,2万亿token,8.4e22 FlopsGLM 130BBLOOM 176BFalcon 180B1800亿参数,3.5万亿token,3.76e24 FlopsFalcon 40B400亿参数,1万亿token,2.4e23 Flops91.4 全球科技领军企业在AIGC产业的布局资料来源:至顶智库结合公开资料整理绘制。2024.11 ZD Insights 企业名称企业LOGO总部所在地生成式AI
14、产业主要细分领域AI芯片AI计算集群MaaS平台AI大模型AI场景应用/解决方案闭源开源轻量智能助手办公金融医疗汽车教育营销美国企业谷歌美国 亚马逊云科技美国微软美国 Meta美国OpenAI美国 苹果美国英伟达美国 英特尔美国高通美国韩国企业三星韩国中国企业百度中国腾讯中国阿里云中国火山引擎中国京东中国华为中国科大讯飞中国商汤中国101.5 全球AIGC产业发展路线图(2015-2024)2024.11 ZD Insights 2017Transformer2017.62018BERT2018.102018.6发布GPT-120192019.2发布GPT-22019.3Ernie 1.020
15、19.7Ernie 2.0RoBERTa20202020.5发布GPT-32020.6Gshard2020.11GLM2020.10mT520212021.5LaMDA2021.9GLM-10B2021.12GLaM2021.1DALL E图像生成模型2021.7Ernie 3.020222022.5OPT-175B2022.9Make-a-Video视频生成模型2022.4DALL E 2图像生成模型2022.8GLM-130BCodeGeeX2022.11发布ChatGPTWebGLM资料来源:至顶智库结合公开资料整理绘制。2017年,伴随Transformer的出现,AI大模型在全球掀起
16、开发浪潮。2022年11月,ChatGPT的正式发布,加速了各类科技企业开发大模型的进度,以谷歌、Meta、OpenAI、Anthropic、百度、阿里、腾讯、科大讯飞、智谱等国内外领军科技企业,推出语言、图像、视觉、多模态等各种类型的AI大模型,主流模型具有生成各类文案、图像、视频等能力。此外,适用于金融、医疗、教育、营销、客服等领域的行业大模型也层出不穷,不断推动商业化落地进程。2015OpenAI成立2015.1211 2024.11 ZD Insights 1.5 全球AIGC产业发展路线图(2015-2024)202320242023.2Llama 1ChatGPT Plus 订阅服
17、务推出2023.3PaLM-EClaudeGPT-4 ERNIE Bot 文心一言ChatGLM2023.4日日新SenseNova大模型体系通义千问1.02023.5PaLM 2AI芯片MTIA v1讯飞星火 V1.0VisualGLM2023.6ChatGLM2 智谱清言讯飞星火 V1.52023.7CM3leon文生图模型Llama 2Claude腾讯混元大模型2023.9Mistral 7BMeta AI智能助理Claude ProMicrosoft Copilot智能助理讯飞星火 V3.0CogVLMChatGLM3智谱清言2023.10通义千问2.0DALL-E 3图像生成模型ER
18、NIE 4.0文心大模型4.0Gemini 1.0UltraGemini 1.0Pro Gemini 1.0Nano轻量模型/端侧模型2023.12Mixtral 8x7BQwen-72BQwen-1.8BQwen-Audio(音频大模型)资料来源:至顶智库结合公开资料整理绘制。2024.1GLM-4 发布GPT Store 讯飞星火 V3.5星火语音大模型星火开源-13B日日新SenseNova4.0 大模型体系2024.2Mistral LargeGemini 1.5Gemini 1.5 ProGemmaSora发布视频生成模型Claude 3 HaikuClaude 3 SonnetCl
19、aude 3 Opus2024.3OpenAI与Financial Times达成合作,提升ChatGPT体验2024.4Mixtral 8x22BLlama 3Phi-3轻量模型Phi-3-mini端侧模型 Grok-1.5V日日新SenseNova5.0 大模型体系2024.5Imagen 3图像生成模型Veo视频生成模型Gemini 1.5 Flash轻量模型通义千问2.5GPT-4o讯飞星火 V4.0OpenAI与Apple达成合作,未来苹果产品将搭载ChatGPT2024.62024.6文心大模型4.0TurboClaude 3.5 SonnetGemma 22024.82024.7
20、2024.7CodeGeeX4代码生成模型CogVideoX视频生成模型GPT-4o mini SearchGPT日日新SenseNova5.5 大模型体系日日新 5.5 Lite 端侧模型Mistral Large 2Mistral NeMoLlama 3.1Gemini Live图像智能语音助手Pixel Studio生成应用谷歌AI手机搭载Gemini模型Tensor G4AI手机芯片Grok-1.5Grok-2Grok-2 mini2023.11Claude 2.1长文本 200K TokenEmu 视频生成模型蓝心大模型1B 端侧模型AndesGPT端侧模型Ernie 3.52023
21、.8讯飞星火 V2.0ChatGPT Enterprise企业级产品推出Qwen-VL 视觉语言模型小米MiLM端侧模型理想Mind GPT 端侧模型蔚来NOMI GPT 端侧模型文心大模型4.0工具版Phi-3.5轻量模型 Llama 3.2视觉模型(11B和90B)文本生成模型(1B和3B)Qwen2.5开源通义万相发布视频生成模型豆包视频生成模型豆包大模型OpenAI o1 推理模型2024.9121.6 2024年全球领军科技企业在AIGC领域的最新进展2024年4月小尺寸模型 Phi-3 mini可用于手机上运行的小尺寸模型,其中Phi-3 mini拥有38亿参数,经过 3.3 万亿
22、token训练。Phi-3-mini有两种上下文长度变体:4K 和 128K token。2024年7月Mistral Large 21230 亿参数的大小使其能够在单个节点上以大吞吐量运行。MistralLarge 2拥有128k上下文窗口,支持英语、法语、中文等数十种语言及80多种编程语言,在代码和推理、指令遵循、多轮对话等方面表现突出。Mistral Large 2允许用于研究和非商业用途的使用和修改。2024年4月开源模型 Llama 3具有80亿和700亿参数,预训练数据集达到15万亿token进行训练,训练数据来源于30余种语言。2024年7月开源模型 Llama 3.1Llama
23、 3.1 405B使用15万亿token在超过16000个H100 GPU上训练,上下文长度扩展到128K。PaliGemma 是开放式视觉语言模型,可在广泛的视觉语言任务中实现卓越的微调性能,包括为图片和短视频描述生成、视觉问答、理解图像中的文本、对象检测和对象分割;Gemma 2开源9B和27B版本,其中Gemma 2 27B性能与 Llama 3 70B相媲美,大小不到 Llama 3 70B 的一半。Gemini 1.5采用新的专家混合(MoE)架构,使训练和服务更加高效。其中Gemini 1.5 Pro 是中型多模态模型,配备了标准的 128k token上下文窗口。2024年2月开
24、源模型 Gemma2024年5月视频生成模型 Veo2024年5月图像生成模型Imagen 3Gemma更加轻量,拥有2B和7B版本,模型权重也一并开源,且允许商用。采用与Gemini模型相同技术构建。Veo 可生成时间超过一分钟的1080p分辨率视频。包括生成查询网络(GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet和Lumiere,提高质量和输出分辨率。Imagen 3是Google最高质量的文本到图像模型,可生成高细节水平、逼真的图像,与之前的模型相比,分散注意力的视觉干扰更少。2024年5月多模态 Gemini 1.5 Flash1.5
25、Flash是通过 API 提供的速度最快的 Gemini 模型,比 1.5 Pro 更轻量级但具有强大的多模态推理能力,在总结摘要、聊天应用、图像和视频字幕生成以及从长文档和表格中提取数据等方面表现出色。2024年6月视觉语言模型PaliGemma及开源模型Gemma 22024年8月Gemma 2轻量级轻量级Gemma 2 2B 拥有20亿参数,具有内置的安全改进以及性能和效率的强大平衡。可在各种硬件上高效运行,从边缘设备和笔记本电脑到使用 Vertex AI 和 GoogleKubernetes Engine(GKE)的强大云部署。可根据商业友好的Gemma 条款进行研究和商业应用。202
26、4年2月Gemini 1.5、2024年2月视频生成模型 Sora视频生成模型Sora 能够生成时长一分钟的高保真视频。OpenAI在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本调节扩散模型,能在时间上向前或向后扩展视频;可修改输入视频的风格和环境;可连接两个输入视频,在不同主题和场景构成的视频之间无缝过渡。2024年5月多模态模型 GPT-4oGPT-4o采用更自然的人机交互,接受文本、音频、图像和视频的任意组合作为输入,并生成文本、音频和图像的任意组合输出。2024年3月多模态模型 Claude 3Claude 3 Opus是最智能的模型,在高度复杂的任务上具有市场最佳的性能;C
27、laude 3 Sonnet在智能和速度之间实现理想的平衡;Claude 3Haiku是最快、最紧凑的模型。2024年6月多模态模型 Claude 3.5 SonnetClaude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍,且推理、阅读理解、数学、科学和编码能力更强,也是Anthropic迄今最强的视觉模型;Claude.ai新增了Artifacts功能。Artifacts是一项扩展用户与 Claude 交互方式的新功能。用户可以实时查看、编辑和构建 Claude的创作,并将生成的内容无缝集成到项目和工作流程中。2024年4月Mixtral 8x22BMixtra
28、l 8x22B是一个稀疏专家混合(SMoE)模型,仅使用 1410亿激活参数中的390亿,具有高成本效率。Mixtral 8x22B精通英语、法语、意大利语、德语和西班牙语,具有很强的数学和编码能力,64K token上下文窗口允许从大型文档中精确调用信息。2024.11 ZD Insights 资料来源:至顶智库结合公开资料整理绘制。2024年9月开源模型 Llama 3.2包括视觉模型(11B和90B)和文本模型(1B和3B),提供预训练与对齐版本,可通过torchtune进行微调,也可使用torchchat在本地部署,还可通过Meta AI进行使用。2024年9月推理模型 OpenAI
29、o1OpenAI o1在处理物理学、化学和生物学领域的复杂问题时展现出了接近博士的专业能力。在国际奥林匹克数学竞赛中,展现出83%的准确率水平。其编程能力还在Codeforces竞赛中表现超过89%的人类选手。2024年10月Ministral 3B/8B包括Ministral 3B和Ministral 8B两种轻量级模型,均支持128k上下文且性能媲美Gemma 2、Llama 3.1开源模型。Ministral 8B具有特殊的交错滑动窗口注意力机制(SWA),可实现更快和内存高效的推理。131.6 2024年中国领军科技企业在AIGC领域的最新进展2024年1月讯飞星火大模型V3.5202
30、4年1月星火语音大模型模型在语言理解、文本生成、知识问答、逻辑推理,数学能力、代码能力和多模态能力七个方面进行全面升级,其中语言理解、数学能力超过GPT-4 Turbo。代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。在中文、英语、法语、俄语等首批37个主流透种的语音识剧效果超过OpenAl Whisper V3。在多语种语音合成方面,星火语音大模型的首批40个语种平均MOS分绝对提升0.25,拟人度超83%。2024年6月讯飞星火大模型V4.0实现对标GPT4-Turbo,在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越。2024年4月智舱大模型2
31、.02024年4月文心大模型4.0工具版2024年6月文心大模型4.0 Turbo2024年7月飞桨框架3.0智舱大模型 2.0 采用全新MoE架构,可支持本地化部署,并配套专属开发工具链,支持车企高效定制品牌特色,基于智舱体验打造差异化竞争力。在工具版上,可以通过自然语言交互,进行文档问答、数据分析、代码执行。提供基于大模型来开发各种应用的工具,包括智能体开发工具 AgentBuilder,AI 原生应用开发工具 AppBuilder,以及各种尺寸的模型定制工具 ModelBuilder。网页版、APP、API 陆续开放,通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心
32、技术的持续创新,速度更快,效果更好。飞桨框架3.0 是面向大模型、异构多芯进行专属设计,向下适配异构多芯,充分释放硬件潜能;向上一体化支撑大模型的训练、推理。同时具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力,全面地提升了服务产业的能力。基于腾讯混元大模型,具备看、听、说等多模态能力,在知识学习、生活百科、职场办公、趣味创作等多个领域提高效率。2024年5月AI助手元宝GLM-4,整体性能相比GLM3全面提升60%,支持更长上下文、更强的多模态,支持更快推理速度,更多并发,降低推理成本。GLM-4 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器
33、、Code Interpreter代码解释器和多模态文生图大模型,以完成复杂任务。智谱发布 AI 视频模型清影,30秒将任意文图生成视频,并开源与清影同源的视频生成模型CogVideoX。2024年7月代码生成模型CodeGeeX4开源CodeGeeX4-ALL-9B,集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等能力于一体的代码大模型。2024年7月视频生成模型CogVideoX2024年1月GLM-42024年7月日日新SenseNova 5.5日日新5.5具有6000亿参数,综合性能较日日新 5.0提升30%。交互效果和多项核心指标实现对标GPT-4o;日日
34、新 5o,流式多模态交互,带来全新AI交互模式;端侧模型升级,发布日日新 5.5 Lite。2024年5月Baichuan 4发布最新一代基座大模型 Baichuan4,同时推出首款 AI 助手“百小应”。Baichuan 4相较Baichuan 3在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%。2024.11 ZD Insights 资料来源:至顶智库结合公开资料整理绘制。2024年5月通义千问2.5通义千问2.5版本的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%,10%。2024年4月开源模型 Qwen1.5-32BQwen1
35、.5-32B在MMLU、GSM8K、HumanEval以及BBH等多种任务上展现出颇具竞争力的表现,优于其他30B级别模型。开源0.5B、1.8B、4B、7B、14B和72B共计6个不同规模的Base和Chat模型。2024年3月开源模型Qwen1.52024年9月开源模型Qwen2.5通义大模型家族已全面涵盖语言、图像、视频、音频等全模态。Qwen2.5全系列模型都在18T token数据上进行预训练,Qwen2.5-72B模型在MMLU-rudex基准、MBPP 基准和MATH基准的得分高达86.8、88.2、83.1。通义万相发布视频生成模型文生视频中,支持多语言输入和多种比例生成,并可
36、以通过灵感扩写功能丰富视频内容表现力;图生视频中,支持将上传图片按照比例转化为动态视频,并能通过提示词控制视频运动。2024年5月豆包大模型发布9款豆包系列大模型,包括豆包通用模型Pro/Lite、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生 图模 型、Function call模型、向量化模型。其中豆包通用模型pro支持128k长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力。2024年9月豆包视频生成模型遵从复杂prompt,解锁时序性多拍动作指令与多个主体间的交互能力。具备多镜头语言能力,并能完成在一个prompt内实现多个镜头切换。支持多种视频风格,还包含六种
37、不同比例的视频。2024年10月Yi-LightningYi-Lightning在Chatbot Arena榜单中以1287的竞技场分数位列大语言模型性能的世界第6,在数学模块位列世界第3,超越GPT-4o以及Claude3.5 Sonnet等行业内顶尖模型。2024年9月腾讯混元Turbo相比于前一代混元Turbo模型,新一代的训练效率提升108%,推理效率提升100%,推理成本则降低为前一代的一半。在多个基准的测试上已能够对标GPT-4o。2024年10月基座大模型GLM-4-PlusGLM-4-Plus 在各大语言文本能力数据集上获得与 GPT-4o 及 405BLlama3.1相当的水
38、平,在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。2024年10月讯飞星火4.0 Turbo文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力均超过GPT-4 Turbo,数学和代码能力超越GPT-4o,效率相对提升50%,国内外中英文14项主流测试集中实现9项第一。14资料来源:至顶智库结合公开资料整理绘制。2024.11 ZD Insights 1.7 测试集成为评判AI模型性能的重要手段类别类别测试集测试集语种语种发布单位发布单位综合考试综合考试MMLU英文加州大学伯克利分校CMMLU中文上海交通大学/微软亚洲研究院/墨尔本大学ARC-C英文艾伦人工智能
39、研究所C-Eval中文清华大学/爱丁堡大学/上海交通大学理解理解&推理推理HellaSwag英文艾伦人工智能研究所BBH英文GoogleWinoGrande英文华盛顿大学/艾伦人工智能研究所RACE-H英文卡内基梅隆大学数学数学&科学科学GSM8K英文OpenAIMATH英文加州大学伯克利分校GPQA英文纽约大学、Cohere、Anthropic代码代码HumanEval英文OpenAI大模型测试集是评估和提升人工智能模型性能的重要工具,为开发者提供标准化平台,用于量化和比较不同模型的性能,有助于加速模型的迭代和优化。相关测试集通常涵盖多个领域和任务,以确保全面评估模型的通用性和专业性。按类别
40、来看,全球AI大模型测试集分为综合考试类、理解推理类、数学科学类、代码类。其中,综合考试类的MMLU(Massive Multitask Language Understanding)测试集使用较为广泛,由加州大学伯克利分校于2020年9月发布,涵盖57个学科,从人文到社科到理工多个大类的综合知识能力。具体如下表所示。全球主流全球主流AIAI大模型测试集大模型测试集151.8 全球AIGC产业发展的政策环境资料来源:至顶智库结合公开资料整理绘制。2024.11 ZD Insights 发布时间发布时间政策名称政策名称发布机构发布机构政策内容政策内容美国美国2024年4月Future of Ar
41、tificial Intelligence Innovation Act of 20242024年人工智能创新法案美国国会成立美国人工智能安全研究所,旨在制定确保国家安全、公共安全和个人权利的人工智能标准。创建人工智能测试计划,帮助发现人工智能生态系统中的漏洞。组建人工智能创新和标准联盟,鼓励人工智能创新合作,协调各国人工智能标准。由美国国家科学基金会指导启动双边和多边人工智能研究合作,这一发展将推动协调创新和安全人工智能发展。2024年1月The California Artificial Intelligence Transparency Act加州人工智能透明度法案美国加州议会旨在赋予消
42、费者识别AI生成产品的能力,以降低AI生成内容可能被滥用的风险。要求大型AI生成内容提供商对其生成的图像、视频、音频等媒体内容添加水印,并为消费者提供相应的查询平台和查询服务,确保消费者拥有对产品必要信息的知情权。该法案标志着美国加州在为人工智能生成产品制定明确准则方面迈出了重要一步。2023年5月National Artificial Intelligence Research and Development Strategic Plan国家人工智能开发战略计划美国白宫旨在确保人工智能技术的发展符合国家的价值观、保护公民权利、促进经济增长并保护国家安全。该计划提出培养联邦机器学习方法,提高模
43、型通信和从多个设备更新到共享的全局模型的效率。研究可扩展通用人工智能系统,不断创新推出基础模型在语言和图像任务上的应用,解决在数据库上训练模型的隐私问题,提升大模型的有效性、可靠性、安全性。欧盟欧盟2024年9月Council of Europe Framework Convention on Artificial Intelligence and Human Rights,Democracy and the Rule of Law人工智能与人权、民主及法治框架公约欧盟委员会旨在确保人工智能活动符合人权、民主和法治。公约促进成员国间以及全球范围内的合作,以强化共同价值观;关切人工智能发展可能导
44、致的歧视和经济、社会不平等;强调人工智能系统的透明度和负责创新的重要性;国家需采取措施,保障人工智能活动中对隐私和个人数据的保护;各成员国需通过法律和行政手段,确保人工智能系统不危害民主进程和法律的尊重;指定开展国际合作和机制监督,以确保其条款的有效实施。2024年7月EU Artificial Intelligence Act欧盟人工智能法案欧盟委员会该法案根据风险将人工智能分类为四个等级:不可接受风险的AI(如社会评分系统和操控性AI)被禁止;高风险AI系统受到严格监管;有限风险AI系统则面临较轻的透明度义务;最小风险AI(如大多数现有应用)不受监管。高风险AI系统的主要责任在于提供者(开
45、发者),无论其是否在欧盟内,服务提供者承担相关义务。通用AI模型的提供者需提供技术文档和使用说明,并遵守版权指令,存在系统性风险的模型还需进行评估和网络安全保护。日本日本2024年4月商业人工智能指南1.0日本总务省、日本经济产业省旨在应对生成式人工智能技术变化,并提供统一的人工智能治理指导原则。该指南草案建议人工智能开发人员收集和处理合理的数据以用于模型的学习;定期评估AI模型的输入和输出,以监测任何生成的偏见;还应当向利益相关方披露用于训练AI的数据收集方法以及AI模型的训练方法;确保AI商业参与者之间的合作,从价值链和风险链的角度出发。20232023年以来全球发布的年以来全球发布的AI
46、GCAIGC相关政策相关政策161.9 中国AIGC产业发展的政策环境20232023年以来中国发布的年以来中国发布的AIGCAIGC相关政策相关政策资料来源:至顶智库结合公开资料整理绘制。2024.11 ZD Insights 发布时间发布时间政策名称政策名称发布机构发布机构政策内容政策内容国家层面国家层面2024年6月国家人工智能产业综合标准化体系建设指南(2024版)工业和信息化部、中央网信办、国家发改委、国家标准化管理委员会指南提出机器学习、知识图谱、大模型、自然语言处理、计算机视觉等关键技术的标准,其中大模型标准包括大模型通用技术要求、评测指标与方法、服务能力成熟度评估、生成内容评价
47、等。政策还对包括基础安全,数据、算法和模型安全,网络、技术和系统安全等与人工智能模型相关的安全标准进行规范。2023年7月生成式人工智能服务管理暂行办法国家网信办、国家发改委、教育部、科技部、工业和信息化部、公安部、国家广电总局鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,应遵守:使用具有合法来源的数据和基础模型;不得侵害他人依法享有的知识产权;采取有效措施提高训练数据质量。地方层面地方层面北京北京2024年7月北京市推动“人工智能+”行动计划(20
48、24-2025年)北京市发展和改革委员会、北京市经济和信息化局、北京市科学技术委员会、中关村科技园区管理委员会到2025年,力争形成3-5个先进可用、自主可控的基础大模型产品、100个优秀的行业大模型产品和1000个行业成功案例。围绕机器人、教育、医疗、金融、文化、交通等领域组织实施一批综合型、标杆性重大工程,建立各行业大模型平台,促进大模型核心理论与技术突破,增强人工智能工程化能力。2024年3月北京经济技术开发区关于加快打造AI原生产业创新高地的若干政策北京经济技术开发区管理委员会到2026年,集聚人工智能产业链企业100家,建成人工智能算力10000PFlops。加快推进算力基础设施建设
49、,鼓励打造国产算力底座。支持头部企业围绕多模态通用模型基础架构、多模态学习算法、对齐调优等领域开展大模型关键技术攻关。大力开展“大模型+”行动,推动“大模型+自动驾驶”、“大模型+机器人”、“大模型+工业制造”等场景应用。2023年5月北京市促进通用人工智能创新发展的若干措施北京市人民政府办公厅建设北京人工智能公共算力中心,形成规模化先进算力供给能力。围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。171
50、.9 中国AIGC产业发展的政策环境20232023年以来中国发布的年以来中国发布的AIGCAIGC相关政策相关政策资料来源:至顶智库结合公开资料整理绘制。2024.11 ZD Insights 发布时间发布时间政策名称政策名称发布机构发布机构政策内容政策内容地方层面地方层面上海上海2024年3月上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)上海市通信管理局、上海网信办、上海市发改委、上海市数据局、上海市教委、上海市科委、上海市卫健委、上海市市场监管局、上海市国资委、上海市交通委、中国人民银行上海总部到2025年,智能算力规模超过30EFlops,占比达到
51、总算力的50%以上,算力网络节点间单向网络时延控制在1毫秒以内。鼓励基础电信企业跨地区提供智算服务,推动智算芯片全面兼容国产训练框架,推动大模型多维并行训练优化、模型快速适配、模型异构推理部署等技术和工具研发,推动打造智能算力与工业、城市治理、教育科研等应用场景的创新融合。2023年10月上海市推动人工智能大模型创新发展若干措施(2023-2025年)上海市经济和信息化委员会、上海市发展和改革委员会、上海市科学技术委员会、上海网信办、上海市财政局支持引进高水平创新企业,支持本市创新主体打造具有国际竞争力的大模型,鼓励形成数据飞轮,加速模型迭代。应用层面,重点支持在智能制造、生物医药、集成电路、
52、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景,打造标杆性大模型产品和服务。深圳深圳2024年9月深圳市前海深港现代服务业合作区管理局关于支持人工智能高质量发展高水平应用的若干措施深圳市前海深港现代服务业合作区管理局鼓励企业建设智能算力中心和智能算力调度平台,支持企业基于国产人工智能软件底座打造共性技术服务平台,鼓励开展人工智能语音识别、图像识别、自然语言理解等领域通用关键技术开发。围绕制造、金融、物流、商务等重点领域支持“大模型+产业”应用创新。2024年7月深圳市加快打造人工智能先锋城市行动方案深圳市工业和信息化局鼓励开展大模型架构、大模型超级智能、超
53、级对齐等技术创新,打造全链路自研大模型技术体系。研发多模态具身智能大模型,开发具身智能机器人“大脑”,推动具身智能大模型与机器人本体深度结合,鼓励打造具有商业价值的整机产品。在数字政府、教育、医疗、气象、智慧城市、环卫、科研、制造、金融、低空经济、智能网联汽车、现代时尚、游戏动漫、文旅、网络安全等领域,鼓励企业联合研发行业大模型。2023年5月深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)中共深圳市委、深圳市人民政府聚焦通用大模型、智能算力芯片、智能传感器、智能机器人、智能网联汽车等领域,重点支持打造基于国内外芯片和算法的开源通用大模型;支持重点企业持续研发和迭代商
54、用通用大模型;开展通用型具身智能机器人的研发和应用。18资料来源:至顶智库结合公开资料整理绘制。2024.11 ZD Insights 1.10 全球科技巨头在AIGC领域的投资情况OpenAI等全球知名AI独角兽成长过程中,离不开投资者源源不断的资金支持。生成式AI发展过程中,需要大量投入算力和财力,大模型训练完成后投资回报周期较长,使得初创企业难以独自承担相关成本,全球最有竞争力的企业才能获得资本市场的认可拿到融资。国外投资企业主要包括微软微软、亚马逊亚马逊、谷歌谷歌等互联网巨头,也有像英伟达英伟达在AI浪潮中成长起来的新巨擘。国内投资企业主要有阿里巴巴阿里巴巴、腾讯腾讯、小米小米等平台型
55、企业。相关融资企业以基础模型公司为主,如OpenAI、Anthropic、智谱、百川智能、零一万物等。全球科技巨头在全球科技巨头在AIGCAIGC领域投资情况领域投资情况中国科技巨头在中国科技巨头在AIGCAIGC领域投资情况领域投资情况资料来源:至顶智库结合公开资料整理绘制。19企业名称企业名称所在地所在地主要业务主要业务最新估值最新估值融资情况融资情况OpenAI美国旧金山成立于2015年,是一家专注于开发通用人工智能模型的全球领军企业,已推出ChatGPT、GPT-4o、DALL-E、Sora等多种重磅模型及应用。1570亿美元 20242024-10 10 战略投资战略投资 数十亿美元
56、数十亿美元 投资方:Thrive Capital、Microsoft、NVIDIA、SoftBank、Khosla Ventures、Altimeter Capital、Futurum Capital、Tiger Global ManagementxAI美国旧金山成 立 于 2023 年,由 Tesla 和SpaceX的CEO Elon Musk领导,致力于开发人工智能以加速人类的科学探索,已推出第二代AI模型Grok-2。400亿美元 20242024-05 B05 B轮轮 数十亿美元数十亿美元 投资方:Andreessen Horowitz,Sequoia Capital,Fidelity
57、,E1 Ventures,Legendary VenturesAnthropic美国旧金山成立于2021年,由前OpenAI研究副总裁Dario Amodei及相关前OpenAI员工联合创立,专注于开发通用AI模型,已推出三代Claude系列AI模型。184亿美元 20242024-03 03 战略投资战略投资 27.527.5亿美元亿美元 投资方:AmazonMistral AI法国巴黎成 立 于 2023 年,由 前DeepMind和Meta研究人员组建的致力于构建通用人工智能(AGI)模型的初创公司。推出Mistral 7B、Mistral Large等模型。60亿美元 20242024
58、-06 B06 B轮轮 6 6亿欧元亿欧元 投资方:General Catalyst Partners、Andreessen Horowitz-a16z、Lightspeed Venture Partners、Bpifrance、BNP Paribas、NVIDIA、Cisco、Samsung Ventures、Salesforce、ServiceNow、IBM、DST GlobalCohere加拿大多伦多成立于2019年,联合创始人包括Transformer论文共同作者Aiden Gomez。主要面向企业推出大模型服务,帮助企业端用户总结文档、编写网站文案等任务。55亿美元 20242024
59、-07 D07 D轮轮 5 5亿美元亿美元 投资方:PSP Investments(领投)、Cisco、NVIDIA、AMD、EDC信息截至2024年11月 资料来源:crunchbase,至顶智库结合公开资料整理绘制。1.11 全球AIGC独角兽企业融资情况 2024.11 ZD Insights 15701570亿美元亿美元 184184亿美元亿美元 6060亿美元亿美元 5555亿美元亿美元 Cohere加拿大多伦多加拿大多伦多20242024年全球年全球AIGCAIGC独角兽企业估值及分布情况独角兽企业估值及分布情况OpenAI美国旧金山美国旧金山Anthropic美国旧金山美国旧金山
60、Mistral AI法国巴黎法国巴黎400400亿美元亿美元 xAI美国旧金山美国旧金山20企业名称企业名称所在地所在地企业介绍企业介绍估值估值融资情况融资情况智谱智谱北京-海淀研发千亿级超大规模预训练模型GLM-130B,并推出对话模型ChatGLM。打造AIGC模型及产品矩阵,包括AI提效助手智谱清言、代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。30亿美元 20242024-09 D09 D轮轮 数十亿人民币数十亿人民币 投资方:中关村科学城(领投)、红杉中国、高瓴投资、君联资本20242024-05 C05 C轮轮 4 4亿美元亿美元 投资方:Pro
61、sperity7 Ventures(沙特阿美旗下基金)20242024-03 03 战略投资战略投资 数亿人民币数亿人民币 投资方:北京人工智能产业基金月之暗面月之暗面北京-海淀推出全球首个支持输入20万汉字的智能助手产品Kimi。创始团队核心成员参与Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发。30亿美元 20242024-05 B05 B轮轮 数亿美元数亿美元 投资方:腾讯投资、高榕资本、源码资本、五源资本、云九资本20242024-02 A02 A轮轮 1010亿美元亿美元 投资方:阿里巴巴(领投)、蚂蚁集团(领投)、红杉中国、小红书、美团、Mo
62、nolith Management砺思资本、九安医疗、蓝驰创投、襄禾资本、宿华百川智能百川智能北京-海淀由前搜狗公司CEO王小川创立,公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI 顶 尖 人 才 组 成。目 前 已 推 出Baichuan4模型及百小应AI助手。200亿人民币 20242024-07 A+07 A+轮轮 5050亿人民币亿人民币投资方:顺禧基金、临港科创、深创投、阿里巴巴、腾讯投资、小米集团、中金资本好未来、卓源亚洲、顺为资本、红点中国、慕华科创、三七互娱、中贝通信、信雅达MiniMax上海徐汇MiniMax自主研发不同模态的通用大模型,包括万亿参数
63、MoE文本大模型、语音大模型以及图像大模型。基于不同模态的通用大模型,MiniMax 推出生产力工具海螺AI等原生应用。25亿美元 20242024-03 03 战略投资战略投资 6 6亿美元亿美元投资方:阿里巴巴(领投)、红杉中国、高瓴创投、经纬创投零一万物零一万物北京-海淀李开复带队孵化的AI 2.0公司,2023年11月,零一万物发布首个模型Yi-34B,2024年5月,零一万物推出一站式 AI 工作平台万知,也同时发布全球SOTA千亿参数闭源大模型Yi-Large。10亿美元 20242024-08 A08 A轮轮 数亿美元数亿美元 信息截至2024年11月,资料来源:IT桔子,至顶智
64、库结合公开资料整理绘制。2024.11 ZD Insights 20242024年中国年中国AIGCAIGC独角兽企业估值及分布情况独角兽企业估值及分布情况1.12 中国AIGC独角兽企业融资情况北京海淀区 4家上海徐汇区 1家估值30亿美元估值30亿美元估值200亿人民币估值10亿美元估值25亿美元21基础设施篇AI算力AI服务器MaaS平台22 2024.11 ZD Insights 2.1 算力基础设施为AIGC发展提供底层支撑资料来源:至顶智库结合公开资料整理绘制。AIAI芯芯片片高性能计算集群成为大模型发展及AI应用落地的重要算力支撑。目前NVIDIA、Google、百度、阿里、腾讯
65、等国内外科技巨头均推出芯片或高性能计算集群。从我国算力发展情况来看,IDC数据显示,2026年中国智能算力规模将达到1271.4EFLOPS。至顶智库统计,我国目前已投入运营和在建的人工智能计算中心达到50余个,分布在北京、上海、南京、杭州、成都等多个城市。资料来源:至顶智库结合公开资料整理绘制。中国智能算力规模中国智能算力规模(2020(2020-2026)2026)75155.2268427640.7922.81271.42020202120222023202420252026百亿亿次浮点运算/秒(EFLOPS)中国人工智能计算中心分布中国人工智能计算中心分布数据来源:IDCDGX Sup
66、erPOD新一代高性能计算集群HCC高性能计算集群EHC灵骏智算集群人工智能超级计算集群Atlas 900 AI集群AIGCAIGC底层算力架构底层算力架构昆仑芯2代TPU V4Tensor Core GPUHUAWEI Ascend 910AIAI计计算算集集群群232.2 AI大模型训练环节所消耗的算力规模持续增加信息来源:EPOCH AI,至顶智库结合公开资料整理绘制。单位:FLOPs近年来,AI大模型预训练的算力消耗呈爆炸性增长。EPOCH AI将全球主流大模型训练所用到的算力消耗情况进行统计,具体如下图所示。2023年底发布Gemini 1.0 Ultra训练所需的计算量约为Tran
67、sformer的673万倍。其中,Gemini 1.0 Ultra 使用5.5万块Google TPUv4芯片进行模型训练,Llama3.1 405B 使用NVIDIA H100进行模型训练,相关算力消耗和成本支出可观。2024.11 ZD Insights 2017年2018年2019年2020年2021年2022年2023年2024年1e241e181e191e201e211e221e231e251e26TransformerGPT-1BERT-LargeGPT-2(1.5B)RoBERTa LargeT5-11BGPT-3 175BGShardmT5-XXLLaMDAPaLM(540B)
68、OPT-175BLlama 3.1 405BImagenWhisperU-PaLM(540B)GPT-4PanGu-PaLM 2Llama2-70BLlama2-7BLlama3-70BGemini 1.0 UltraLlama-65BERNIE 3.0 TitanERNIE 3.0DALL-E全球全球AIAI主流模型训练消耗算力及训练用芯片主流模型训练消耗算力及训练用芯片16000 块 NVIDIA H100 SXM555000 块 Google TPU v416000 块 NVIDIA H100 SXM51000 块 NVIDIA A100 SXM4 512 块 Huawei Ascend
69、 9102048 块 NVIDIA A100 SXM525000 块 NVIDIA A100 SXM4256 块 Google TPU v4256 块 NVIDIA Tesla V1006144 块 Google TPU v41024 块 Google TPU v38 块 NVIDIA Quadro P600512 块 Google TPU v38块 NVIDIA P1001024 块 NVIDIA Tesla V10064 块 Google TPU v224戴尔科技集团(DELL Technologies)拥有从桌面、数据中心到云端的AI解决方案,涵盖适用于AI场景的服务器、PC和工作站、存
70、储、网络产品、数据管理和APEX订阅服务。当前,人工智能正成为推动各行各业创新的核心力量,基础架构作为AI解决方案的底座,可为企业提供多元算力、数据存储和网络配置等创新必需的要素,确保模型训练和推理过程的高效率和高可靠性。作为AI时代的领航者,戴尔科技致力于成为企业创新的催化剂,以卓越的技术实力和前沿创新帮助各行各业构筑强大的数字生产力,全力支持企业的AI转型之旅。2.3 戴尔科技集团在人工智能领域全面布局信息来源:戴尔科技集团官网,至顶智库整理绘制。2024.11 ZD Insights 服务生态系统基础架构适用于AI的服务器适用于AI的PC和工作站面向AI的存储适用于AI的网络产品面向AI
71、的数据管理适用于AI的APEX订阅服务数据应用场景Dell AI Factory25戴尔科技集团提供现代化数据基础架构产品组合。PowerEdge XE9680专为人工智能、机器学习和深度学习场景打造;AI PC产品组合涵盖Precision系列工作站以及Latitude系列AI PC。Precision系列工作站搭建实时交互、广告营销、教育教学等应用场景,赋能企业发挥更大的AI开发创造力;Latitude系列AI PC提供专业创作者的AI智能助理,提升工作效率,获得高质量创意成果。2.3 戴尔科技集团高性能AI服务器及AI PC系列产品 2024.11 ZD Insights PowerEd
72、ge XE9680PowerEdge XE9680高性能高性能AIAI服务器服务器LatitudeLatitude系列系列AI PCAI PCPrecisionPrecision系列工作站系列工作站全新Latitude系列AI PC集成Windows StudioEffects、Dell Optimizer等领先AI功能,实现AI多能协作。此外,Latitude PC还为用户提供PC复杂控制、本地知识库、长文档解读、闲聊陪伴、用机问答等功能,助力专业创作者事半功倍,收获高质量创意成果的AI高效智能助理。Precision塔式工作站搭载NVIDIA专业级显卡,算力高达1000TOPs,通过AI部