• 💡 法国数学教育深厚,培养了众多数学天才,为AI创业提供了优质人才

  • 🌟 法国拥有顶尖的数学研究历史和学术机构,为AI技术的发展提供了坚实基础

  • 💰 法国AI公司如Mistral和Hugging Face在大模型和模型平台领域取得重要进展,为法国AI生态注入活力

  真理总是掌握在少数人手里。而且,历史也是由少数人书写的。AGI大模型创业也是如此。

  只要卡够钱够,卷人数好像用处不太大:Mistral~20人团队照样完爆无数大厂。

  归根结底,是因为大多数AI公司都不拥有底层技术:拿到的开源模型也只是黑箱,自己并不知道怎么能真正做得更好,只能在现有模型上随机调优原地打转……

  我们越来越发现:AGI大模型的底层技术,只掌握在少数天才的手里。而且,天才的重要性要大于人数和组织能力。

  大模型公司中研究的领军人物通常都拥有计算机/数学/物理博士学位,且深耕学术研究多年。而且我们都知道,计算机/物理/经济学……一切需要计算的学科中,最牛的人往往是数学最好的。比如前OpenAI灵魂人物Ilya Sutskever在本科阶段主修数学,Anthropic的CEO Dario Amodei从本科到博士都主修物理(数学也很重要)……

  国人对法国的概念主要停留在艺术文化和奢饰品,但了解过Concours(法国高考)的朋友都知道,法国社会对于数学的重视程度一点不亚于海淀;数学和哲学作为Concours必考题目,才是这个国家精英眼中真正的明珠。教育基础也孕育了社会文化:除了吐槽法国政府之外,哲学-数学-历史-文学-艺术都是巴黎酒吧咖啡馆的重要下酒菜;而且,这类问题也是法国各类商业-政治沙龙的无形门槛。

  回到法国数学教育本身:重理论轻计算——基本都是证明题。以个人为参照,本来以为北大物理系的数学应该不算太差,但到了法国一样被虐得很惨。才发觉,原来我本科学的叫“算术”,不叫“数学”……所以说,海淀可以量产“做题家”,但真正的“数学家”却出在法国。

  但不得不说,数学天才们在法国挣得太少了。所以我们看到无数法国数学牛人去美国做算法/数据/IT,也知道很多在伦敦的量化交易公司的官方语言是法语……这些人的回流,正是当下法国AI生态的主力。

  法国的数学研究历史底蕴深厚。中学数学到高等数学的课本中反复出现,虐我千百遍的名字原来那么多法国人!

  从解析几何创始人笛卡尔(Descarte),到“数论先锋”费马(Fermat),从在微积分、复变函数和微分方程中大量冠名的柯西(Cauchy),到随处可见的傅里叶(Fourier)级数和傅里叶变换,乃至21岁决斗而亡的“群论之父”天才伽罗华(Galois),以及“最后一位数学全才”庞加莱(Poincaré),力学、天文学中有大量存在感的拉普拉斯(Laplace)、拉格朗日(Lagrange)……

  17到19世纪的数学可谓群星闪耀,这与这一阶段法国统治者们(路易十四1654-1715在位,路易十五1715-1774在位,拿破仑1804-1815在位)热爱数学(都有专职数学老师)、大力投资数学、并从全欧洲挖角数学人才是密不可分的。

  20世纪以来,法国数学仍是世界一流。素有数学界“诺贝尔奖”之称的菲尔茨奖,每四年一次,仅颁发给2至4名未满40岁作出突出贡献的数学家。而从1936年至今的69名获奖者中,法国(13人)几乎和美国(15名)并驾齐驱,并超过俄罗斯+苏联(9名)。要知道法国人口只有6700万,而美国有3.3亿。

  有如此多大师坐镇的法国,如今仍是数学学习和研究者的向往之地。巴黎-萨克雷大学(Université Paris-Saclay, 包含巴黎综合理工École Polytechnique)数次摘得数学专业世界排行榜第一,还有索邦大学(Sorbonne University, 包含巴黎六大),巴黎文理研究大学(Paris-PSL,包含巴黎高师ENS)、亨利-庞加莱研究所(Institut Henri Poincaré)等享誉世界的学校和研究机构。

  如今的AI领域,无论是学术界还是科技公司,都活跃着这些有扎实数学基础的法国人才,以下仅列出部分知名大佬:

  美国以外最引人注目的大模型创业公司之一,无疑是法国的Mistral AI。当前重要AI创业公司估值如下:

  从Mistral 7B(2023年9月27日)发布,到Llama3(2024年4月10日)发布之间6.5个月里,Mistral系列一直被认为是开源模型的首选。而且,与Llama系列相比,Mistral使用宽松的Apache License 2.0;而且实测下来MoE架构的推理性价比真的很香。让我们期待Mistral下一代开源模型的发布。

  Mistral的开局如其名“冬日北风”一样发展迅速。23年4月三个创始人才在巴黎的咖啡馆确定“法国人也要有自己的ChatGPT”的愿景,6月就锁定1.13亿美元的种子轮融资。3个月后,不到20人的小团队,仅使用几百张A100做训练,快速发布开源模型Mistral 7B。

  首先,欧洲有了顶级大模型。于是,欧洲手里多了一张牌,可以在站队压力可控时做出独立选择,保持一定的外交独立性。

  第二,Mistral的号召力盘活了法国的AI生态。围绕Mistral和HuggingFace,法国当前的AI创业生态非常繁荣,这样可以进一步聚集AI人才,也给投资人信心,走入良性循环。

  Github是代码的平台,HuggingFace(HF)是模型的平台,也是AI开源在全球扛大旗的。HF最大的想象空间,是成为“模型调用模型”的平台与规则制定者。于是,HF在23年5月发布Transformer Agent 1.0, 并在24年5月升级到2.0,做的就是这件事。官方宣称基于Llama3-70B-Instruct在GAIA Leaderboard测试中,比基于GPT4的Agent有更好表现。

  HuggingFace在2016年由三位法国人Clément Delangue, Julien Chaumond和 Thomas Wolf在巴黎创立。公司初始想法是“面向青少年的AI驱动的聊天机器人”,当时在法国难以获得风投,于是搬到纽约以获得第一轮融资。

  2019年,在Google发布BERT模型后,公司逐渐将聊天平台转化为开发者社区,并逐步形成了全网最大的自然语言处理开源模型数据库,获得Google、Amazon、Nvidia、Salesforce等多个巨头的战略投资。

  目前HuggingFace约180名员工中三分之二在欧洲,其中70人位于巴黎。

  HuggingFace的重要性在于,它本身就是生态。它正在成为一个创业工厂,从中已经产生了Adaptive ML(详情见下), Contextual和Arcee等AI初创公司。

  产品定位:开发“能动性”或“以行动为导向”的AI模型,这些模型能够推理、规划和协作解决问题,超越当前的语言模型;围绕行业的企业提供这些AI Agent,以推动生产力和人机协作。

  产品定位:帮助企业将大型语言模型(LLMs)适应于他们的特定用例,并根据用户互动不断改进模型。

  产品定位:用来自Notion、Slack、Google Drive等的内部数据,使用带有检索增强生成(RAG)的LLM来为公司客户构建一个内部AI助手平台;在OpenAI、Cohere和AI21等公司的现有LLM之上构建应用程序。

  产品定位:开发一个开源AI测试框架,作为“市场上最好的大语言模型杀毒软件”,来保护AI系统安全。

  产品定位:基于AI的图片编辑软件,让用户无需经过大量训练就能创造出令人印象深刻的图像;开发了自己的自定义基础模型“Photoroom ID”。

  产品定位:开发用于药物发现、临床试验优化和人工智能诊断的技术;主要产品MSIntuit CRC - 一款在欧盟获得批准的人工智能诊断工具,用于预先筛选结直肠癌患者的生物标志。

  除了最新的AI创业公司之外,更久一些法国人的科技创业故事是创立数据/SaaS/AI公司,获得美国风投,然后在美国上市。

  2023财年总收入为26.2亿美元,截至2024年1月,Snowflake在全球拥有7004名员工,并在福布斯全球2000强榜单中拥有691家世界最大上市公司的客户。

  2023年收入超过20亿美元,拥有超过5200名员工,为全球27300名客户提供服务。

  2023年营收约2.3亿美元,拥有约1400名员工和600多个全球客户。

  我觉得答案还是明确的:AI第一强国是美国,第二是中国。因为无论是从总AI论文数量还是研究者数量,中国都比法国要高出一个数量级。我们也看到假以时日,国产模型们也一步步逼近GPT4的水平。但问题是,我们的这些大脑是否用在了真正技术前进的方向,还是用在了完成内部KPI的雕花上?以及在这个天才创业的时代,个别天才是有可能改变历史命运的。

  人才瓶颈目前主要由东欧和北非在补,但如何培养出更多的AI人才正在给法国当前的教育体系提出巨大挑战。以及,法国的高级AI算法人才的工资明显低于美国和中国:这一方面对于创业公司是成本优势,但另一方面也造成了国家层面的人才外流。

  芯片相关的半导体工业的短板更加难补。目前芯片工业体系主要在美国和东亚,消费电子在中国更是有巨大优势。欧洲可能需要再造一个“空中客车计划”,才有可能在AI浪潮中立住根基。

  最后,欧洲作为AI第三极有着更多与中国合作的空间。法国-欧洲的AI发展有着众多痛点缺陷,如果我们有能力提供一部分价值,那么机遇也自然会向我们招手。