ChatGPT发布之后,AGI(通用人工智能)成为热门词汇,一个越来越多人相信的梦想是,未来每个人都可以有一个法律助手、个人医生、金融投资顾问——AI式的。
在美国多州律师资格考试中的初步测试中,GPT-4的准确率超过70%。而摩根大通研究团队的研究表明,GPT-4在给予少量提示的前提下能够通过特许金融分析师考试(CFA)的一级和二级考试。CFA是金融专业人士基准资格考试,2023年8月,人类考生在CFA一级考试中的平均通过率只有37%……这些表现让更多人坚定了「拥有一个AI专家库」的梦想并不遥远。
但到底还有多远?

我们采访了把生成式AI用于法律、教育、金融投资、医疗领域的创业者,他们正在构建的产品、取得的成效,以及踩过的坑,可以为梦想与现实的距离给出更精确的度量。
以下为该系列的第一篇,我们采访了幂律智能创始人兼CEO涂存超,他2009年进入清华大学计算机系就读,2018年获得清华大学的博士学位,主要研究领域是人工智能和自然语言处理。博士毕业前一年,他和几位校友共同创立了幂律智能。

不少大模型公司都推出——或者其agent市场内出现了面向普通用户的「法律助手」。比如基于通义、面向法律领域的垂直大模型——法睿,通义在其App内提供聊天式的法律助手服务,除了回答用户法律疑问、提供相应的法律依据和相关判案,这个法律助手还能根据案情描述,自动生成相应的法律文书。此外,同样基于法睿大模型,钉钉还试图「训练」一个叫「法外狂徒张三」的agent,模仿法律名师罗翔的问答风格提供法律问答服务。
秘塔提供面向个人的类案分析功能。
闵可锐创立的秘塔科技旗下的秘塔也提供面向专业个人用户的类案分析功能:输入法律问题,就能检索到公开案例库中的相似判例和相应的法律法规。该服务有免费、个人付费和团队付费3种选择,看上去像是法律人的个人助手。
不过在这些个人律师助手之外,更受资本市场推崇的是面向B端市场而非C端个人用户提供服务的产品。涂存超的幂律智能就属于这一类。
目前,幂律智能已推出两款产品,一款是用于合同审查的「智能审查」工具,另一款是用于合同整个生命周期管理的管理类系统。两款产品都面向企业客户。涂存超说,目前市面上基本都是这类面向B端用户提供合同起草、审查和生命周期管理服务的产品,因为标准化程度够高,而且需求和支付能力稳定。
2022年11月,幂律智能对标的Harvey AI获得了OpenAI创业基金领投的500万美元融资,被认为是OpenAI生态的一员。幂律智能也在2023年3月获得了智谱AI的投资,成为智谱AI生态的一员。
涂存超认为,像法律、医疗这样数据壁垒和知识壁垒都足够高的领域,通用模型短时间内还很难吃掉,这让他对公司生意拥有一定的安全感。
创业者和资本市场的选择可能会让「拥有一个AI法律专家」的梦想比想象中更远了一点。
以下是「新皮层」与涂存超的对话。
幂律智能创始人兼CEO涂存超。
标准化程度高的领域更适合AI,比如合同管理 新皮层:幂律智能2017年成立,当时为什么考虑选择法律行业去创业? 涂存超:最初我也不是学法律的,当时还调研了金融、教育、医疗等方向,但很多大厂做应用基本都在这些领域,作为一个早期创业团队,我们没有特别多资源。后来我们了解到, 在法律场景里,基本上所有任务都满足「文字输入、文字输出」范式。它与自然语言处理技术,还有大模型技术都高度匹配,这是我当时选择法律场景创业的一个重要原因。 而且当时国内还没有什么真正有AI背景,或者说NLP(Natural Language Processing,自然语言处理)背景的团队做这个领域,我们比较有先发优势。 新皮层:当时有记忆深刻的海外竞品吗? 涂存超:2017年左右,国外已经出现了一批想通过NLP技术做法律科技产品的公司。比如以色列的LawGeex,它用NLP技术审核NDA(Non Disclosure Agreement)保密协议,几十秒时间能审上百份。当时整个法律科技的环境在国外比较火,美国法律服务行业的市场空间,跟国内相比差距蛮大的。 新皮层:幂律智能去年推出了PowerLawGLM大模型,使用了智谱AI的基础模型做微调。训练法律模型时,哪些任务是智谱AI主要做的,哪些是幂律智能重点做的? 涂存超:我们跟智谱的合作是基于它内部没开源的千亿参数版本。 第一步是基座模型的增量训练,这一步智谱提供计算资源、训练资源。法律数据由我们准备,双方共同制定训练策略。下一步由幂律智能做SFT(Supervised Fine-tuning,有监督微调)。做完微调,垂直大模型在法律场景的一些任务上已具备端到端的生成能力,但离最终应用差距还比较远,在此基础上,应用层的工作完全是幂律智能在做。 新皮层:你们在应用层做了哪些工作? 涂存超:法律场景很多任务的逻辑不是端到端的生成逻辑。比如法律咨询,大家天然会认为是一个适合大模型直接生成回答的任务,但实际上大模型生成的方式非常不靠谱。比如问一个端到端生成的大模型,在中国法定结婚年龄是多少?回答16周岁、18周岁、20周岁都有可能。 想回答准确,必须援引法条。先找问题跟哪些法律法条相关,把法条跟问题做综合,才能得到一个靠谱答案。找法条并且根据法条内容来得出结论的过程,就是应用层的工作。 再比如起草法律合同,如果使用GPT-4,看上去它能准确理解意图并输出,但实际上每个条款都很不专业。生成一两页的合同可能还好,生成几十页上百页的合同基本不可能。法律人写合同,为了保证合同高度专业,一定是基于高质量的模板起草。在这个场景,我们使用大模型不是利用它的生成能力,而是利用语义理解能力,通过对话方式描述需求。起草一份什么类型的合同,背后在应用层通过匹配高质量模板,把大模型理解的关键信息填到模板里,再让大模型润色,这种方式更匹配法律人解决任务的逻辑。 新皮层:幂律智能在应用层推出了哪些产品?产品形态如何? 涂存超:一个是智能合同审查产品,提供搭载大模型的合同审查解决方案,自动分析文本并提示风险点。还有一款合同全周期管理的产品,从管理合同范本与条款,到内部起草合同、磋商评审,到最后签署、履约、归档,是一个完整的解决方案。 我们的产品支持通过chat的方式交互。 幂律智能推出的合同审查产品。 幂律智能推出的合同生命周期管理产品。 新皮层:你的产品都跟合同管理相关? 涂存超:我们之前的主要业务就是做「智能合同」这个产品,训练大模型也是以合同文本相关的分析展开的。面向中小企业提供的服务会更广,包含日常法律咨询、法律文书起草、审查等等,合同是很大一块需求,但不是全部,也包括劳动用工、知识产权、股权等多种场景。 新皮层:法律的细分需求