查看原文
其他

王者法宝!AI荣耀!北大法宝GPT系列产品倒计时

北大法宝 北大法宝 2023-07-07

日异月殊,时移世易

——法律人工智能新浪潮



从ChatGPT亮相以来,各家大模型技术如雨后春笋,纷纷亮相。从百度文心一言、到阿里巴巴通义千问、再到科大讯飞的讯飞星火等等,各家大模型开始逐渐展示自己的产品能力。


所谓大模型,是指在海量文本数据上训练,通过无监督学习方式掌握通用的语言知识和能力的深度神经网络模型。最近风靡全球的ChatGPT背后就是GPT模型,属于大语言模型的一种。GPT的全称是“Generative pre-trained transformer”,是指“基于Transformer的生成式预训练模型”。
生成式模型最早可追溯至20世纪50年代的马尔可夫模型和高斯混合模型等早期模型,用于生成语音、文字等序列数据。事实上,在深度学习与自然语言处理(NLP)技术结合后,生成式模型才得到了显著的性能提升。在早期的深度生成模型中,不同领域通常没有太多重叠。在自然语言处理中,传统的句子生成方法采用N-gram语言模型,其难以处理较长的句子。后来,为解决这个问题,循环神经网络(RNN)被引入进行语言建模任务。RNN可以对相对较长的依赖关系进行建模,并允许生成更长的句子。后来还开发了长短时记忆网络(LSTM)和门控循环单元(GRU),它们使用门限机制,显著缓解了RNN中的梯度消失问题,与 N-gram 语言建模相比,具有显着的改进。直到2017年,Transformer框架引入,其不仅为NLP带来融合,还在许多跨领域的生成模型中占据主导地位。在自然语言处理中,BERT和GPT等大型语言模型均采用了Transformer架构。
在法律人工智能领域,早在1958年,法国人卢西恩·梅尔(Lucien Mehl)就提出要将人工智能技术应用于法律信息归类、检索和法律咨询。在1981年,美国兰德公司开始了人工智能的尝试,其开发的法律判决辅助系统LDS,基于案例推理,能对民事审判的某个方面进行检测或预测,也可计算出责任案件的赔偿价值。在此之后,ROSS Intelligence公司将IBM的人工智能技术应用于法律,开发了世界第一个在法律领域利用自然语言处理技术的法律平台是名为“ROSS”的AI助手,其能迅速、高效搜索海量判例法,帮助法律团队找到与手头案件相关的内容。Legal Robot则运用区块链和人工智能技术,提供智能合同审核和咨询服务。Baker & Hostetler则生产了一款名为“Rossier”的AI系统,可以协助进行诉讼和调查工作。现在生成式AI能力的大幅跃进,法律人工智能领域的新突破更让人拭目以待。


摩厉以须,厉兵秣马

——法宝智能领域早布局



所言,生成式AI技术变革时代已然来临,法律领域也不例外。这场变革中,是被消极淘汰,还是逐浪而上,是包括法宝在内的每个“法律人”必须经受的考验与选择。幸运的是,在这场变革中,法宝创始人赵晓海早已带领北大法宝在法律智能领域谋划布局:从智能理念的深化,到智能团队的建设,再到智能技术的应用与智能产品的挖掘,最后到智能生态的布局,北大法宝早已躬身入局。

01

智能理念早深化

作为一家法律科技公司,北大法宝以“爱法律有未来”作为自己的slogan,希望能为法律人提供更美好的工作体验。去年开始,北大法宝的slogan变更为“让法律更智能”,现在大幅跃进的生成式AI技术已经来临,为法宝智能理念的落地提供更好的支撑。


02

智能团队早建设

在ChatGPT上线以后,每个法律人都相信其在法律智能领域将会有所作为,但模型易得,团队难寻。即使想清楚产品需求,也难求优质的产品、技术团队落地实现。北大法宝的优势之一在于,早在几年前,公司就对人工智能技术进行了前瞻性布局,在公司规模成型的法律科技中心基础上,成立了人工智能研究院,以重点进行精尖法律+技术赋能产品与业务的研发。


03

智能技术早应用

近年来,北大法宝和北大法学院等几家单位联合发起成立了北京大学法律人工智能实验室和北京大学法律与人工智能研究中心,积极开展产学研用合作,并主要承担科研成果转化和市场化运营。
同时,北大法宝还协同北京大学王选计算机研究所、北京大学计算机学院、中科院自动化所等单位积极参与申报和承接了科技部、最高检等多个国家级重点课题项目,在“面向金融犯罪的知识服务与资金电子数据证据审查关键技术课题研究”,“立法公众意见综合分析与法律条文智能审查技术课题研究”,“跨领域知识驱动的法治调研智能感知及辅助决策技术课题研究”等课题项目中,重点基于NLP(自然语言处理)、知识图谱等进行法律人工智能技术攻关,全面提升公司在立法、执法、司法等领域人工智能技术的研发应用,为法宝业务复用提供了技术算法模型与核心驱动内核,在行业中构筑智能技术能力与影响力护城河。


04

智能产品早预备

2022年,北大法宝在知识工程的战略业务基础上,紧跟大数据、人工智能、机器学习等先进技术,着重加强行业化、场景化、智能化应用产品研发及迭代优化。2022年度,公司研发技术成果达50余项,新增了知识图谱、标签训练、风险透镜、智能期刊、智能问答等知识计算智能应用成果,并已充分应用到知识工程和智慧立法、智慧法务等主要业务条线上。


05

智能生态早布局

同时,北大法宝也从法律智能生态圈的层面上,着手从战略合作层面积极推动法律智能生态体系的构建与发展。
北大法宝早在2019年就在阿里云进行云上布置,成为在法律界第一个“吃上云螃蟹”的人。除将全业务迁移到阿里云外,北大法宝与阿里云在人工智能、大数据等方面均存在深入合作。
2023年3月,北大英华作为百度文心一言的首批生态合作伙伴,拟联合百度打造法律领域AI大模型,以百度智能云为路径,实现法律人工智能新生态构建。
不久前,北大法宝也与某领先的云计算服务商达成合作,基于GPT系列大模型进一步快速提升公司高价值应用产品的智能化发展,实现更智能的新一代产品的研发和应用。


壹引其纲,万目皆张

——法律智能产品正当时


针对ChatGPT等大模型人工智能技术革新给各行各业带来的核心技术和商业模式的挑战和机会,北大法宝也在ChatGPT刚上线的时候,就深度进行法律科技行业发展的战略规划和法律产品智能场景挖掘的战略创新。
如今,在团队的共同努力下,北大法宝的法律AI系列产品已经初具雏形。
1.多场景应用:从单领域的法律工具到全领域的法律助理
基于大模型具备的生成自然语言文本的功能,北大法宝将在立法、执法、司法、法律教育等诸多领域,配合法宝目前多元的业务线,进行智能AI的多场景布局。以后,法宝将不仅提供单领域法律工具助用户完成工作,还将根据用户的身份,提供立法助手、律师助理、法官助理、检察官助理、企业法务助理等诸多助手帮用户快速且高质量地完美工作。
2.多元功能提供:从辅助检索、到辅助庭辩,再到文书生成智能能力一应俱全
法宝本次将初步上线三款产品,后续其他领域与功能的产品将陆续上线,敬请期待。本次上线的三款产品为:
模拟法庭:利用生成式AI的智能能力,模拟真实的法庭诉辩审判过程。可实现智能控辩、模拟判决、智能法律依据的提供以及智能文本的生成等诸多功能。
智能检索:在法宝数据库的内容基础上,结合AI大模型的能力,以简单的提问得到精准的答案。同时,可实现多模型对比,帮助用户获得答案的最优解。
法宝来签:法宝来签平台在传统合同辅助管理基础上,引入AI大模型技术,可实现合同文本的智能生成、合同起草的智能咨询以及大模型智能审查,这些智能功能显著增强了合同管理效能,让用户更高效地处理合同事务。
3.致命缺陷补足:专业法律数据减少大语言模型的“胡说八道”
GPT-4等大语言模型法律知识库不完整,在知识储备空白的情况下,会出现胡说八道的情况。在北大法宝专业权威的法律内容的补足下,北大法宝的智能AI系列产品,将最大限度地减少内容的错误问题。
4.强势提问辅助:法宝法律Prompt工程建设
Prompt工程也叫提示词工程。对于同一个大模型,给予不同的提示词(Prompt),会触发大模型生成不同的内容。Prompt可以简单地理解为用户输入给大模型的问题。而Prompt工程本质上是一种通过优化提示词来改进模型生成结果质量的方法。为了让法宝的法律智能系列产品,更好地回答、解决用户的问题,北大法宝持续进行Prompt工程建设,并将其内化于产品。



扫榻以待,竭诚欢迎

——法宝智能新体验



“让法律更智能”是北大法宝的荣耀使命,使命背后离不开法律生态、法律行业、法律公司和法律人的深度参与,共同探索,如果您对我们的产品有兴趣,我们真诚地邀请您来体验。欢迎填写下方二维码,留下您的信息,第一时间“尝鲜”法宝智能系列产品!




-END-


责任编辑 | 金梦洋

审核人员 | 张文硕

本文声明丨本文章仅为交流之目的,不代表北大法宝的法律意见或对相关法规/案件/事件等的解读。 
往期精彩回顾
北大法宝怎么“让法律更智能”?
对话ChatGPT,人工智能如何能成为论文作者?
ChatGPT的创新与挑战
谢澍:ChatGPT到来,监督管理与技术研发应当如何互动?
法宝重磅 | ChatGPT来了,法宝人工智能研究院告诉你真相
北大法宝宣布联合百度文心一言 打造法律人工智能新生态
OpenAI独家回应|ChatGPT为何不向所有中国用户开放注册?
什么都懂的ChatGPT如何看待爱情?
ChatGPT来袭,法律人真的要失业了吗?
专访ChatGPT:2023涉外律师高度关注的十个问题,我给出了高质量回答
高绍林:ChatGPT法律智能化应用及其规制
会议综述丨“ChatGPT对法律人工智能研发和立法的影响”研讨会成功举行

点击下方公众号名片

获取更多信息

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存