摘 要:大模型需要借助法律知识习得、法律事实建构、法律规范发现与法律论证推理能力完成法律任务。受内生技术逻辑决定,大模型的法律能力边界呈现出不均衡与非线性分布的样态。在法律知识习得维度,大模型长于显性、隐性与非具身默会知识的习得,却失于动态知识的习得;在法律事实建构维度,大模型长于描述性建构、弱于规范性建构;在法律规范发现维度,大模型长于规范解释、弱于规范识别与规范自洽、失于规范检索与规范续造;在法律论证推理维度,大模型长于内部证成而弱于外部证成。因此,应基于大模型的法律能力边界,划分法律任务的风险等级,形成明确的大模型适用指南,在此基础上建立兼具启发性、反思性与监督性的递进式法律领域人机协作框架,并从认知素养、运用素养与评估素养三个维度塑造法律职业群体的人机协作能力。 关键词:大模型;法律能力;法律职业素养;人机协作 引 言 随着生成式人工智能的飞速发展,大模型正在被日益运用于知识密集的法律领域。法学界围绕大模型赋能法治建设等议题已经形成了一定的前期成果,并在大模型的辅助定位与应用潜力等方面形成初步共识。上述研究为大模型在法律领域的运用提供了重要指引。然而,大模型的赋能作用无法凭空产生,它需要在与法律职业群体的日常互动中,通过协助完成法律任务来实现。理想状态下,大模型应当充分引入法律知识对案件事实进行抽象判断,并通过一系列逻辑推理得出最终结论。因此,在宏观的“总体定位”证成与中观的“场景潜力”讨论基础上,聚焦微观的“实际能力”研究,是驾驭大模型技术并使其安全、可靠地服务法治建设的关键。但法学界对于大模型在何种程度上能够胜任法律任务的议题关注较为有限。部分附带性研究认为大模型善于处理高度结构化、重复性和低创造性的简单法律任务(如法律规范检索等),而不善于处理需要逻辑推理、利益衡量、价值判断的复杂法律任务。上述“全有”或“全无”的观点没有充分结合大模型技术逻辑展开,过于简化了大模型在法律领域应用潜力的分析框架。事实上,不同的法律任务需要不同的法律能力支撑,比如三段论式的法律推理主要依托法律内部证成能力,而提取案卷信息则依赖法律事实建构能力。上述能力并非均质地随案件复杂程度而线性变化。实践中,法律职业群体对大模型的“法理想象”正以另类“莫拉维克悖论”(Moravec’s Paradox)呈现——大模型在部分法律职业群体认为它能胜任的领域表现差强人意,而在部分被认为不能胜任的领域却成效较著。如,大模型的原生能力难以有效完成法律规范检索,但却可以在法律逻辑演绎、隐性法律知识习得中表现出色。与之对应,学界围绕知识幻觉、推理逻辑等主题展开了关于大模型在法律领域应用的评估性研究。此类研究偏重技术,未能与法学理论形成深度对话。比如将知识幻觉区分为开放式与封闭式两类,固然有其价值,但却无助于为法律实践提供有效指引。正因为部分技术性评估并未充分使用法律职业群体熟悉的话语框架,法律职业群体难以有效地参与大模型的法律能力评估进而形成准确的应用预期。可见,学术界对于大模型在法律领域的应用潜力还缺乏整合法学理论与技术逻辑的统一分析框架。本文尝试在大模型“潜力”与“实效”的“中间地带”,提出“大模型的法律能力”理论,旨在通过融贯的法理逻辑与技理逻辑分析,系统回答在功能主义视角下,法律职业群体能够在何种程度上信任大模型这一关键问题。 一、大模型法律能力理论的提出 大模型的法律能力理论并非空中楼阁,而是与“法律职业能力”的理论资源一脉相承。法律业务的展开不仅需要对法律知识的记忆,还需要具备将知识整合为实践操作的能力。因此,对大模型法律能力理论的讨论,必须借助法律知识习得、法律事实建构、法律规范发现以及法律论证推理四大核心能力框架展开。 (一)大模型法律能力的理论基础 法学界对职业能力问题的讨论由来已久,讨论议题主要分布在律师能力、法律职业转型、法律职业素养、法学教育改革、法律人思维等领域。我国关于法律职业能力的系统研究可追溯到20世纪90年代的法律职业化运动期间,学者们认为法律职业能力需要长时间训练才能形成,以法律思维和法律方法为核心要素。在全球范围的相关研究中,有学者对法律职业能力作了基础能力与职业技能的二元区分,前者主要指向问题解决、法律分析与推理、法律研究等能力,后者则包括组织、管理、协作、创新、发展等技能。也有学者将法律职业能力区分为对法律理解、分析与推理的技术(technical)能力以及以服务为导向与客户和他人合作的关系建构和维护能力,并认为卓越的法律人需要有效整合技术能力与关系能力。还有学者主张从三个维度解读法律职业能力,包括对法律规范理解等知识维度,法律写作、口头表达、谈判、证据运用等技能维度,以及正直、责任感、执行等个人特质维度。可见,尽管学界对法律职业能力的综合性定位具有高度一致性,但对其内涵和外延的表述却存在一定差异。广义论者将法律职业能力视作是一种知识、技能和经验的综合体,认为它涵盖实体性、程序性、人际关系、职业伦理等方面的知识、技能与经验,从而使法律服务对象能够获得适当的法律服务。法律职业能力不仅包括独属于法律职业群体的能力,也包括很多其他职业必须具备的共性能力。狭义论者则聚焦法律职业本身,将法律职业能力视作一种涵盖法律知识记忆与运用的综合性、实践性能力,认为法律职业能力在本质上是基于深厚法律知识的专业技术,而非单纯的实用技巧。狭义的法律职业能力又可以进一步区分为法律认知能力和法律行动能力。前者意指了解(或发现)、阐明决定问题的法律标准,并根据标准确定和评估事实,以便作出合理判断,具备“像法律人一样思考”的能力;后者主要指向思考之后付诸行动的能力,包括但不限于组织证据、出庭辩护等,即“像法律人一样行动”的能力。从内容上看,职业能力测试主要聚焦狭义层面的法律能力。 本文提出“大模型法律能力理论”,旨在为分析大模型完成特定法律任务的能力提供体系性框架。在本文中,大模型的法律能力是指大模型从海量数据中习得法律知识,并在此基础上建构法律事实、发现法律规范以及进行法律论证推理的综合能力,其本质是对法律职业群体职业能力的一种参数化的呈现。大模型要成为法律职业群体的称职助手,就必须具备上述法律能力。需要特别指出的是,大模型的法律能力理论主要聚焦狭义法律职业能力的认知与分析维度,而非实践与行动维度。这一定位主要基于以下考量:其一,法律认知能力是法律职业能力最基础、最核心的能力。法律职业群体的行动能力,如出庭辩护、组织证据等,无法脱离知识习得、事实建构、规范发现、论证推理能力。法律职业群体借助认知和分析能力,可找到解决法律问题的方案,然后通过实践与行动能力落实方案。因此,认知与分析能力构成了法律能力的内核,是实践与行动能力的前提与基础。没有基础认知能力,就无法高质量完成任何法律任务。尽管语言运用、生成文本也属于能力范畴,但无法脱离事实建构、规范发现、论证推理能力而存在。以撰写法律文书为例,法律职业群体可以将文本作为媒介,提供法律建议、赢得辩护、分配风险,也能满足诉讼程序要求等。在此语境中,撰写文本的行动应被视为传递知识与专业能力的媒介,而非知识与能力本身。其二,法律人一般遵循IRAC的框架来决断法律任务,即确定问题(Issue)、发现规则(Rule)、用规则分析(Analyse)事实并得出结论(Conclusion)。上述能力覆盖了从知识获取、事实认定、规范适用再到结论推理的完整法律思维链,符合法律职业群体的职业实践特征。其三,大模型的法律能力主要聚焦知识获取与认知建构,依赖逻辑推理与参数化知识表征,而非人际互动与实践,它们共同构成了大模型在法律领域认知和判断的能力基础。这一界定避开了大模型需要与真实世界交互的能力(如谈判、沟通等)难以实现的问题。其四,上述范畴也符合认知层次理论从记忆(remembering)、理解(understanding)到分析(analyzing)、应用(applying)的层次化区分。一言以蔽之,大模型法律能力理论的提出旨在评估大模型可以在何种程度上完成功能主义维度的“像法律人一样思考”。 (二)大模型的法律知识习得能力 法律行业“拥有高度复杂的知识体系,只有经过漫长的教育才能获得”,“由于该知识的复杂性,对于将借助其帮助的外行来说,它在很大程度上是难以理解和无法测试的”。与法律职业群体围绕长期学习、经验积累与批判性反思习得法律知识不同,大模型的法律知识习得能力是指大模型在海量非结构化法律语料的预训练过程中,通过将法律概念、规则、原则等知识编码为神经网络参数,从而提取、整合、内化并复现法律知识的能力。因此,大模型的法律知识习得能力更大程度上是对非结构化法律数据的模式识别。上述能力使得大模型在功能上具备法律职业群体通过多年学习与实践积累的法律知识体系。 在认知科学领域,知识可以通过显性(explicit)、隐性(implicit)和默会(tacit)的方式在认知系统加以表征。其中,显性知识是指在认知系统中以公式、概念等元素明确表示的知识;隐性知识是指在认知系统中未直接呈现,但可以由显性知识在逻辑上推导出来的知识;默会知识则是指内建于认知系统之中,难以通过显性或隐性表征,但却影响认知结构或具体行为的知识。显性知识是隐性知识的基础,而默会知识是显性知识的基础。因此,显性法律知识是以显性编码的方式表征于法律规范、法律文书、法律文献等载体中的知识,如“宪法是国家的根本大法”;隐性法律知识是没有被明确表征,但却可以从显性知识中推导而来的知识,如在海量裁判文书中“隐含”的量刑规律;默会法律知识则是来源于法律职业者个人经验与直觉,难以被表达与分享,具有实践性、经验性与具身性的知识,如律师个人在庭审上询问证人的技巧。大模型在进行有效法律决策时,不仅需要习得显性与隐性知识,而且需要在识别默会知识方面取得重大突破。按照上述框架,大模型的法律知识习得能力可以进一步从显性、隐性和默会知识三个次级展开。此外,大模型还需要具备动态法律知识习得的能力。 (三)大模型的法律事实建构能力 法律实践起始于对法律事实的把握,但并非对日常事实的简单复刻,而须嵌入规范性的专业建构。因此,法律职业群体高度强调法律事实建构能力,即经过法律图式的转换,将生活事实重构为法律事实。从叙事学角度来看,这是一个将孤立事件整合成具有说服力、符合法律逻辑的法律叙事过程。尽管这个过程在外观上具有“描述”的特征,但本质上却是包含主体视角与价值判断的主动选择,是一种“建构”。不同法律人可能会从同样的原始事实中获得不同的法律事实,而法律事实建构的质量将直接决定法律实践的走向。如果说日常事实是“形式”,那么将日常事实与法律规范结合形成规范事实就“建构”了日常事实的“法律意义”。与法律职业群体通过规范学习与经验直觉建构法律事实不同,大模型的法律事实建构能力是指大模型在接收到结构化或者半结构化的案件信息时,运用强大的法律语言处理能力,自动提取、识别、归纳具有法律意义的关键要素,从而组织为逻辑连贯的法律事实的叙事能力。上述能力使得大模型可以模拟法律职业群体从纷繁复杂的信息中提取与法律构成要件相关的元素并重构为“案件事实”。当然,法律事实建构的实践并非一个单一、扁平的过程,而是多层次、动态的认知过程。它可以被区分为法律事实的描述性建构与规范性建构两个次级能力。描述性建构是从生活事实中筛选出潜在法律争议的要素(如关键的时间、地点、人物、事件、因果关系等),形成连贯、有序的叙事,是法律事实建构的基础层次;规范性建构则是将描述性建构获得的事实与法律概念、法律规范匹配、涵摄,从而形成法律事实。 (四)大模型的法律规范发现能力 法律规范发现能力是指在有效建构法律事实的基础之上,法律职业者从多层次法律规范体系中,精准定位、识别与法律事实最相关和最适配法律规范依据的综合能力。它既涉及法律条文的检索,也包括对判例、原则、习惯的识别。在面对复杂案件时,法律职业群体还必须通过多维度联想与校验来有效整合层次化的法律规范,从而为案件的解决寻找最为适配的规范基础。此外,作为法律认知能力的当然组成部分,法律解释贯穿于法律规范发现的全过程。这是因为法律规范的发现并非机械的检索与查询,还需要法律职业群体综合运用文义解释、体系解释、目的解释等多种方法,探索法律规范的真实意涵。此外,法律的稳定性虽然有助于为人们的社会行为建立稳定的预期,但却难以避免内容滞后于社会的发展和变化,此时就需要法律职业群体进行法律规范续造。概而言之,法律规范发现能力要求法律职业群体不仅应系统了解相关法律规范体系,而且应具备扎实的法学理论功底、法律解释能力以及高度的法律思维敏感性。作为对法律职业群体法律规范发现过程的模仿,大模型的法律规范发现能力是指大模型根据给定的案件事实或规范描述,通过法律知识的参数化记忆语义映射等机制,定位、关联并输出最适配的法律规范的能力。根据法律认知的复杂程度,我们可以将法律规范发现依次划分出五个相互关联和衔接的次级能力。(1)法律规范检索能力:精准查询和检索有关法律规范或指导案例。(2)法律规范的识别能力:准确地识别与当前法律事实相关的法律规范。(3)法律规范的自洽能力:当涉及多个可能适用且存在潜在冲突的法律规范,解决规范之间的冲突从而实现规范体系自洽。(4)法律规范的解释能力:在确定最适配法律规范的基础上进行文义、目的与体系解释。(5)法律规范的续造能力:在法律存在漏洞或空白时,基于法律背后的精神与价值取向,创造性地提出具有说服力的解决方案。 (五)大模型的法律论证推理能力 法律论证推理能力是法律职业群体将法律事实与法律规范联结,形成具有正当性、合法性与说服力的法律决定的能力,是法律职业的核心能力之一。它要求法律职业群体不仅能够进行三段论式的法律逻辑推理,还能够展开实质性的、考虑多重因素的衡量与论证。法律论证分为内部证成(internal justification)和外部证成(external justification)两个部分。从理论上看,法律推理并非简单的逻辑演绎,而是在事实、规范与价值之间进行解释与权衡的复杂过程,从而形成公众可以理解、可检验的论证以回应社会期待。按照上述框架,大模型的法律论证推理能力是指大模型基于法律事实和法律规范,通过参数化分析、语义理解和逻辑推理,生成符合法律逻辑的论证过程与法律结论的能力。它可以被进一步细分为法律内部证成和法律外部证成两个次级能力。上述能力对应法律职业群体的逻辑推理、法理说服和价值判断等能力。 二、大模型法律能力边界的具体表征 针对包括大模型在内的人工智能技术在法律领域的应用潜力,存在功能主义与实质主义的两大解释进路。前者关注技术在外观上呈现的功能,后者关注技术在本质上是否具备理解法律任务、进行复杂价值判断的能力。实质主义视角在分析大模型为何无法取代法律职业群体时具有强大的解释力。典型的观点认为大模型只能模拟人类的语言形态,而无法真正理解语义与语用。本文关注的重点是,在人机协同框架中,大模型的应用潜力及其边界,因此将从功能主义视角予以展开讨论。 (一)大模型法律知识习得能力的边界 法律知识是显性、隐性与默会知识的综合体。大模型的技术特征使其在显性、隐性与非具身默会法律知识层面表现出强大的学习和整合能力,具备法律职业者个体难以企及的法律知识总量,但在掌握具身性默会法律知识与动态法律知识层面面临困境。 1.长于显性法律知识的模块化识别 本质上,大模型习得的是参数化的法律知识——编码在大语言模型参数中的知识。参数化的知识源自训练文本中高频共现的词组和邻近位置。当某个词组出现的频率高于其他词组,这些词组相关神经网络连接就会被强化、储存于模型参数中。因此参数化的知识并非以显性事实或规则的形式编码,而是以权重形式表征在神经网络的连接关系中。随着参数持续提升,模型能够捕捉更多词语、短语乃至更广泛语言结构之间的多种关联。这些语词、短语和语言结构反过来反映了模型在训练数据中遇到的诸多事实或观点。因此参数化知识的本质是一种参数化的记忆。大模型获取的显性法律知识的本质是法律知识显性表征高频共现关系的一种参数化记忆。当然,大模型主要是在通用的语料库上进行预训练,法律语料所占比重较低,由此,在大模型中,法律知识相较于其他知识而言是一种低频的长尾知识。不过,这一问题可以通过法律领域的专门训练加以改善,因此并不影响大模型在技术逻辑上善于模块化识别显性法律知识的能力。 2.长于隐性法律知识的结构化识别 与一般认知不尽相同,大模型可以识别隐性法律知识。对此,大模型的注意力机制发挥了至关重要的作用。举例而言,有两份故意伤害的判决书,判决书A提及“被告人张三,初犯,具有自首情节,积极赔偿被害人损失,判处有期徒刑一年,缓刑两年”;判决书B提及“被告人李四,累犯,曾因盗窃罪被判处有期徒刑三年,且拒不认罪,判处有期徒刑五年”。在预训练过程中,大模型通过注意力机制对向量化后的判决书计算会发现“缓刑”与“自首”“积极赔偿”等词汇之间的相关性权重极高,“有期徒刑五年”则与“累犯”“拒不认罪”等词汇之间呈现高度相关性。随着大量故意伤害罪的判决书在预训练过程中被注意力机制向量化计算,词组的高频共现被升级为“概率”——模型不仅关注“缓刑”与“自首”之间高频共现的次数,且在输出“缓刑”的结论时,大概率会将“自首”作为伴随性依据一并呈现。因此大模型获取隐性法律知识的本质并非理解知识本身,而是通过数十亿、百亿次、千亿次的计算,将隐性知识的识别建立在极其复杂且高维的关系权重网络基础上。当然,与显性法律知识相比,隐性法律知识往往缺乏足够明确的标签,无法通过参数化学习被大模型完全捕捉。因此,大模型获取隐性法律知识的能力要弱于获取显性法律知识的能力。然而,这也只是相对的“弱势”。大模型获取隐性法律知识的能力仍强于法律职业个体获取隐性法律知识的能力。 3.长于默会法律知识的情境化识别 默会知识具有实践性、情境性和具身性等多重特征,无法完全被符号化表达。在前大模型时代,法律人工智能主要采用符号主义范式,将法律知识明确地、结构化地编码与储存,难以直接捕获默会知识。尽管大模型极大地提升了人工智能在知识获取方面的能力,但各界仍然形成了大模型“难以言说”默会法律知识的“前见”。原因在于,默会知识存在于高度分散的个体且做结构化处理的成本极高。庭审直觉、辩护技巧等往往隐藏在少量长尾案例或在法律领域训练语料的边缘语段,文本载体少且分布稀疏,共现次数不足,缺乏显著的统计信号,难以在传统法律语料的大规模预训练中被大模型捕获。然而,最新研究显示,大模型可以通过多模态感知与人机互动来捕获无法被语言模型直接学习的默会知识。一方面,默会法律知识能够通过访谈记录、讨论记录或非正式交流记录等载体固定并外显;另一方面,大模型可以通过对上述数据的预训练统计出低频或者隐含模式,从而实现对默会知识的识别。以律师庭审询问技巧为例,它包括了何时施压、如何设置陷阱、如何观察证人表情等内容,这些知识难以通过规则进行表述,但却可能通过庭审笔录、庭审视频等载体呈现。换言之,尽管默会法律知识往往并非以符号的形式表征,但只要其具备内建性的功能结构,就可以被还原为数值,进而被统计模型接近和捕获。在语料充足、适配且技术路径正确的前提下,大模型具有模拟默会法律知识的能力。这种能力同样会超过法律职业个体通过经验和直觉所能获取相关知识的能力。当然,上述大模型对知识的“捕获”,在本质上是以统计学的模式复现默会法律知识的外部表征,但却无法理解必须通过物理身体在真实世界中进行感知、互动和体验才能产生的“具身默会知识”。 4.失于动态法律知识的习得 众所周知,部分法律知识具有极强的时效性。法律规范的立、改、废、释会直接导致法律知识更新。以新或旧的法律规范生效时间为节点,同一知识的应用可能产生截然相反的结果。法律规范更新将使原有裁判文书部分甚至完全丧失知识价值。与此同时,部分法律知识具有动态性,社会环境和价值观的变迁可以改变人们对法律的理解与适用。然而,当前大模型预训练的知识有明确的时间界限,一经训练内部知识永远固定。相当部分用户发现当调整上下文的表达时,大模型会改变后续输出的内容,并据此认为大模型可以实时学习知识。这是对大模型最大的误解之一。实际上,用户每次输入都会被大模型作为上下文打包在输出计算中。输出内容的变化是临时的调整但不改变模型权重本身。一旦关闭对话,该新的设定将被完全遗忘。与之形成鲜明对比的是,大模型的训练昂贵、耗时、需要海量计算资源,因此它不是实时的,而是周期性的后台工作。尽管大模型可以通过外接知识库或互联网检索增强(RAG)方式在一定程度上缓解知识更新的困境,但这仅是外部信息的临时调用,并未实质改变模型的参数知识结构。与动态法律知识习得瓶颈相关的是,法律立改废释可能同时体现在预训练的语料中。由于前文提及的大模型的技术逻辑是以权重为核心的代码化知识,在时间序列区分能力上存在固有缺陷,这就导致在法律职业群体视角下理所当然地区分不同版本法律的能力,在大模型技术框架下尚无法稳定地实现。 (二)大模型法律事实建构能力的边界 作为法律实践的起点,法律事实建构包括描述性建构与规范性建构两个相互关联的次级能力。大模型的技术逻辑使其长于描述性建构却弱于规范性建构。 1.长于法律事实的描述性建构 大模型在法律事实描述性建构中表现突出的深层原因在于其完美契合大模型模式识别与信息提取两大核心能力。大模型的训练语料中包含大量的事实描述性内容,通过海量文本的预训练可以对“谁做了什么”等固定句式有极强的识别能力,其注意力机制则可以准确捕捉主语、谓语、宾语并将它们准确、流畅地组织起来。此外,描述性建构是一种收敛性任务(convergent task),通常具有唯一或最佳答案。大模型的技术逻辑善于从现有、分散的信息中收敛到一个确定的点,因此能够较好地避免大模型的知识幻觉与主观臆断。从这个角度看,大模型长于法律事实的描述性建构,能够从纷繁复杂的生活事实中筛选出与法律要素相关的事实要素,准确、清晰地呈现所筛选的事实,形成一个相对完整的叙事框架。典型的表现是由大模型从案件卷宗、当事人陈述、庭审记录等法律文本中识别案件的时间、地点、事件等关键要素,并对事件按时间线索与因果关系进行梳理。一项人机共同参与的法律实战测试显示,在主要通过法律事实描述性建构能力完成的任务中,法律大模型得分均超过或接近人类律师。如果将人类律师得分标准化为100分,法律垂域大模型在两项案件信息提取类任务中分别得到118和133分,超过人类律师的平均得分。更重要的还在于,法律大模型响应速度最低比人类律师快6倍,最高比人类律师快80倍。 2.弱于法律事实的规范性建构 对于法律事实的规范性建构,大模型无法通过简单的统计语义关联实现,而是需要借助于模型在高维向量空间隐式学习到词语的上下文分布。假设有以下生活事实的描述:“李四于周二晚趁邻居王五外出就餐时偷偷撬开房门,拿走了一台价值3万元的笔记本电脑。”大模型获得的知识并非以规则的形式储存,而是将高频共现关系以权重的形式进行参数化表达。因此,当要求大模型将上述生活事实提炼为法律事实时,大模型并非对文字进行阅读理解,而是将每一个字和词转换为数学向量。在此过程中,大模型的注意力机制介入,建立了“李四”与“拿走笔记本电脑”“撬开房门”与“邻居王五”之间的紧密数学关系。随后,大模型将上述向量表达与预训练中获得的参数化表达模式进行比对。众所周知,在海量的盗窃罪法律文本中,“嫌疑人”“未经许可”“进入他人住所”“入室窃取”“数额较大”等类似表达反复出现并被大模型以参数形式固定。因此在生成内容前,大模型的注意力机制会将向量化的提问与预训练形成的所有模式进行比对,可能发现“李四”匹配了“嫌疑人”的模式、“撬开门”匹配了“入室盗窃”的模式、“拿走笔记本”匹配了“窃取财物、“3万元”匹配了“数额巨大”。此时,在生成案件法律事实时,大模型就将上述要素与预训练中捕获的法律术语与法律句式串联起来,生成“嫌疑人李四入室盗窃价值3万元的笔记本电脑一台,数额巨大”。可见,大模型对法律事实的规范性建构的实质是将“李四撬门拿电脑”的向量表示,在数学上映射到大模型预训练海量文本中与“盗窃罪”场景高度相似的向量区域。与法律事实的描述性建构不同,规范性建构并非单纯语义的替换,而是建构出原文不存在的、具有法律意义的叙事,是一种发散性任务(divergent task),可能没有唯一的正确答案。在此过程中,大模型需要将“李四”抽象为“犯罪嫌疑人”,将“拿走”抽象为“窃取”,将“撬门”抽象为“入室”。其成败的关键在于大模型在预训练过程中是否有足够多体现上述抽象语义的关联语料。考虑到揭示上述关联关系的语料总体上属于低频的长尾知识,大模型尽管可以完成法律事实的规范性建构任务,但却不够稳定。在对ChatGPT和GPT-4的中文案件描述性建构的任务测试中,大模型对事实建构的准确率分别达到了90.7%和96.19%,而当需要结合规范性内容进行争议焦点凝练时(规范性建构),大模型对事实建构的准确率分别下降到57.16%和80.50%;当需要综合描述性建构与规范性建构的案件摘要任务时,大模型对事实建构的准确率分别下降到41.01%和42.72%。 (三)大模型法律规范发现能力的边界 结构、语言和相互依存性共同造就了法律规范的复杂性。与一般公众的认知不同,大模型的技术逻辑决定了其失于法律规范检索与法律规范续造,弱于法律规范识别与法律规范自洽,却长于法律规范解释。 1.失于法律规范检索 法律规范检索是指基于对具体规范的描述实现对法律规范的定位与召回。大模型在预训练过程中识别了法律文本的模式,因此可以利用参数空间记忆,并基于语义相似度而不是仅仅根据关键词瞬间激活预训练法律规范所形成的知识网络,迅速生成相关法律规范或司法判例。相较于法律职业群体依靠手动检索和经验筛选的方式,大模型在法律规范检索的覆盖面与效率方面具有明显的优势;同时基于语义的法律规范检索也显著优于基于关键词的机械检索。然而,大模型对法律规范的“学习”并非以数据库的形式储存于可以直接查询的条目中,而是以一种分布式、抽象化的方式记录在数以亿万计的参数里。当大模型被要求引用某个特定法条时,它不是从数据库中“提取”该法条,而是“重新生成”该法条。这种过程是“概率性”而非“确定性”的,完全不同于传统法律数据库意义上的“检索”与“返回”。因此,在不接入外部法律法规库的前提下,当用户需要大模型逐字逐句地背诵法律条款时,大模型难以有效地完成该任务。对于不常见或者有多个版本的法律规范,大模型在生成时还可能出现拼接、遗漏或者混淆等现象。 2.弱于法律规范识别 与法律规范检索的封闭性与确定性不同,法律规范识别是一种基于案件事实的发散性、多维度、非线性的匹配过程,是一种复杂的法律认知活动。法律职业群体在识别法律规范时,目光往往需要在案件具体事实与一般法律规范之间反复穿梭以实现最终的动态匹配。然而,大模型对于法律规范的学习以一种权重化的参数呈现。因此,大模型在识别法律规范时会将用户输入的案件事实文本转化为高维向量,通过多层注意力机制捕捉词语间的关联并在大模型预训练的向量空间中寻找距离最近的法律规范,最终生成概率最高的法律规范。其在本质上是一种语义相似度的计算。除了可能遭遇法律规范检索的短板,上述技术逻辑还使得大模型在以下情形时遭遇不同程度的法律规范识别缺陷:其一,表面相似、实质不同。实践中部分案例核心实体和核心行为具有高度相似性,仅在部分细节上存在差异,如是否具有非法占有目的就是区分非法吸收公众存款罪和集资诈骗罪的关键。因为共享了大量的语义结构,它们在大模型向量空间的距离非常接近。当高语义重合度掩盖了关键的法律变量差异时,部分大模型有可能被表述的表面相似性误导,在民刑交叉、此罪与彼罪等问题上出现错误。其二,表面不同、实质相似。实践中的案件往往可能出现事实描述与相关法律规范没有任何的重合,法律行为模式却完全符合的情形。此时,部分大模型可能因为文本相似度过低而无法将新型案件与既有法律规范关联。综上,与法律职业群体平均水平相比,大模型在法律规范的精准识别方面显得差强人意。实证研究显示,基于事实的法律规范识别,GPT-3.5Turbo和GPT-4的准确率分别只有29.5%和52.5%。 3.弱于法律规范自洽 在大模型的预训练过程中,根本法、基本法、一般法等层级效力规范只是不同概率分布的文本数据。因此,大模型的无监督学习技术架构无法内在地、先验地识别法律的权威与效力差序并在规范冲突时精准、稳定地选择适配的规范。尽管可以在监督微调过程中对法律层级规范进行显性标注来优化并获得法律层次化知识的权重函数,但这种函数是概率性且分散化的,难以形成稳定、可靠、准确的适用机制。实证研究显示,不仅是通用大模型,就连法律垂域大模型,如域外头部信息服务企业Lexis、Westlaw、汤森路透开发的三款法律垂域大模型,均难以理解法律权威的等级制度。可见,与法律职业群体通过专业训练掌握、规则驱动、经验支撑的法律规范自洽逻辑相比,如上位法优于下位法、特别法优于一般法、新法优于旧法等,大模型参数化的记忆和模式匹配缺乏内置的法律位阶规则与法律冲突规则,因此在深度解决规范冲突时呈现出明显的劣势。与之对应,大模型在法源模糊、多效力层级、规范冲突等情况下无法稳定选择适配的规范。 4.长于法律规范解释 法律的意义不是纯粹的客观发现,而是在解释过程中被建构的。因此,法律规范的解释是法律能力的重要面向,它强调运用特定历史、文化和情境中的意义去解读法律规范文本。文义解释是严格根据法律条文的字面含义、语法结构和上下文关系理解其含义的解释方法,是所有法律解释方法的基础。大模型在包括法律文本在内的数万亿量级的语料上进行预训练,将词语映射到更高维度的向量空间,并通过编码向量之间的距离与方向,实现对词语之间关系的固化。当执行法律规范解释任务时,预训练时形成的庞大概率分布与语义网络将被激活。相较于法律职业群体的平均水平而言,大模型具有超强的语法和逻辑结构解析能力。即使在针对超长和超复杂逻辑的法律文本的解释时,大模型都能准确追踪主谓宾结构、指代关系与逻辑关系。与此同时,现代大模型的上下文窗口不断提升(可达百万token),在解释法律规范时可以将一部或多部法律规范作为上下文窗口。在这个巨大的上下文窗口中,大模型的注意力机制可以计算待解释规范与其他规范之间的距离,从而形成最具体系一致性的法律解释结果。在上下文窗口已知立法目的与多法律版本的情况下,大模型也可以对法律规范进行目的解释与历史解释。因此,总体而言,大模型在法律规范解释方面的表现优于法律职业群体的平均水平。一项对20个大模型的法律能力的测评显示,其法律规范解释方面的平均得分比法律规范识别的平均得分高55.6%。 5.失于法律规范续造 与法律解释澄清法律文本意义相比,法律续造是对法律漏洞进行填补或对法律错误进行修正,是一种更高层次的法律规范发现活动,需要遵循专门的方法论。大模型续造法律规范面临以下实质瓶颈:其一,法律续造往往意味着原有语料中缺乏相应的实践,因数据不足,缺乏大模型可以模仿的模式。其二,大模型无法理解法律规范续造的正当性基础,无法进行真正意义的价值权衡,未充分内化理解法律的核心精神,容易产生违背法理的“创新”。其三,大模型在法律规范续造时可能无法充分带入社会背景与现实需求。因此,在面对全新问题时,大模型可能出现在形式上将知识碎片按逻辑拼接的东施效颦式的“法律续造”。 (四)大模型法律论证推理能力的边界 法律论证推理围绕事实、法律及其衔接关系展开,其正当性的获取需要满足两个条件:一是认定的事实和引用的法律都必须是真实存在的,二是结合事实和法律得出的裁判结论或主张是正确的。前者是“真实性宣称”的外部证成,后者是“正确性宣称”的内部证成。大模型长于内部证成而弱于外部证成。 1.长于法律内部证成 逻辑是法律推理的基础工具,用于确保推理过程的有效性,以及从前提到结论在推导形式上的正确性。在预训练过程中,法律语料所包含的法律推理逻辑可以被大模型捕获,这是因为大规模预训练强化了法律概念之间的情境驱动关系。法律数据中集中出现的重复关联,有助于模型将特定的法律事实、法律观点与法律规范联系起来。与此同时,在生成内容时,大模型所依赖的自注意机制对于上下文的语义结构和语法规则有着极强的捕获能力。这使其在逻辑推理能力上取得了突破性进展,甚至可以发现人类所忽略的相关关系,完成较为复杂的逻辑推理。正因此,大模型能够胜任针对“大前提+小前提→结论”形式逻辑的序列预测任务。在给定清晰的大前提和小前提时,经过有效训练的大模型可以完成逻辑上近乎完美的内部证成。这表现为大模型善于基于事实和法律规范确认罪名、预测刑期。评估显示,基于已知法律规范和已知法律事实的法律问答类任务,法律垂域大模型的得分为82.8,显著高于人类律师的得分70.1。 2.弱于法律外部证成 法律外部证成需要结合证据材料、道德原则、立法精神、法律价值、社会共识等元素综合证明法律推理逻辑前提的实质正当性。具体而言,法律外部证成需要从法律规范选择论证与法律事实认定论证两个维度展开。前者指向“为何选择该法律规范”,后者指向“为何如此认定案件事实”。大模型在法律外部证成方面的优势在于说理的逻辑性与全面性。尽管大模型无法像法律职业群体那样具身理解法律价值、道德伦理与社会共识,但上述内容可以在大规模法律语料中以显性或隐性知识的形式被参数化记录。因此,在法律规范确定的前提下,大模型可借助良好的法律解释能力实现较高水平的法律规范外部证成;在事实认定维度,法律职业群体需要基于证据的基础展开事实的实质认定,也即综合全案的证据进行经验与理性的综合判断。大模型还可以通过附件上传等多种形式将各类证据纳入大模型的上下文窗口,生成基于证据的事实认定分析结果。大模型在预训练时从判决书的法官说理部分参数化了证据链的逻辑,因此在条件明确的前提下,如存在明确的法律规范、已被采信的证据时,大模型在功能上可以产生外部证成所期待的“说服效果”。 在实践中,大模型的外部证成之所以难以达到预期效果,主要原因在于,在开放性的外部证成任务中,大模型受制于法律规范识别能力的弱项,可能选择错误的法律规范进行外部证成。在已知犯罪事实和法律规范的前提下,GPT-4和ChatGPT对于中国刑事犯罪罪名的推理准确度分别为100%和99.28%;而在开放性推理中,比如已知民事案件事实和诉讼请求,推理民事裁判结果时,由于规范并非已知,其推理准确性分别下降到53.14%和37.08%。更重要的原因在于大模型难以高质量地完成基于证据认定事实的外部证成。其一,现有的数据化逻辑难以建构每个证据与事实之间的证明概率,也就难以准确把握案件裁决对证据证明力的判断需求。在证据相互冲突时,大模型无法真正判断其证明力差异,其建构的证据链也只是一种高频共现关系的概率生成,稳定性和准确性存在极大缺陷。其二,“神经网络能够捕捉词之间的相关性,但它们并不具备内在的事实验证能力”。大模型无法接触训练语料之外的现实世界,无法建构文本形式与语言之外现实之间的关联并获得“意义”。这意味着大模型事实上无法完成证据真实性的判断。在开放性法律外部证成能力的对抗性测试中(基于LEXam基准),受试大模型在客观推理问题上的推理准确率均低于50%、主观题得分率约为60%。 三、大模型法律能力边界的法理启示 在肯认大模型辅助性定位和人在回路重要性的基础上,我们需要客观准确评价大模型的法律能力及其边界,为法律职业群体借助大模型完成各种法律任务提供全面、系统、准确的指引,从而确保大模型在真实法律场景中得到高效与安全的应用,并通过有效的人机协作框架实现对大模型依赖的风险治理。 (一)划定基于能力边界的大模型适用边界 大模型的法律能力边界对应着其在法律任务中的适用边界。根据所依赖法律能力的不同,可以将法律任务分为高、中、低三类风险任务。高风险法律任务是指完全超出大模型法律能力边界的法律任务。此类任务主要由动态法律知识习得、法律规范检索、法律规范续造能力单独或共同支撑,如政法内网部署大模型的时效性法律知识问答、不依赖外接法律库的法律规范检索、无明确法律规范支撑的疑难案件分析等。中风险法律任务是指在大模型法律能力边界之上,但大模型表现弱于法律职业群体平均水平的任务。此类任务主要由法律事实规范性建构、法律规范识别、法律规范自洽、法律外部证成等能力单独或共同支撑,比如基于特定的案件事实匹配相应的法律规范、复杂或新型案件分析、合同条款审核与修订、开放式法律推理(事实或法律不明确)、非常见法律文书生成、裁判要旨与争议焦点提炼、证据链分析、法律风险提示、法律规范效力层级判断等。低风险的法律任务则是指大模型法律能力边界之内,大模型表现明显优于法律职业群体平均表现的任务。此类任务主要由法律知识识别(显性+隐性+非具身默会)、法律事实描述性建构、法律规范解释、法律内部证成等能力单独或共同支撑,比如法律法规理解、法律条文归纳、封闭式法律推理(事实与法条明确)、常见法律知识的问答(法律概念、法律原理、法律体系等知识)、法学理论梳理与归纳、常见法律文书生成、案件卷宗的归纳与摘要撰写、案件事实梳理与抽取、案件材料收集与整理、证据相关性判断(详见下表)。法律职业群体应该根据模型法律能力的不同,形成应用大模型完成法律任务的合理预期与风险意识。三类法律任务并非平均分布。实践中处于大模型法律能力边界之内的低风险法律任务往往可能耗费初级法律职业群体最多的工作时间。这也从另一个侧面解释了大模型在法律领域的应用潜力。 在此基础上,有关机关或部门应围绕各系统法律任务,联合或分别出台兼顾效率提升和风险防控的行业性大模型应用指南与标准。一方面,出台《大模型法律能力测评标准(试行)》,联合技术专家设计一套模拟真实法律场景的大模型测评基准,覆盖大模型的四个一级法律能力和十三个次级法律能力;大模型评估是一个系统工程,由政法机关主导的同行评估可以形成大模型治理的合力,从而有效回应法律领域的专业性与复杂性;通过贴近法律领域实战的方式对大模型的应用潜力进行科学全面的测评,为系统部署大模型提供指引。另一方面,借鉴中央网信办2025年10月出台的《政务领域人工智能大模型部署应用指引》所明确的应用场景与部署规范,制定《政法领域大模型应用指南(试行)》,明确大模型的适用范围、核心原则、分类框架、典型任务等核心内容,既鼓励法律职业群体探索大模型的应用,减轻基础性与事务性法律任务的负担,又明确列明推荐、优先推荐、不推荐使用大模型完成的法律任务清单,从而为大模型在法律领域的应用提供有效、可操作的路线图。 当然,大模型的法律能力边界并非一成不变。通过领域微调、检索增强、思维链技术可以有效提升大模型在完成法律领域任务方面的鲁棒性。比如,通过领域微调获得的法律垂域大模型在法律推理方面的表现优于通用大模型;尽管尚存在诸多无法克服的瓶颈,但借助检索增强生成技术(RAG)接入高质量法律法规库和互联网,可以在一定程度上缓解大模型在法律规范检索与动态法律知识习得方面的能力缺陷。因此,应建立大模型法律能力的周期性测评机制,并根据测评结果动态调整大模型的应用边界。 (二)建立递进式的法律领域人机协作框架 当前,学术界在强调大模型辅助性地位时普遍强调确保“人在回路”,即大模型的法律知识辅助处于法律实体判断过程的中间环节而非最终环节。然而,在技术正向偏见效应下,法律职业群体往往会放弃过去凭借有限能力和个体经验进行决策的模式,而不自觉地服从于人工智能模型给出的结论。由此,日渐成熟的大模型可能会成为法律职业群体案件办理的一种习惯性“依靠”,从而影响他们的独立性与自主性。可见,仅仅将法律职业群体放置到自动化决策流程中并不能实现其对法律决策的实质性参与。对此,需要注重人机协作的框架设计,为法律职业群体的实质参与决策留足空间。考虑到人类社会发展过程中对于技术的深度依赖以及技术对于人类行为的隐性控制,应面向人在回路着力打造法律领域的人机协作框架。 人机交互的本质是人与机器在动态环境中通过多个界面进行交互和通信。肇始于1940年代工业1.0时期的人机关系经历了四次迭代,其间人类角色呈现从控制者到合作者的关键变革,交互内容也从物理意义的信息传输延伸至认知、情感等多重维度。进入2020年代,大模型的迅速发展正在深刻影响法律领域的人机关系。此前,从未有一款人工智能应用可能如此大范围地与法律职业群体形成日常关联。从深层次而言,这不是简单的任务转移,而是复杂的能力互动与人机关系的动态调整。法律领域人机协作的关键在于如何有效整合法律职业群体与大模型的能力,并最大限度共同推动法律任务的高质量、高效率完成。此时,大模型与法律职业群体之间决策权重的分配成为问题的关键所在。以大模型的能力边界为参照系,以法律任务的风险区分为标准,法律职业群体应该校准自身在人机协作关系中的“生态位”,建立一套符合法律职业伦理、体现专业壁垒、具有可操作性的法律领域递进式人机协作框架。尽管递进式框架的内涵存在层次性,但其共性在于强调法律人在人机协作中对于法律知识验证、法律知识创新与法律价值判断的主导权力。找到法律职业群体的生态位,也就找到了大模型时代法律领域良好人机协作关系的制度框架。 其一,完成高风险法律任务尽管超过大模型的法律能力边界,但绝不意味着应完全放弃大模型的辅助功能。对此,应建立启发性人机协作框架。在该框架下,不推荐将大模型视作标准答案的提供者,而应将其视作法律思维的激发器,通过提供背景信息、生成多样性观点来激发法律职业群体获得更高层次的法律认知——扩展思路、打破定式、带来头脑风暴。在启发性的人机协作框架中,法律职业群体应该起到绝对的主导作用,负责适当设定问题,提出探索的方向与边界。大模型对高风险法律任务的响应大概率存在精准性和可靠性不足的问题。法律职业群体的核心价值在于基于专业的知识与经验,从中筛选、提炼与重组各种潜在可能性,捕捉各类具有启发性的思维火花。法律职业群体可凭借专业技能与直觉,将获得的灵感放置到法律场景中进行逻辑推演、理论建构与体系扩展,最终形成原创性的法律理论或法律实践方案。比如检察官可以设定一个刑事案件的基本事实和证据链条,要求大模型模拟被告方辩护律师提出最苛刻的、各角度的庭审抗辩。由此,公诉人可以发现可能的薄弱环节,完善公诉策略。 其二,中风险法律任务是大模型的完成能力总体弱于法律职业群体平均完成水平的任务。对于此类任务,应当根据审慎应用大模型的总体基调,建构反思性人机协作框架。反思性人机协作框架以大模型对中风险法律任务的响应可能存在事实、逻辑或判断上的错误为基本前提,目标是引入法律职业群体的专业智慧,通过穿透性、实质性的审查,修复错误,提升特定法律任务的完成质量。反思性人机协作框架在机制上聚焦严谨的法律人在回路的工作流程,通过建立“验证—修正”“指令—反馈”双循环,实现对大模型赋能法律任务的有意义控制,确保输出内容的精准性与可靠性。一是法律职业群体需要明确任务边界,将法律任务拆解成大模型能够理解、无歧义的指令。二是对于大模型生成的法律内容,不能止于简单的校对,而应带着反思性的视角进行事实与逻辑等方面的多重交叉验证。三是发现任何错误,都应该通过指令调整实现大模型的正向反馈。“发现错误—优化指令—内容修订”是反思型人机协作框架的关键所在。四是不断反思与学习,提升运用大模型的综合能力。这是因为法律职业群体使用大模型的经验与技巧是重要的知识资源,可以塑造大模型被运用的方式,决定法律职业群体能否高效、准确地与大模型进行交互,并影响生成内容的准确性与可用性。概而言之,在反思型人机协作框架中,法律职业群体与大模型的关系可以类比为验证者与初级助理之间的关系。 其三,低风险法律任务的完成完全处于大模型的能力边界之内。对于此类任务,应该根据推荐应用的总体基调,建构监督型的人机协作框架。监督型的人机协作框架的基本前提是认为对于低风险的法律任务,大模型能够有较高水准的表现。对于这类任务,法律职业群体的主要职责是通过轻量化的监督机制,对模型输出结果进行程序性、关键点的审查。在此基础上,法律职业群体应当将大模型的能力整合到已有的法律任务之中,实现最大化的效率提升,从而使自己有更多时间投入复杂性与创造性的法律任务中。轻量化监督机制的核心内容包括:(1)对低风险的任务进行事先验证;(2)将通过验证的、高频、重复性强、低风险法律任务的提示集进行标准化、结构化与工程化。这一过程的本质是将个性化、情景化法律经验所导致的离散、具体的提问方式转换为大模型可以精准执行的显性指令。大模型目前面临输出质量稳定性不足的问题,同一个模型由不同法律人使用,由于提示词素养的差异,大模型最终输出的结果会有根本不同。此时,就必须借助工程化封装的方法来解决。具体而言,应将高频发生、在大模型法律能力边界之内的任务进行流程整合;设计涵盖角色、背景、任务、要求、限制等完整要素的最优提示词模版;通过试验和迭代找到最优的指令设计方案;进行工程化封装,以功能按键而不是开放式的输入进行呈现。每次点击按键,大模型接收到的都是结构化、高质量、统一格式和法律逻辑的指令。这样,大模型可摆脱法律人的个体差异,实现输出结果的稳定与可靠。同时,可以由专家团队经过大量测试与验证,针对特定法律任务的提示词进行持续优化与迭代。(3)对输入和输出内容的匹配性、生成内容的格式与规范、最重要的变量(如合同金额、当事人名称等)等进行审核。一言以蔽之,在监督型人机协作关系中,法律职业群体与大模型的关系可以类比为监督者与高级助理之间的关系。 (三)塑造法律职业群体的人机协作素养 以大模型为代表的人工智能在中国法律领域的运用是一个长期的过程,必然会面临各类艰巨的挑战,需要既擅长人工智能技术,又精通法律知识的双栖人才长期、专注地投入与坚持。因此,我们必须秉持长期主义思维,通过强化法律职业群体的大模型素养建构良好的大模型应用生态。大模型在法律领域的应用应该被视作目标导向的法律职业群体在特定场景中基于个人能力的与技术系统互动的过程。从当前大模型发展的趋势来看,未来意义的智慧法治将在“人机协作”的意义上展开。因此,在此过程中应当着力提升法律职业群体的人机协作能力,从而促进大模型应用的落地见效。将大模型视作协作者而非替代者,并通过制度途径着力提升法律职业群体的大模型应用素养,符合未来法治实践形态的现实需求。 人机协作素养是指法律职业群体通过与人工智能系统有效互动,充分发挥主体能动性与技术可供性,共同完成法律任务的综合素养。人机协作素养可以放置到技术素养的理论框架中,从技术认知、技术运用和技术评估三个层面展开。(1)技术认知素养。培养法律职业群体的人机协作能力,首先要求法律职业者建构对大模型技术的基础认知能力。这并非要求法律人像专业技术人员那样全面了解技术的细节甚至是代码,而是把握大模型的主要功能和适用场景,理解其技术局限与潜在风险,知悉在何时可将大模型引入已有的法律任务流程。(2)技术运用素养。法律领域人机协作能力要求法律人具备能在长时间多轮复杂交互中,引导大模型生产和优化输出结果的能力。这种引导能力突出体现在选择专业、适当、清晰、上下文关联的提示语的能力,或者说“提问题的能力”。(3)技术评估素养。法律领域人机协作能力还要求使用大模型的法律人评估技术输出内容的准确性与合法性,识别潜在专业性错误、偏见和不足,并在技术运用能力支撑下调整和优化输出结果,从而确保法律任务的高质量执行。 考虑到技术素养是一个综合能力体系,因此在强化人机协作能力时也需要采用长期的,涉及教育、培训和实践等多维度综合回应的策略。对此,政法院校要在国家政策的支撑下提升法科学生运用大模型的参与度。首先,更新高等学校法学院系的课程设置,增加设置法律人工智能技术素养的相关课程,覆盖法律人工智能技术的基本原理、应用场景、伦理规范等内容,培养学生对法律人工智能技术的整体性系统性认知;结合全国范围内文科实验室的建设与探索,通过实验课程的设置,培养学生对各类法律人工智能系统的实操技能。如大模型的法律知识幻觉实验、大模型的法律价值对齐实验、大模型的法律提示工程实训等;鼓励法学院学生修读计算机科学、数据科学等相关课程,建立交叉学科的知识背景。其次,有条件的高校可以探索“法学+人工智能”双学位、“数字法学微专业”的本科生人才培养模式改革,在本科阶段培养具有法律和人工智能双重知识背景的法律人才。最后,推动针对法律人群体人工智能技术素养提升的培训计划,重点讲授前沿法律人工智能系统的实用技能和对模型输出结果的评估与运用方法。 结 语 2017年Transformer架构被正式提出,它引入的注意力机制给传统自然语言处理技术带来了革命性突破,并为大模型时代的到来奠定了坚实基础。随着大模型技术走出实验室,全面进入社会各个领域,法律职业群体可能已经不知不觉地站在了如何面对大模型的时代门槛上。法律垂域大模型的高水平创新,可以实现法律能力边界的不断扩展。法律职业群体以大模型的法律能力边界为起点的每一次探索,都可以为更具韧性的人机协作提供可能,其最终将指向法律职业群体自我法律能力的革新与进化。因此大模型的法律能力边界不应成为法律职业群体拒绝应用大模型的理由,相反,法律职业群体应该以此为锚点,以更加开放的心态去迎接法治可能的“未来形态”。 来源:《法律科学》2026年第3期

