SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

广告 X

原标题:SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

2023年

当之无愧的“大模型之年”

历经“百模大战”等一系列里程碑事件

“大模型”一路高歌猛进

在业界占据无可争议的C位

成为科技世界“新宠”

SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

是骡子是马拉出来遛遛

时至今日

各大显眼包“宠物”们

已有一队“通用”基础大模型正式上岗

真正从云端的“写诗作赋”

落地“凡间”

幻化为人类的“金牌助手”

进行人间初探

它们具备常识

懂得推理

学会创作

表现出拟人的智能

SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

也有一队分支“华灯初上”

直接从“通用”迈向“垂类”

训练孵化出无数个“行业”大模型

加入“千模大战”

以“术业有专攻”的精神内核

在产业智能需求之上

历练于产业场景应用之下

不停锻造自身的神奇能力

以“降本增效”的智能体和其诚意之举

不断释放最大“被利用”价值

真正赋能千行百业

开始真的帮助人们解决实际问题

尤其在具有高度专业性和复杂性的

「法律领域」

「大语言模型」的表现尤为突出

SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

法律大语言模型的崛起

为全球司法工作者提升工作效率

降低风险并加速决策

提供了一个绝佳的契机

目前已广泛应用于

合同审核和分析、资料查找和法律研究、

合同起草、法律结果预测、

量刑建议和保释建议等法律场景

在国内

法律大语言模型也已涉及到:

法律文书的自动生成、

法条文书的语义解析、

法律问题问答、案件检索、

智能合同管理、法律合规检查等

专门针对中文法律场景的具体应用

SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

01 需求

随着虚拟币的快速发展

各类与之关联的犯罪行为日益猖獗

给全球法律界和司法体系带来严峻挑战

涉虚拟币新型犯罪的特质和特点

使得传统法律框架在应对此类犯罪时

已显得力不从心

涉虚拟币犯罪属于新兴领域

因此“取证、定罪判罚”的界定模糊

需要广泛借鉴

首先

在「取证方面」

虚拟币交易依赖区块链技术进行

其去中心化和匿名性

使得犯罪分子难以被追踪

因此亟须针对这一新兴领域开发

更高效精准的取证工具及策略方法

其次

在犯罪行为的「界定方面」

涉虚拟币犯罪类型丰富多样

包括诈骗、洗钱、黑客攻击等

虽可参考传统犯罪类型

但在某些方面极具独特性

有必要对其进行“精确界定”

以确保在定罪和量刑过程中

保持公正和一致性

此外

在「审理」涉虚拟币犯罪案件时

法官定罪判罚需全面考虑多种因素

如犯罪严重程度、被害人损失、

犯罪嫌疑人恶意意图等

以确保判决结果的合理性

面对上述挑战

该领域相关用户

迫切渴望拥有一款智能产品

可以帮助快速归纳总结历史判例信息

从而对当前涉虚拟币犯罪场景

作出合理分析判断

进而为侦破和取证工作提供指导

02 试验

在利用当前通用主流的

「中文法律大语言模型」

进行“涉虚拟币案件”场景的测试中

我们发现其表现效果并不理想

在准确性方面存在显著不足

且“睁眼说瞎话”的模型幻象严重

另外,从用户的使用场景来看

“判例的高关联度”及“结果更新及时”更受关注

对此,模型的表现亦难以达到预期

03 目标

鉴于上述测试结果

我们决定基于用户实际场景需求

快速搭建研发一款

面向“涉虚拟币犯罪特定领域”的

灵活实用型检索应用产品

该产品的首要目标是「精准实用」

杜绝「模型幻觉」

保证检索结果可为用户

提供有针对性的、更高效的

犯罪线索和证据整理指导

其次,力求「低成本」快速部署

无需进行 fine-tune

(对预训练模型进行微调)

无需多轮问答

直接充分利用现有的

「涉虚拟币犯罪判例库」

实现高效应用

04 解决方案

中科链源SAFEIS品牌

通过搭建研发「法律问答模型」

并以「SAFEIS问答助手」的产品形态应用

为用户提供便捷、高效的法律服务

同时助力执法机关打击涉币犯罪

SAFEIS问答助手:探索「AI+法律+涉虚拟币犯罪特定领域」的无限可能

「SAFEIS问答助手」

利用强大的知识归纳能力

以及全国全量判例库(含涉币)

(当前使用2020-2022三年经特殊处理后得到的57万高质量判例)

进行「法律场景」对话

为用户提供精准、即时的法律咨询

帮助用户解决涉虚拟币犯罪领域的法律问题

05 研发应用

【 1 】

👉“文本预处理与意图识别”

对判例库中的文档进行预处理

此阶段主要任务是:

处理输入的文本数据并识别用户的意图

【步骤1】

对判例库里的样本进行预处理

并对每个判例文档生成Embedding

最后存入矢量数据库

(一次性任务)

【优势】

此流程旨在确保判例库中的文档

具有高度的代表性和准确性

为后续的向量检索和应用

提供可靠的数据基础

【 2 】

👉“判例检索模块的构建”

基于Embedding的判例检索

此阶段主要任务是:

基于意图识别的结果

构建一个高效准确的判例检索模块

【步骤2】

将用户的查询文本生成Embedding

并应用于矢量数据库检索

获取TopK的Embedding对应的判例文本

TIPS:

我们采用ChatLaw-Text2Vec

作为基础编码模型

用于生成文本的语义向量

经测评多种中文Embedding模型

ChatLaw-Text2Vec在中文法律语义匹配场景下

具有更优的指标效果

【优势】

此模块提供判例查询功能

传统的检索方法

(如关键词匹配、N-gram、TF-IDF等)

在挖掘深层语义表征方面存在局限

因此会对语义的捕捉不够精准

通过对查询文本的语义信息进行学习

然后借助判例库的语义表征来做匹配

进而召回语义相关判例

该方法有助于克服传统检索方法的局限性

从而提高法律实践中的检索效果

【 3 】

👉法律问答大模型

基于全量判例库的法律问答系统

理解用户提出的问题

并在判例库中寻找相关答案

【步骤3】

基于对用户Question的理解

使用语义召回相关的判例

联合预定义的Prompt

一起生成 Instruction(GPT模型的指令)

来指导大模型进行回答

(我们采用ChatGLM-6B模型进行推理)

【优势】

基于「检索功能」的升级

增加了对问题理解及信息归纳能力

针对用户提出的问题

充分利用开源大模型所具备的知识嵌入能力

首先进行「判例检索」

再基于检索出的判例

应用大模型进行归纳分析

并生成准确的回答

就像一位顶级专家在研究了大量资料后

提炼出最关键的部分作为答案

【 4 】

👉效果展示

06 实战验证

由于使用真实的判例数据作为外挂知识库

我们的模型在法律场景下拥有较高的准确率

当用户问及“查定罪”、“查条款”

以及“查案例”等场景问题时

模型生成的效果

明显优于纯大语言模型的生成结果

模型的幻觉问题也随着外挂知识库有所缓解

【写在最后】

「法律大语言模型」在提升法律行业研究和工作效率、提供便捷的法律咨询服务、辅助法律判决和论证、促进法律科技创新等方面具有重要意义,有望促进法律行业的发展与变革。中科链源旗下SAFEIS品牌,专注为涉虚拟币犯罪特定领域提供创新性解决方案,SAFEIS问答助手在实现应用价值的同时,已成为推动法律科技发展的有力推手。返回搜狐,查看更多

责任编辑:

© 版权声明
法律援</div>        </div>
    </div>
        <div class=

相关文章