plsql脉冲激光治疗近视

来源:配镜咨询网 时间:2023-10-18 12:03:03 责编:配镜顾问 人气:

科技爱好者周刊#248:不要夸大 ChatGPT

这里记录每周值得分享的科技内容,周五发布。

plsql脉冲激光治疗近视

本杂志开源[1],欢迎投稿[2]。周刊另有《谁在招人》[3]服务,发布程序员招聘信息。合作推广请邮件联系[4](if.@i.[5])。

封面图

上图是2022年世界自然摄影奖的获奖作品,保加利亚中部城市旧扎戈拉的一只红隼,在一盏生锈的路灯里安家,彷佛很多人在大都市的处境。(vi[6])

本周话题:不要夸大ChGPTChGPT问世只有几个月,大家有没有发现,舆论的调门越来越高。

人们最初的震惊和赞叹,逐渐变成了非理性的鼓吹,很多人言之凿凿,断定ChGPT将重塑人类社会。

举例来说,《经济学人》杂志[7]称它会“翻天覆地”。

“GPT也完全可以是-h(通用技术)的缩写:一种翻天覆地的创新,可以像汽机、电力和计算机一样提升各行各业的生产率。”

一个国内的作者则说[8],它会“席卷一切”。

“ChGPT带来的这场风暴,正在席卷一切。

随着不断的技术提升,可以预见,GPT类型的AI,未来能替代的,也许是全行业!”

还有人担心它会淘汰人类,有的文章标题堪称惊悚,《AI狂飙的时代,人还有价值吗?[9]》。

微博的“热门文章”[10]列表,也是满满的生存焦虑。

这种情绪反映在金融市场,就是“ChGPT概念股”被狂炒。一直微利+亏损的“汉王科技”,就在ChGPT问世后,股价从11元炒到了40元。

我有一种感觉,ChGPT已经神化了,仿佛无所不能。

今天就来谈谈这件事,我要说,ChGPT确实很神奇,是划时代的技术创新,但是不应该无限夸大。

ChGPT有其局限,很多事情它做不到。有人说[11],ChGPT标志着机器取代人类的“奇点时刻”,这是不对的。

他们忽略了最关键的一点:ChGPT不是“通用人工智能”,而是一个语言模型。

“通用人类智能”(ifiiii,简写AGI)是AI的终极目标,就是造出可以像人类那样全方位的推理、思考、分析的机器。如果能实现,人类就真的危险了。

但是,ChGPT不是AGI,而是一个LLM(LLM,大规模语言模型)。所谓“语言模型”,就是只用来处理语言文字(或者符号体系)的AI模型,发现其中的规律,可以根据提示(),自动生成符合这些规律的内容。

这就是说,ChGPT只适用于有成文符号的领域。这带来两个局限。

(1)如果某个领域是非成文的,不能用符号记录表达,那么ChGPT就无能为力。比如,人类的很多心理活动、潜意识、灵感、顿悟等等,ChGPT就没法模拟生成。

(2)第二个局限更致命,ChGPT要用现有的文字材料进行训练,发现的是那些材料包含的规律。这意味着,它不能生成超出人类已知规律的东西。

举例来说,它不能证明未解决的数学猜想,也不能提出没有人发现过的科学发现。

即使我们把历史上所有的数学论文,都用来训练ChGPT,它也无法证明黎曼猜想。因为那些论文只会教它现有的证明方法,而黎曼猜想需要新方法。

ChGPT的底层技术是GPT,全称为“生成式预训练转换器”(Giv-if),凡是使用该技术的AI模型都有同样的问题:它们只能掌握已知的模式,无法生成未知的模式。

所以,真正“前无古人”的创新,这一类AI模型做不到,还是必须依靠人类的智慧。

另外,这里还有一个逻辑悖论。如果ChGPT真的强大到“席卷一切”,将来绝大多数文档都用它来生成,其实反而会带来它的衰亡。大家这么想,到了那个时候我们拿什么材料训练AI呢?毕竟AI只有拿人类的作品训练,才能模拟人类智能。

总之,ChGPT是一个划时代的工具,所有模式化的人类工作,都面临空前的挑战。

但是,人类生活还有很多非模式化的部分,尤其是人类的创新能力,ChGPT触及不了这个部分,所以它对社会的改变,不宜过分夸大。

活动周刊不定期发布技术活动消息,面向全国程序员,欢迎参与。

1、AIGC技术探索与应用创新

“掘金城市沙龙·北京站”邀请了来自字节、英特尔、谷歌、清华大学等著名机构的AI工程师和专家,与大家线下交流AIGC(人工智能生成内容)的一些学术性热点问题,包括工作原理、模型训练、后续变革等。

时间是4月13日下午,地点是方恒时尚中心(北京大钟寺地铁站旁)。现场座位有限,扫描上方二维码,了解详情并报名参加。不能到场的同学,可以扫码预约线上直播。

2、抖音Ai基础技术大揭秘[12]

字节技术沙龙邀请了抖音Ai团队的5位架构师,与社区交流抖音Ai客户端的一些开发实践,分享内容如下。

1.抖音Ai包大小代码优化实践2.抖音启动性能监控平台建设实践3.抖音流畅度优化探索和实践4.静态代码分析在体验优化中的探索实践5.抖音性能防劣化平台极致演绎之路

时间是4月15日下午,扫描下方二维码或者点击链接[13],了解详情并且免费报名预约直播。

以上两个活动,除了技术分享,还为参与者安排了精美的礼品抽奖环节,大家不要错过。

科技动态1、子宫工厂[14]

欧洲的人口出生率不断下降,一位科学家提出一个设想,在欧洲建立世界上第一个子宫工厂。

根据他的设想,这个厂有75个实验室,每个实验室最多容纳400个生长仓,每年可以培养30,000个婴儿。

胚胎放入生长仓后,就会有传感器24小时监控,并将生命体征、身体特征等数据实时发送到父母手机。父母还可以查看婴儿发育的高清图像,并通过扬声器与其交谈,或者穿上触觉背心感受婴儿的踢动。

每个生长仓都有两个管道,一个将营养物质和氧气泵入人造脐带,另一个排出废物。

一旦婴儿发育成熟,就可以从生长仓取出,交给父母养育。

2、不再冬眠的熊[15]

美国太浩湖地区是一个风景区,也是黑熊的栖息地。今年冬天,许多居民意外发现,当地的黑熊居然没有冬眠,还在四处乱窜。

黑熊之所以冬眠,是因为冬天找不到食物,需要以静止的方式减少消耗。但是如果冬天能够找到食物,理论上,黑熊就没必要冬眠了。

太浩湖正在开发中,越来越多的居民移入,导致黑熊能够在人类聚居地的垃圾箱找到食物,这就是黑熊不再冬眠的头号原因。

3、流行歌曲越来越短[16]

一项研究发现,从2000年开始,流行歌曲的长度越来越短。

一首歌的平均长度,从以前的4分10秒下降到大约3分30秒。2021年美国前50首最流行的歌曲,平均时长更短,仅为3分07秒,其中38%的歌曲甚至不到3分钟。

研究者认为,这表明人们的关注周期越来越短,如果不能很快听到精彩部分,就会感到不耐烦,不再听下去。另外,Tikk短视频的流行,也加剧了这种趋势。

4、哺乳动物的起源[17]

澳大利亚科学家提出,哺乳动物可能起源于南半球。

传统的看法是,哺乳动物起源于北半球,因为北半球的陆地面积大,是大部分动物的栖息地。

但是,这些科学家认为,哺乳动物可以分成三类:有袋类(比如袋鼠)、胎盘类(比如人类)和单孔类(比如鸭嘴兽)。它们在澳大利亚都有分布,而且其中两类仅存于大洋洲。

这说明,大洋洲很可能是所有哺乳动物的起源地。而且,澳大利亚也确实发现了一些非常早期的哺乳动物化石。

5、防雾镜片[18]

近视患者最不方便的事情之一,就是眼镜起雾。为了解决这个问题,瑞士科学家发明了一种防雾镜片。

上图左侧是普通镜片,右侧是防雾镜片。

眼镜起雾的原因是,潮湿的空气接触到温度更低的镜片时,会发生冷凝。这种防雾镜片设法加热镜片,从而避免了冷凝。

加热方法是在镜片涂上一层极薄的、透明的金属涂层。这个涂层会吸收太阳的红外线,使得镜片升温8摄氏度,缺点是在没有灯光的夜间,它就不起作用。

文章1、维基百科的声音L[19](英文)

维基百科本周发布了一个声音L,作为音视频产品的标志。

2、为什么我们要与CSS-i-JS分手[20](英文)

作者认为,网页样式写在脚本里面的CSS-i-JS有重大缺陷,应该避免使用。

3、新的CSS视口单位vh和vh[21](英文)

本文介绍CSS视口的新引入的长度单位,专为适配移动设备的动态工具栏而设计。

4、CfR2与AWSS3的比较[22](英文)

CfR2是一个新推出的对象存储服务,比起老牌的AWSS3,最大优势就是价格便宜。本文对两者的价格和功能进行详细比较。

5、苹果官网主页的历史回顾[23](英文)

本文回顾了苹果官网的变化,从最早的样子一直到现在,可以勾起很多回忆。上图是1997年乔布斯回到苹果之前的主页,怪不得当时濒临破产。

6、AV1视频编码支持情况(2022版)[24](英文)

AV1是最新的视频编码格式,可以节省流量。本文介绍了它目前的支持情况,结论是只有苹果设备不支持。

7、C语言学习注意点[25](英文)

作者整理了自己学习C语言过程的一些笔记,相当于列出了C语言一些的学习难点。

8、老项目是否应该推倒重写?[26](英文)

接手一个很难维护的老项目,到底是继续改进原有代码,还是彻底重写?作者举了六个案例,讨论这个问题,值得一读。

工具1、MifL[27]

上周五,微软发布协作工具L,可以免费使用。

它属于Mif365套件的一种,允许用户将各种Offi组件(W、Ex、PPT等)插在一个文档里,进行协作,跟Ni很像,参见官网介绍[28]。

2、Mf[29]

一个基于R的互动式数学图形组件库。

3、ChGPT-Dk[30]

开源的跨平台ChGPT桌面应用程序,使用Ti+V3开发。(@k[31]投稿)

4、T[32]

一个在本机运行GiHAi的工具,通过虚拟机来执行任务,只支持MOS系统,详见介绍文章[33]。

5、RSS.f[34]

一个国产RSS阅读器,增加了知识管理、期刊订阅等特色功能。(@zhi-wzh[35]投稿)

6、PFi[36]

一个开源的播客文本搜索引擎,所有代码都是GPT-4生成的。(@zzz[37]投稿)

7、SQLCh[38]

一个W应用,使用自然语言查询数据库,底层使用OAI的API将自然语言转成SQL,支持MSQL和PSQL,代码开源[39]。(@izh[40]投稿)

8、FP[41]

一个开源的软件功能(f)管理平台,支持灰度放量、AB实验、实时配置变更等操作。(@xij[42]投稿)

9、CTk[43]

这个网站可以导入GPS轨迹,在地形图上显示,特别适合生成山地路线图。

10、v[44]

一个命令行的文本阅读器,用来替代或。

资源1、3DiCSS[45]

这个网页提供互动演示,帮助理解CSS里面与3D有关的各项属性。

2、AI研究所[46]

一个中文网站,收录AI相关工具。(@x997[47]投稿)

3、深度学习自己学[48]

该英文网站是一个原创的深度学习的自学教程站。

4、W应用101[49]

这篇长文详细介绍W应用是什么,理清各种概念,比如SPA(单页应用)、SSR(服务器端渲染)、SSG(静态网站生成)。

图片1、奇怪形状的树雕[50]

一个法国艺术家专门制作奇形怪状的树雕。

你看上去以为它们是树枝,其实都是石膏做的,外面覆盖了松树皮,非常逼真,几乎看不出来是人造的。

艺术家说,他经常去树林中寻找灵感。他希望,人们在树林中遇到这些雕塑时,会产生惊奇和好奇的感觉,思考树木是多么不可思议。

如果不知情,在树林中看到这种东西,真的会吓一跳。

文摘1、为什么学习微积分[51]

高中的最后一年,我的学校开设了微积分课。

第一堂课就有学生提问:“老师,日常生活哪里会用到微积分?”

老师回答:“用不到,你永远不会在日常生活中使用微积分。事实上,你们中不少人,在未来的职业中也用不到微积分。”

他看着学生迷惑不解的表情,又说:“你们想知道为什么要学微积分吗?”

我们几个学生点了点头。

他指着班里的一位校足球队的同学问道:“你们经常练习足球,是吗?”

“是的,”学生回答道。“差不多每天都练。”

“教练给你们安排举重练习吗?”

“是的。每周二和周四,我们都要去举重室练习。”

“这是为什么?”老师问。“为什么足球运动员要练举重?难道是为了在球场上推倒别人吗?”

“不,当然不是。”

“那为什么要举重?”

“因为它让我们变得更强大,”同学说。

“答对了!”老师说。“微积分也是如此。你学习微积分,不是因为要在日常生活中使用,而是因为它让你的思维变得更强大。”

我从来没有忘记这堂课。

言论1、

一旦你有足够的原子,你就开始搞化学。一旦你有足够的分子,你就开始搞生物学。一旦你有足够的算力,你就开始搞AI。

--《AI就是我们》[52]

2、

我这一辈子都在大公司工作,对它们的运作太熟悉了。很多人即使公司会破产,也不愿挑战由层级远高于自己的上级制定的内部政策。

事实上,他们作为公司的员工,完全不了解也不关心政策会有怎样的后果,只是按照上级吩咐的去做。

--HkNw读者[53]

3、

衡量一个人的领导能力的最好方法,就是看如果这个人休假了,他的下属在做什么。

优秀的产品经理和工程师可以休假一周,他管理的工作不发生任何问题。优秀的主管和技术负责人可以休假一个月。领导能力越优秀,休假的时间就越长。

--AwBwh[54],Fk的CEO

4、

阅读不会过时,除非写作过时了。写作不会过时,除非思考过时了。(Riw'iwiii,wiiw'ihikii.)

--PGh[55]

5、

简洁的写作需要勇气。让事物变小是一种深思熟虑的、困难的和有价值的行为。

大多数书籍本应是一篇博客文章。大多数博客文章本应是一条微博。大多数微博本应不写。

--《发布Nw35年的35条教训》[56]

历史上的本周中国需要成立半导体部(2022151)

互联网不再稀缺(202051)

鸣谢周刊得到国内新一代知识管理与协作平台FwU[57]的帮助,深表感谢。

FwUS[58]=文档+表格+网盘。你可以用它写文档、做主页、管理数据、存储文件等等。

每一期周刊同时发布在FwU专栏[59],欢迎大家也去开通自己的专栏和主页。

(完)

Rf

类案检索功能优化建议(二)——案卡改革

作者:上海市人民检察院陈漫卿

上文(观点类案检索功能优化建议(一)—开发路径辨析)提到,虽然可以通过解构案例来增加检索词,提高自主检索精准度,但是被动检索(类案推送)功能仍然受限于语义分析技术水平,导致匹配案例不准确、不可用。

且不止类案推送功能,目前量刑建议、证据校验等一系列司法热点功能应用的实现度,都受到语义分析技术水平的限制。如何破局?

解决困难的路径选择

提高语义分析精准度,有两条路径:

一是技术路径,不断提供素材强化机器学习、模型训练,等待技术水平突破。该路径的风险在于时间、效果均不可控,按照目前司法机关和厂商的合作开发模式,在选择初期很难辨别哪家厂商的方案、效果更优。

选择困难症

左右滑动查看更多

二是机制路径,通过进一步增加“人工”来提高“智能”。比如要求办案人员对自己在办案件涉及的法律适用、证据分析、量刑情节等提炼关键词,这样机器能很轻易的匹配到指导性案例中相同的关键词,以此提高推送精准的。该路径的风险在于增加了办案人员工作量,如果不能给予其更多的“好处”,办案人员没有内驱力提炼关键词,影响最终推送效果。

“人工”智能

第一幕

左右滑动查看更多

破局方案

以检察机关办案系统为例,我有一计“案卡改革”,可以在实现类案检索精准推送的基础上,同时减轻填录案卡工作总量,盘活检察数据资源。

案卡改革

检察机关的办案系统(以下简称“检察统一软件”)是全国四级检察统一办案平台,聚合了全国检察案件卷宗、文书等全量数据。

检察办案系统

检察统一软件设置了“案卡”、“人卡”(以下统称“案卡”),通过办案人员的填录,将案件关键信息转化为结构化数据,使检察机关汇聚了司法行业可用性最强、最全面、最细致的办案重点数据(目前只有检察机关是全国统一办案平台)

小知识

结构化数据和非结构化数据

结构化数据也被成为定量数据,是能够用数据或统一的结构加以表示的信息,如检察统一软件内案卡字段数据。当使用结构化查询语言或SQL时,计算机程序很容易搜索这些术语,因此对结构化数据的分析已经是一种成熟的技术。

非结构化数据本质上是结构化数据之外的一切数据,如检察统一软件内的电子卷宗、文书,都属于非结构化数据。相比结构化数据,非结构化数据更难搜索。针对这类非结构化数据,首先要通过一些规则、算法(如OCR、图文识别技术等)实现对非结构化数据的结构化处理,再加以深度的应用(如语义分析技术)。非结构化数据的结构化处理过程中,会存在不同程度的信息丢失,且在深度应用过程中,也无法达到100%的效果,这是当前普遍存在的技术瓶颈。整个过程中,无法完整还原非结构化数据的内容。

但案卡功能,长期以来也是最受办案人员吐糟的功能,因案卡字段繁多、填录不方便,目前对案卡数据的应用主要侧重统计分析、绩效考核等管理应用方面,对办案人员而言,大量的填录工作对其办案“没帮助”,没有“获得感”。最终影响案卡的填录质量。

案卡改革路线图

STEP1

案卡分类

我认为可以通过对案卡重新“分类”,解决目前案卡字段繁杂、填录不方便、容易错漏、不便管理的问题。

以一审公诉案件为例,目前检察统一软件对一审公诉案件审查环节(区别于案件受理环节)设置了审查起诉案件信息、审判活动监督情况、线索移交情况3张案卡、10张子案卡,共计183个字段;设置了犯罪嫌疑人、被害人2张人卡、8张子人卡,共计156个字段。一审公诉案件审查环节,共需填录339个字段(如果被告人、被害人人数多,字段数还会增加)。

以10张子案卡的分类为例:

案卡分类

从中可以看到,目前检察统一软件大致是以案件的不同环节(办理-审结-出庭)对案卡进行分类,但是多年以来又不断新增统计项,新增项并不能完全按照办案环节分类(比如“毒品犯罪有关情况”这张子案卡)。分类逻辑不清晰,使案卡变成案件信息“大杂烩”,造成填录不方便,办案人员要像“捉虱子”一样在繁杂的案卡中找到他的在办案件可以填的内容。

大杂烩之王

我认为对案卡的分类、排序,可以换一种思路。案卡的实质是对案件关键信息的标注,目的是为各种数据挖掘、系统应用提供基础。如果从应用场景出发,案卡形成的结构化字段,可以从其性质分类为“程序性字段”、“实体性字段”。

应用场景分类

程序性字段:是案件经历的各刑事诉讼流程信息、犯罪嫌疑人/被告人/被害人基本情况信息

实体性字段:是和案件定性、量刑有关的要素、案件的特殊情况、关注要素等。

字段分类举例

同样以一审公诉案件审查环节案卡为例,案卡人卡合计的339个字段中,属于程序性字段的(如诉讼程序的起止时间、强制措施情况等)258个,占76.1%;属于实体性字段(如案件性质、涉案金额等)的81个,占23.9%。

一审公诉案件办理环节案卡

综上,第一步需要做的,是改变原有案卡分类逻辑,整合全部案卡字段,统一分类为“程序性案卡”和“实体性案卡”两大类。对子案卡的设置,也要遵循业务属性内核。

STEP2

减轻程序性字段填录

目前程序性字段填录工作量最大,可以通过两种途径减轻填录工作量。

途径一

拓展案卡回填功能

今年上海检察机关参与了检察统一软件2.0版本的试点工作,其中在案件受理环节上线了“案卡回填”智能辅助工具,通过对公安机关移送的《提请批准逮捕书》、《移送起诉意见书》两份文书运用OCR识别及语义分析技术,系统自动抽取文书中的字段回填至相应的案卡中,目前实现了审查逮捕和一审公诉案件受理阶段70%的案卡及90%的人卡的自动回填,回填准确率分别为85%和90%。

案卡回填功能示例

我进行了初步梳理,如果案卡回填功能能进一步扩展回填的文书——如在一审公诉办理阶段增加回填《出庭通知书》、《刑事判决书》,则使用案卡回填该功能,可以自动回填69个字段,占程序性案卡总数的26.7%。

还有31个字段,和一审公诉办理阶段制作的文书(如《起诉书》、《补充侦查决定书》)相关,可在文书制作环节直接回填。

也就是说工作量主要集中在剩余158个字段,而该类字段大部分为非必填项,大多数为非常见、非必经流程的相关信息。

程序性字段分类

途径二

配套相关工作机制

程序性字段主要来源于程序性文书,直接照抄文书内容即可,该类字段主要服务于案件统计及流程管理类应用使用,对填录准确性、时效性要求较高。如果可以建立相关工作机制,如每个部门设置1-2名辅助人员专门负责本部门所有案件程序性案卡的填录,不仅大大减轻办案人员案卡填录工作量,案卡的准确性、全面性填录都有保障,更可以提高统计分析功能的准确性、案件流程管理功能的适用性。

工作机制图

综上,第二步需要做的,就是用“机器+人工”方法,通过案卡回填功能尽可能的实现程序性案卡字段自动填录,通过工作机制改革,将程序性案卡的填录工作由辅助人员完成。以此实现程序性案卡填录工作量的大幅度降低,同时又高质量的保证了统计数据的完整性、准确性。

STEP3

优化实体性字段填录

一审公诉案件审查环节的81个实体性字段,涉及案件事实、定性等方面,该类字段目前主要服务于阶段性专项工作统计使用(如对涉黑恶案件、电信诈骗案件的统计)。存在的问题一方面是无用性填录多,比如“毒品犯罪有关情况”这张子案卡,在非毒品类案件中也存在。另一方面该类统计主要服务于决策,对办案人员没有回馈,因此填录的内驱力低,造成填录不准确、数据不可用的问题。

因此,对实体性字段,重点是优化

优化一

实体性字段的设计

建议将实体性字段按照对相关业务有需求或相关应用有意义的字段进行分类,如专项统计的字段归类到【政策】类别,如案件定性的字段归类到【定性】类别,刑罚、量刑情节等字段归类到【量刑】类别。比如现有案卡字段“是否电信诈骗”可以归类到【定性】类别,在最大限度不增加案卡填录量的同时,科学的规划案卡字段分类。

科学分类

同时,符合业务逻辑的分类,有助于对案卡字段进行管理,可以定期删减不需要的字段项(比如专项统计字段),并建议增设“自定义”字段,可以让各省市根据实际需求,增加字段项,以减轻人工统计的工作量(让突如其来的临时统计工作能提前合理安排、能让系统至少帮助自动计数)。

优化二

配套实用功能,增加填录案卡获得感

如果办案人员的准确填录实体性字段,则可以获取类案推送、量刑建议功能的精准推送,填录案卡可以实实在在获得对办案有帮助的应用反馈。以此可以提高办案人员填录内驱力,形成案卡填录--功能应用的正向循环。

“人工”智能

第二幕

左右滑动查看更多

综上,第三步需要做的,就是通过对实体性案卡进行科学的分类、管理,一方面方便办案人员填录,一方面可以定期做好字段删减、新增,同时配套相关功能(类案推送、量刑建议),以增加填录的获得感,实现案卡填录--功能应用的正向循环。

我终于绕回主题了

本文论点

增加“人工”,提升类案推送功能精准度

i-CASE系统:解构案例--增加指导性案例检索词

案卡改革:填录实体性字段--增加在办案件检索词

——大大降低机器匹配在办案件和同类指导性案例的难度(检索词直接匹配,难度降低100%),实现类案精准推送

盘活数据资源

案卡改革还能盘活检察数据资源。检察机关是唯一一家全国四级系统使用统一的办案系统的政法机关,积累了宝贵的数据资源。

全国检察数据

以类案推送功能为例,如果案卡实体性字段设计的科学、符合业务规律,四级检察系统的案件就能形成内部的类案推送网(可以设置相应的推送规则,比如已刑事诉讼终结的案件可开放查看权限)。

全国首例

再进一步,如果将案卡标注和电子卷宗阅卷、文书改革相结合(本人关于电子卷宗阅卷的观点是部分案由适用,且一定要和文书改革结合!高度近视干眼症患者懂电脑阅卷的痛

那么检察统一软件将持续获取经过专业人员(检察官)标注的、可供人工智能学习训练的、刑事司法领域的深度学习素材。

数据资产

前文提到,按照目前司法机关和厂商的合作开发模式,在选择初期很难辨别哪家厂商的方案、效果更优。

但如果我们拥有了大量经过检察官标注的数据资源,在选择厂商的时候,我们就拥有了测试他们技术水平的“试金石”,再也不用“抽盲盒”了。

这样说太抽象,我们继续举个栗子。

凡尔赛系统

左右滑动查看更多

结语

用增加“人工”的办法来提升系统的“智能”化水平,听起来很“老土”,甚至是在信息化时代“走老路、走弯路”,但是如果运用的“人工”方法是符合业务内涵及系统应用逻辑的(比如前文ICASE解构指导性案例的方法),如果合理的规划“人工”的工作(比如本篇的案卡改革思路),这样的方法就不是简单的“增加”“人工”,而是基于信息化要求的对线下业务的科学改造。

再进一步,这种“人工”也是可推广的。如果更多的机关、机构加入解构案例,甚至指导性案例在发布初始就完整的提取文中的关键信息,司法案例知识图谱将会愈发丰富、持续成长。同样,对司法人员的在办案件打标注(案卡)的方式,如果在公安、法院、司法部门也得到采用,类案检索功能将有更广阔的应用场景。这样的一天,应用信息化推进同案不同判这一司法难题的解决,将不再是空想。