从法律科技看垂直行业数据智能(云合汇森底层技术及安全合规系列文章之4)
来源:汇森投资 | 日期:2022-11-26 20:49:05 作者:汇森投资 行研组 阅读次数:
汇森投资(Vision Capital)原创 10月1日,《中央企业合规管理办法》(以下称为《办法》)正式生效实施,在为央企探索合规体系建设提供制度保障的同时,也提出了更高的要求。 《办法》明确提出中央企业应该根据各自的实际情况,在企业里设立“首席合规官”,以便成为企业业务助力与合法合规之间的“强连接器”。 首席合规官在企业里是关键人物,要全面参与到企业的重大决策中,确保自己的合规管理职责到位、确保流程管控到位、确保合规风险防范到位、确保合规问题整改到位。还要完成《办法》第四章“运行机制”所要求的对企业内“合规、法律、内控、风控”四大体系的一体化建设。
首席合规官要将合规要求数字化,并内嵌到企业的业务流程中,以进一步明确相关条件和责任主体,在业务运营中针对关键节点加强合法合规性审查,强化业务管控。
据媒体报道,在央企中,中国铁建所属46家主要二级单位已全部设立合规委员会、任命首席合规官。全系统(含项目部)已任命合规官10650人。首席合规官的变动,专兼职合规官的增减均需报上级单位审批,最大限度保证队伍的稳定性、人员的专业性。
在数字化技术的加持下,《办法》的实施与首席合规官的正式设立强化了央企合规管理,让2022年真正成为企业“合规管理强化年”的同时,也标示着“法律科技”的发展进入到一个新的阶段。
01 从“手艺”到科技
讨论法律科技的行业背景,可以从全球法律行业的发展和国内全面依法治国的时代背景两个层面来看。
站在产业的角度来看,法律行业的业务特点是围绕知识、智力资本和关系组织展开,而不是实物商品、制造和供应链。法律行业的从业者主要利用其特定领域的专业知识和集体经验为其客户提供有价值的见解和建议。
换句话说,法律专业知识就是法律行业服务商和用户最宝贵的资产和技能。在竞争日益激烈的环境中,法律行业服务商们不断寻求基于其专业知识和智力资本的差异化,获取、编纂、存储并不断优化、补充专业数据和专业认知是一项至关重要的优先事项。
这一特点反过来也构成了法律行业数字化过程中的诸多“痛点”。
痛点之一,由各种法律规章制度信息构成的非结构化数据基础异常庞杂、艰深,而且还在不断增长。
近十年来,我国新制定法律68件,修改法律234件,通过有关法律问题和重大问题的决定99件。与上一个十年相比,新制定的法律数量增加了三分之一,修改的法律数量增加了近2倍,通过有关法律问题和重大问题的决定增加了1.5倍(数据来源为2022年4月25日中共中央宣传部“中国这十年”新闻发布会)。
在美国,其法律和监管的环境同样更为复杂多样,法律的适用范围越来越趋向广泛化、不透明化。企业在组建、运营的过程中,面临着各种合规要求,由企业所在的行业属性、地理位置、雇主类型这些更加细节化的因素来决定,这就更进一步加深了合规复杂度。而且,这种复杂度还在不断地动态变化和放大。
有机构预测,未来三年企业在法务、合规、合同中创建的数据量将超过之前30年创建的综合。这种数据爆炸甚至使标准的法律问题更趋复杂化。
痛点之二,如果要在数据基础之上产生洞察,很大程度上依然要依赖于经验丰富的顶级律师/法务人员的“手艺”,不管是服务商还是用户,都希望能够借助更多智能工具通过相关系统和应用程序的集成,完成跨职能流程,从而降低成本、提高效率。
从某种程度上说,法律行业如今依然处于手艺人的阶段。专业律师领着高昂的薪水,如同那些大师级工匠一样,为自己的客户打造个性化的法律意见或建议。初级律师就像学徒,口袋里微薄的收入与手头上繁复、单调的初级工作不成正比。
而一名专业律师的高昂费用,往往也会让客户方的企业难以承担。沃达丰集团的总法律顾问曾表示,请律师的费用高昂得令人难以承受,“如果像我们这样的大公司都认为很昂贵,就更无法想象其他企业和个人如何能够承受。”
法律科技可以将法律法规中的大部分业务和流程都实现数字化、智能化、工业化,从而达到降低成本、提高效率的目的。
行业内对于法律大数据和人工智能已经有了不同程度的研究和应用。如法律相关的机器学习、大数据处理(数据治理、整合、挖掘等)、自然语言处理、内容识别、法律知识搜索引擎、智能文本处理、类案推荐、案情分析、案件判决预测,以及基于区块链技术提供法律服务等。
基于以上技术,结合具体业务需求为客户提供法律服务,如知识检索、合同审批、辅助执法办案等等成为技术发展趋势。
在法律行业的自有特点之外,国内全面依法治国的时代大背景同样给法律科技的发展提供了强有力的驱动。
2021年1月,中央印发《法治中国建设规划(2020-2025年)》,该文件作为新中国成立以来第一个关于法治中国建设的专门规划,是全面依法治国的纲领性文件。该文件不但对立法、执法、司法和守法等领域的建设进行了全面覆盖,而且明确要求加强科技和信息化保障。充分运用大数据、云计算、人工智能等现代科技手段,全面建设“智慧法治”,推进法治中国建设的数据化、网络化、智能化。
在顶层设计之下,各类法律生态参与主体的任务就是如何主动适应法治时代的新要求。
比如在立法方面,要求完善备案审查程序,加快建立全国统一的备案审查信息平台;执法层面,强调推进统一的行政执法人员资格和证件管理、行政执法文书基本标准、行政执法综合管理监督信息系统建设;司法方面,要求法院系统要确保2022年底基本建成、2025年底全面建成以知识为中心的法院信息化4.0 版,等等。
企业法务的要求也在发生转变。比如更重视从事后救济向事前预防、事中控制转变;要求企业法务为经营赋能的诉求愈加强烈,需要法律服务更深入、宽泛地渗入进企业业务经营的方方面面。
最近几年,互联网、消费、教育、金融等很多行业均已进入强监管周期,企业需要增强在复杂和高度监管的市场中进行规模经营的能力。尤其对于央企国企来说,最近两年连续出台的多部关于企业内控的法律法规,开始倒逼企业主动寻求法务(合同)、业务、内控、合规等“四位一体”的数字化管理工具,像国家电网、国家管网、中石化等央企都已经制定了这方面的具体制度和规划,并开始推进管理工具的数字化、智能化升级。
总体来说,目前我国正加速推进全面依法治国,但在法律信息爆炸、法律知识蘩芜、法律需求激增而法律适用规则、法律争议调处、全民守法能力之间存有明显差距,市场亟需应用科技完成更准确更便捷的输入和输出、知识生产和应用、服务匹配和评估。
02 上市公司与独角兽
其次,功能分类上看,我们从Stanford Codex收录的法律科技(LegalTech)公司目录中,将近2000家法律科技公司分为了七类:
从不同分类的公司数量可以看出,大多数公司所做的都还处于法律信息的采集、加工处理,以及业务自动/半自动化管理的环节上,在业务智能化分析环节上还需要更多的入场者。
此外,从终端用户的角度,还可以分为ToB(包括律所)、ToG、ToC等几大类。
从资本市场来看,2021年可以被看作是法律科技公司上市最忙碌的一年。
之所以这样说,是因为在海外资本市场上自Docusign于2018年上市后,之后的几年间鲜有法律科技公司上市。但这种情况在2021年彻底改变。
从2020年底上市的Nuix开始计起,在2021年内先后已完成上市的法律科技公司有Legalzoom、CS Disco、Intapp。已经计划在今后2年内IPO的法律科技公司则有Evisort、Ironclad、Elevate、Exterro。
(数据来源:Crunchbase)
并购咨询公司JEGI Clarity的负责人表示,与2019、2020年相比,2021年一级市场与二级市场资本在法律科技行业中投入的资金总额“显著增加”。这一系列频繁的资本动作足以证明法律科技行业在快速增长之后,正在走向成熟阶段。
根据数据调研机构Statista 2021年的调研报告,全球法律科技市场收入自2019年以来一直保持稳定增长,预计在2025年将达到252亿美元的市场收入。
03 底层数据与智能应用 美股法律科技公司Intapp在其上市招股书中表示,其竞争优势主要得益于过去公司在过去20多年中获得的深厚的专业知识积累,“客户看重我们可扩展平台的差异化行业专业知识、专用功能、全面的端到端产品、数据驱动的 AI 洞察力和行业品牌”。 简单来说,法律科技类公司的主要竞争壁垒建立在其产品架构的两个层次上。其一是底层的法律知识数据库,其二是数据库之上的智能应用产品矩阵。 首先来看法律知识数据库的构建。随着软件工具在运营中的普及使用,以及基于云端近乎无限的数据存储的可用性,底层数据库的重要作用越来越突显。“数据是任何企业组织最强大的资产。”即将IPO的法律科技公司Exterro的创始人Bobby Balachandran曾表示。
据透露,北大法宝的通用数据库与专项数据库合起来共有29大数据库,总数量超过了3亿条,既有司法案例(1.36亿),也有企业信用数据(2亿),还有335万条法律法规数据。其中,约有20%的数据内容是行业内的独家内容。
目前,北大法宝法律数据库的品牌和市占率均为国内领先,用户复购率在90%以上,可以算是国内法律科技领域事实上的信息数据基础。
北大法宝法律数据库能够取得今天的行业地位,其成长路径其实很难复制。核心在于北大英华公司本身依托北大法学院学科优势,拥有国内最专业最强大的研究团队。核心创始人兼总经理赵晓海是国内第一批从事法律检索与信息技术科研及成果转化的法学专业人士。早在上世纪90年代即主持开发了“中国法律检索系统”、“中国科技法制信息系统”,并陆续首创国内法律信息检索系统“北大法宝”法律数据库,首创国内专业法律信息网站“北大法律信息网”和国内专业英文法律信息网站“北大法律英文网”。
专业的知识深度加工团队负责内容生产,再加上过去二十年的持续积累,后来的竞争者很难超越。
而且,北大法宝数据库还不断与时俱进,持续优化创新。
比如在2022年,为充分响应国资委管理办法的要求,北大法宝就专门打造了一款服务于企业的合规数据库产品-北大法宝合规智库,囊括符合企业业务的法律法规库、合规清单库、司法案例库、行政处罚库、合规实操库和合规风险库六大子库功能。
其中的“合规清单库”,整理了市场交易、安全环保、产品质量、劳动用工、财务税收等13个重点业务领域的相关法律法规,并从合规义务、违规责任维度对法律条款进行标记,形成2万+外部合规义务清单数据,同时可结合企业业务特性、岗位职责进行义务清单的快速配置,第一时间进行法律法规变更提醒,预警合规风险;“行政处罚库”则基于专项合规领域提供行政处罚数据,设置多种聚类维度,为企业提供更加便捷的专业信息服务;“合规实操库”为企业提供丰富权威的合规实操相关资料,内含政策专家解读、合规实务指引、合规审查指引等资料;“合规风险库”收录了合规重点业务领域风险清单,划分合规风险等级,提供各风险点与知识体系关联,及具体风险行为智能综合测评。
美国法律科技公司Elevate提出,公司的愿景就是通过在自己的平台上,为企业提供跨多个服务领域的产品矩阵,来实现法律科技服务的模块化。公司创始人Liam Brown坚持要让客户“可以像在百货商店一样”来选择各自所需的服务模块。
公司的核心团队除了有律师、行业顾问和业务专家外,还有大量IT工程师,这让Elevate成为一家高度技术化的公司。Liam Brown想让公司可以像高科技公司思科那样的模式来帮助企业实现法律法规所有业务的数字化。公司除了自研之外,还不断通过并购策略来推动自身成为一家“一站式”的综合法律服务提供商(曾在一个季度内并购了五家企业)。
在整体布局中,Elevate已经构建出一种通用的底层数据模型和一种通用的机器智能算法模型,以及面向客户的工具可视化仪表板。旨在让自己的产品矩阵成为法律业务的操作系统(“Legal OS”),目前其产品线涵盖了从法律咨询、合同合规审查到全生命周期管理,再到法律服务托管的几乎所有内容。
在国内,像北大英华等公司,也早已开始基于数据库底座,依托大数据、人工智能、知识图谱、风险透镜等新技术手段,推出了多方式检索、法宝联想、法规变迁、案例可视化、智能报告生成、智能引注、数据统计与分析等诸多新产品功能。
早在2017年,北大英华就与北京大学法学院等机构成立了北京大学法律人工智能研究中心,致力于对法律大数据和人工智能做更深入、广泛的研究,并把研究成果结合具体的业务需求与应用场景,为客户提供诸如知识检索、合同审批、辅助执法办案等方面的法律服务。
目前,北大英华已经推出了智能法务平台、智能立法平台、智能执法平台、智能司法平台和公共法律服务智能平台等系列产品。
其中,“智慧法务平台”将法律知识库、行业案例数据等大数据与法务管理过程有机融合,为企业定制化提供以合同管理为核心,包含纠纷案件、规章制度、授权委托、法律风险、合规审查等内容的法务管理解决方案。
目前,北大英华公司的智慧法务平台已为航天科工、中国电科、中国石化、国家管网、国家电网、中国大唐集团、中建科工、深国际、福建港口等数十家央国企客户提供服务,并在加速研发相应的SaaS版工具向中小型企业市场快速推广。
在“智慧立法平台”方面,北大英华一方面深耕立法领域、扎实研究立法智能化产品,另一方面深度参与“十四五”国家重点研发专项课题,利用课题研究成果将立法产品带入新的高度。
北大法宝智能立法辅助平台服务于立法的立、改、废、释、编纂等业务需要,辅助起草、备案、审查、清理等工作,有十大立法业务系统,辅助立法者作出决策。平台通用版为立法工作人员提供符合立法业务普遍需求的在线产品,含有智能起草、智能审查、版本比对、格式生成、一键清样五大智能辅助工具。平台定制版可根据用户的要求定制开发并私有化部署,为用户提供符合个性需求的产品形式。平台目前已应用于三十余家用户,涵盖国家部委、省市人大、省市级司法厅局、高校和研究机构等,其中省级人大立法平台的应用率占80%。
北大英华参与的“十四五”国家重点研发计划“立法公众意见综合分析与法律条文智能审查技术研究”,与北京大学、北航、706所等共同研究攻克起草智能辅助、合宪合法智能辅助等课题,并将在司法部、环境保护部、广西司法厅落地应用。北大法宝智能立法辅助平台将利用课题最新研究成果,在算法、技术、设计等方面不断迭代升级。
另外,在2022年热度最高的央企合规领域,北大英华也着力加强打造了一个“企业智能合规管理平台”,提供合规信息智能推送、合规风险感知等功能。
04 垂直行业数据智能 如上所述,法律科技项目就像财税、知识产权及科技情报服务等类项目一样,都可以归为基于垂直行业内非结构化数据的数据智能(或知识管理类)项目。 在过去十数年中,全球各个垂直领域的非结构化数据量呈指数级增长,对非结构化数据进行有意义的过滤、分析和整理成为各类专业用户的迫切需求,这些信息有助于全球企业、学术机构和政府做出关键的运营和战略决策。 这些项目在资产构成、生产模式和商业模式上都有很强的独特性,值得投资机构给予更多关注。 从资产构成来看,这类项目基本都拥有一类很重要的、相对独家的“行业数据资产”。公司拥有数据所有权,是真正的数据资产(用户只有使用权),是在做资产评估时需要列入的一类新资产;相比之下,其他一些数据智能项目,他们主要通过自己数字化工具帮助用户处理其结构化数据,所有数据基本都来自用户自己的业务数据,只有用户自己拥有数据的所有权和使用权。 从生产模式来说,这些项目作为不同垂直领域的关键信息与知识主导供应商,通过信息采集,信息加工,数据服务及应用智能化三大环节,解决信息递增与信息应用速度间的根本矛盾,可以实现从“人找信息”到“信息找人”,实现从“找得准”到“用得好”。 这个生产过程虽然在越来越“AI”化,但迄今依然无法完全摆脱人类专家的主导。这种情况未来有可能会被改变,但目前却也是这类项目的一大壁垒。因为一群最专业的人+十数年的知识沉淀,这本身就是其他后来竞争者很难跨越的一个高门槛。 从商业模式来说,这类项目的营收构成往往可以分为两大部分,一是基础数据库的订阅使用费用,二是数据库和算法库平台之上的智能应用服务费用。其中,前者作为营收基本盘,属于预付费业务,续订率会陆续趋于稳定,现金流非常良好;后者则成为带动企业到一个新阶段的“第二曲线”。这种业务构成的好处是,既相对稳健又有想象空间。 在这种营收结构的支撑下,这类项目在一二级资本市场中无疑会有更积极、更多元的选择。 【END】
投资案例