OFD版式软件的中国传奇(云合汇森底层核心技术系列文章之三)

来源:汇森投资 | 日期:2022-08-16 19:05:22 作者:汇森投资行研组 阅读次数:


0-2.png


“数字文档是未来工作的核心。PDF 和文档工作流程使得个人和大型企业能随时随地高效工作。我们为 Document Cloud 产品市场空间将在 2024 年增长至 320 亿美元而感到兴奋。”

2021年底,在Adobe公司2021 年第四季度财报电话会议上,其首席营销官兼企业战略与发展执行副总裁Ann Lewnes 这样说。

该公司的数字媒体业务总裁David Wadhwani 在其后也透露:“(市场)对 PDF 的需求从未如此强烈。事实上,在过去十年中,针对PDF 的网络搜索量翻了一番,我们认为其原因是 PDF 已成为非结构化数据的事实上的标准格式。PDF 也一直是企业间协作的事实上的标准,……这使得 PDF 成为任何业务工作流程现代化的重要组成部分。”

从业务数据上看,Adobe的确在包含PDF产品在内的文档云产品线上收益丰厚。

在整个Document Cloud 方面,Adobe在2021年的 ARR 增长了 31%,最终达到 19 亿美元;其PDF等文档应用程序安装在超过 25 亿台设备上;仅在过去 12 个月内,通过Adobe的产品就打开/创建了 3200 亿个 PDF文档。

不仅如此,Adobe还在三个方面继续升级产品,比如集成电子签名功能(其Acrobat 中的 Adobe Sign 交易量在2021年同比增长了 85%);通过基于 AI/ML 的提取功能帮助将非结构化数据转换为结构化的可操作数据;通过 PDF 和 Sign API 解锁业务工作流程,让开发人员能够构建文档自动化解决方案,从而改变企业的业务运作方式。

无疑,Adobe还在续写他的传奇。而在国内市场中,正像微软Word之于金山WPS这样的故事一样,一直以来,很多人也在继续探究另一个问题——有Adobe这样的公司珠玉在前,国内对应的文档办公软件赛道是否还有一些值得期待的新机会呢?

就在2022年2月22日,国务院办公厅刚刚印发了一份《关于加快推进电子证照扩大应用领域和全国互通互认的意见》(以下简称《意见》),就进一步加快推进电子证照扩大应用领域和全国互通互认,实现更多政务服务事项网上办、掌上办、一次办,进一步助力深化“放管服”改革和优化营商环境作出部署。
《意见》提出的“工作目标”是要在2022年底前,全国一体化政务服务平台电子证照共享服务体系基本建立,电子证照制发机制建立健全,企业和群众常用证照基本实现电子化,与实体证照同步制发和应用,在全国范围内标准统一、互通互认;电子证照在政务服务领域广泛应用,社会化应用取得积极进展,“减证便民”取得明显成效。到2025年,电子证照应用制度规则更加健全,应用领域更加广泛,支撑政务服务标准化、规范化、便利化取得显著成效,进一步方便企业和群众办事。
《意见》提到了三种典型应用领域。一是个人电子证照应用领域。加快推进出生医学证明、户口簿、身份证、社会保障卡、学历学位证、职业资格证、驾驶证和新申领的结(离)婚证、不动产权证书、不动产登记证明等个人常用证照电子化;二是企业电子证照应用领域。推动营业执照、生产经营许可证、检测认证等电子证照在企业登记、经营、投资和工程建设等高频政务服务事项中的应用,并进一步拓展到纳税缴费、社会保障、医疗保障、住房公积金、交通运输、公共资源交易、金融服务、行政执法、市场监管等领域。三是更多社会化应用。在不断推动电子证照在政务服务领域广泛应用的同时,依托全国一体化政务服务平台电子证照共享服务体系,围绕合同订立、人员招聘、交通出行、文化和旅游等场景与领域,积极推动电子证照在企业、社会组织、个人等持证主体之间的社会化应用。
为了保障电子证照各项应用的顺利展开,《意见》还要求,业内相关部门要加大新技术运用力度,积极开展电子证照应用创新。加快推进大数据、云计算、人工智能等新技术应用,不断提升电子证照应用智能化水平。

《意见》中没有明确提到的一点是,电子证照的普及使用背后,其实还离不开一项技术工具——国产OFD版式文档软件,也就是本文的主角。


01

源流与生态



一般人对严格意义上的“版式”办公软件并不了解。

多年来,Office软件即流式办公软件就是办公软件的代名词。其实,严格来讲,所谓“办公软件”包含了流式办公软件、版式办公软件、签章软件等不同的产品。
这几种产品的主要区别是:流式软件主要解决文字编辑、表格计算和展示交流等工作需求,版式软件主要为了解决电子文件交换问题、与设备无关的、版面呈现固定效果的版式文档软件。这两种软件出来之后,又出现了针对流式办公软件和版式办公软件生成的文件进行电子签名的签章软件,以保障文件的真实性和完整性以及签名人的不可否认性。
其中,流式办公软件大家使用率最高,包括常用的文字处理、电子表格、演示文稿三大组件,部分厂商还提供流程图、简易数据库、公式等组件,其生成的文档常用于持续编辑修改。
版式办公软件支持的常见格式包括PDF(Portable Document Format的简称,意为“便携式文档格式”)和OFD(Open Fixed-layout Document的简称,意为“开放式版式文档”),从功能上大致分为生成和阅读两类,其中生成类用于产生PDF/OFD文档,阅读类主要满足用于对已有文件的阅读、处理和利用等用途。
站在整个IT领域中来看,版式办公软件的发展绝对称得上“源远流长”。
上个世纪的1993年,对整个办公软件市场来说,是一个非常重要的时间点。在这一年,微软将电子表格产品Excel 5.0和Word 6.0集成在办公套件Office 4.0内,这一集成实现了数据共享,极大地方便了用户的使用。同年,Adobe公司推出PDF电子文档(最初主要面向文件打印和印刷需求),由于格式的“公开”特性,很快获得产业界的广泛支持。
此后在2007年,PDF1.7被ISO正式接纳为国际标准,Adobe公司在主导版式文档产品标准和商业化运作方面已经独步天下。
为了与之抗衡,微软则从2007年开始推出XPS(XML Paper Specification)格式,并在Office2007、Vista、IE7等产品中提供内置支持。但从实际市场地位来看,虽然这个XPS格式曾于2009年被ECMA组织(一个以企业为主要参与方的国际标准组织)接纳为标准,但其抗衡PDF的预期目标远未达成。 
2017年,ISO公布了作为最新PDF规范的PDF2.0。更新后的PDF增强了文件的安全性,体验也更好了。


1-2.png


与国外办公软件的发展次序一样,我国在上世纪九十年代之前,主要是流式软件。
这个阶段中广为流传的故事是,求伯君用了128万行非常接近计算机语言的汇编语言写就了WPS1.0,让中国用户可以在英文字符界面的DOS系统下创建、编辑和输出中文文档,也让整个计算机时代拥有了中文办公软件的位置。1988年问世的WPS,迅速占据了国内90%以上的市场。
直到在2000年前后,国内的书生、方正等公司陆续研发出SEP、CEB电子文档技术,开始对标Adobe的PDF电子文档,但后期发展并不乐观。
2010年前后,国家软件版权保护政策连续落地,并开始自主版式文档标准的编制工作。
随着OFD在党政机关电子公文、电子证照、电子档案等领域得到推广和应用,大量拥有技术储备的企业开始应用该标准。2016年,OFD作为国家标准(GB/T 33190-2016)正式发布。我国电子公文、电子发票、电子证照等领域应用的由此开始加速发展。
总起来看,版式文档软件发展到今天,在全球范围内可以分为PDF和OFD两大生态。
在我国以外的全球市场中,PDF占有支配性的市场地位。参与PDF技术研发的公司众多,据统计有1000多个PDF相关的软件产品或开源项目,龙头老大公认非Adobe莫属,他是全球最大的PDF电子文档软件产品提供商,是事实上的标准制定者,在全球范围内具备极强的统治力。但该公司在2014年12月,关闭了中国的研发分公司,只保留了销售部门。
PDF之外,OFD的整个生态目前主要体现在我国的国内市场。主要参与者是福昕鲲鹏和数科(2020年由金山办公收购控股)等几家公司,Adobe、微软等国外厂商暂未参与。
与PDF相比,OFD的市场虽然不是全球性的,但从技术水准来看,OFD版式软件应该是国内ICT领域与国外差距相对较小的产品之一。OFD跟PDF相比,结构清晰、体积小巧、扩展性强、安全度也更高;主流OFD版式产品在架构设计和用户体验上已经可以与国外成熟的PDF产品比肩,而且已经实现了对OFD和PDF的双支持;在文件渲染、打印、批注等方面,国内产品技术基本已经赶上来;此外,国内OFD产品还具有国密支持、无缓存阅读等特色技术,相较国外产品已经具备了一定优势。

02

技术到应用



OFD版式文档软件在应用端看上去很普通、很基础,其实涉及到的核心技术并不少。

简单来说,版式软件主要涉及到文件解析生成、图像处理、精确渲染、文档优化、安全、手写以及自然语言处理、行业融合应用等多项核心技术。当然,不同厂商掌握的程度并不一样。 
其中,文件解析生成技术最为基础,负责对各类主流办公文件进行解析并进行格式转换技术包括DOC/XLS/PPT/WPS/PDF/CAD等各类格式,支持主流版式格式间互转,也包括基于虚拟打印的版式文件生成以及模板合成等。
像文档优化技术则致力于用最小的体积、保存尽可能多的文档内容,同时要满足存档要求,例如MRC技术、证照模板设计进阶等;安全技术包括国产密码技术应用,集中于数字签名和加解密,为脱离系统的文件提供真实性认证和机密性保护;手写技术要适配各类手写设备,与数字签名结合,保证签批内容安全可信。
此外,通过自然语言处理技术,还可以实现对版式文件的深度分析处理,包括高效中文分词、文本相关度计算、关键词自动标引等;行业融合应用技术,主要是指在版式文件中嵌入图纸信息、3D零件信息、地图信息,嵌入BIM、CIM和制造等信息。 
在核心技术之上,OFD版式文档软件厂商的扩展和成长路径并不复杂,因为在办公软件领域中,已经有不少公司(比如微软、金山)在前面趟过路、打过样了。
简单说有四点。第一是把核心产品做好,打好根基;第二是扩展产品线,包含自研和收购,同时推进有机增长和无机增长;第三是基于行业场景打造解决方案,可视为对版式软件核心技术的二次封装和深度场景化定制,最好能封装出新产品;第四是打造开发平台,推出各种API和SDK,打造自己的产业生态。

以上每一层做法,在最终营收层面都有相应的增长曲线。

在应用层面,目前最大的行业背景之一就是信创。办公软件作为使用频率最高、应用范围最广的核心基础软件,在国内的信创经济中,地位非常关键。


2.png


目前,主流OFD版式产品通过批量转换技术,可以实现大量数据的转换处理和再次加工。在公文、档案、证照、票据、合同和病历等应用中已经得到较多的验证,相对成熟。具体到信创领域,应对电子公文的生成、阅读、利用、归档和防扩散等场景也都有大量案例。 

从整个信创的推进进度来看,行政办公电子公文已经从2021年开始大范围落地。2022年,党政信创正在加速向区县一级渗透,电子政务信创市场将逐步启动。据机构测算,十四五期间区县信创PC替换量将达到省市级2-3倍,这也将推动与PC相关的办公软件需求持续提升。

在党政信创之外,行业信创也在逐步落地,有望与党政信创形成共振。

比如早在2020年,国资委就提出要求135家央国企要完成办公等系统的替代,2023年完成20万台,每家央企的需求量可能都不会低于3万台(套)。另外,金融信创二期在2021年已经扩容到198家试点机构;2022年,剩余4000 家金融机构试点有望启动,整体建设有望在 2023 年完成。相关厂商正在迎来利好。

在信创之外,OFD软件厂商结合行业场景进行的产品方案创新,也孕育着更大的市场空间。

从本质上说,就像IT运维软件(从IT工作流覆盖到业务工作流)、财税合规软件(业财一体化)的演进一样,办公软件也正在从办公场景溢出、覆盖到更多的业务场景。这是IT工具的一种进化,也可以是视为一种回归(工具最终还是要服务于业务本身)。

眼下,无论是PDF还是OFD,还有两个进化方向不容忽视。

其一是产品功能一体化、向综合解决方案演进。 

具体包含两个层面。首先是流版签一体化,这会给用户带来更大的便利与效率提升;其次是单一产品向综合产品解决方案演进。用户场景从集中办公延伸到移动办公、分布式办公,产品形态相应的也从桌面工具向网络协作办公解决方案(云-端组合)转变。针对不同行业、不同场景的需求,通过融合邮件、音视频会议、日历等应用,形成相应的解决方案产品组合。 

其二是AI智能化。

跟其他IT领域一样,办公软件领域如今的一大趋势也是和云计算、大数据、AI技术不断融合。2021年8月,Adobe 宣布推出两种新的 “云API”,这两种API可以帮助用户分析扫描原生PDF的结构并提取其中所有元素,包括文本、表格数据和图像,并了解跨列和分页符的相对位置和阅读顺序。企业用户由此可以快速准确地提取数据,用于机器学习模型、分析、索引或存储;使用机器人流程自动化 (RPA) 和自然语言处理 (NLP) 等技术自动化下游流程;以及跨不同媒体重新发布 PDF 内容。


03

更多投入,更大空间



客观的说,在国内市场,OFD目前已经可以与PDF分庭抗礼,并在不少层面占据一定优势;但如果从全球文档/生产力工具软件的层面来看,显然还要继续投入、继续赶超。

重点之一是坚持在核心技术上进行投入。面向未来,AI人工智能、区块链、3D/VR/AR等技术都在加速与生产力工具融合,我国企业依然需要发力狂奔。

重点之二是继续完善生态。OFD整体产业发展时间毕竟还比较短,除了与流式办公软件的对接之外,与上游软件的衔接仍然是不够的,对图像处理、CAD、CAM和地理信息系统等行业应用还有待继续开拓。在生态中建立足够的连接,将意味着更丰厚的市场替代机会。

重点之三是应用继续引导升级。首先,今天国内还存在大量的非标准格式公文,在项目实施过程中未能统一转换为国标OFD格式,造成了信息资源的巨大浪费;其次,虽然现在各种信创的确已经把OFD系统带进去了,但现有电子公文处理系统、数字档案管理系统中还是有很多只是停留在将OFD当影像使用的层面,仅将OFD作为TIFF或PDF文件的替代品,对OFD中的特色功能和技术特性,无论是认知还是真正使用都是不足的。

在今天的企业服务、软件赛道中,包括OFD版式文件在内的文档办公软件以及泛生产力工具软件还有一个值得强调的特点——兼具2B产品和2C产品两种特性。这类产品一方面具备对组织内外工作场景、行业场景的支持,另一方面还有具备消费类产品特有的指数级增长、网络效应等特点。

这一特性也使得这类产品的未来成长性有了更大的想象空间。

最近两年来,随着疫情的发展,组织、个人的工作方式和生活方式都发生了很多变化。在办公软件以及泛生产力工具软件领域,需求和供给都迎来一波爆发增长。

研究机构Gartner就认为如今社交软件和工作场所协作市场正在呈现一种碎片化的态势。Gartner研究副总裁Craig Roth表示:“市场尚未成为赢家通吃的市场,这不但为创新创造了机会,而且将扩大每个子市场的规模。”  

在需求层面,在疫情中,国内某地产巨头IT部门高管层在朋友圈里就表示:“这次疫情带来的变化使得像远程会议等移动办公平台得以在企业大规模普及,产业互联网的重心逐渐开始从IT基础设施领域转向企业内部价值链的组织管理和业务管理。这也意味着中国互联网下半场的产业互联网进入发展的全新阶段。由‘产品’进化到‘人’,再进化到‘行为’,由用户需求定义产品,用户行为定义服务”。

在供给端,美股SaaS云计算公司Box首席执行官AaronLevie在2019年曾写过一篇文章,名字叫做 “企业IT的新时代”。

为什么他认为企业IT现在到了一个新的时代呢?他认为如今企业软件的供给端跟过去已经大不一样。整个云计算的市场规模很大,但跟上世纪90年代不同,如今的企业IT不会被少数几家供应商所控制。过去一直没有得到解决的问题,如今开始有越来越多创新企业提出更有针对性的解决方案。

比如远程音视频市场,有了宝利通、思科/Webex在前面,很多人一度都以为这个市场没机会了。但来自山东泰安的Eric Yuan在美国创建了ZooM,凭借极度专注和简单的用户体验,2019年成功IPO,市值高达数百亿美金。这是一个从所谓成熟市场中挖掘新机会的典型例子。

完全创建一个新工具品类的例子也有。比如同样是在2019年直接上市的Slack,创始人一直宣称要灭掉电邮,被认为重新发明了实时通信和工作流程自动化。

换句话说,过去我们通常使用某些产品套件中的功能模块来实现某些业务(典型例子就是微软),但现在,很多细分领域都在陆续出现一批争当“同类最佳”的办公/工作工具,其规模和潜力也都很大。

从这个角度来说,无论是OFD版式文件本身,还是国产生产力工具的更多新品,都是非常可期的!


【END】


公司动态
交易新闻
行业洞察

投资案例

中兴智慧

中兴智慧

中兴智慧(曾用名“博易智软”)是一家拥有大数据、数据挖掘、数据分析、数据应用等的新一代信息技术,致力于为客户提供先进的数据软件产品和全面的数据解决方案的企业数字化转型软件商和服务商。


博科资讯

博科资讯

国内知名的全程供应链管理软件产品与应用方案的提供商,独创无码开发技术Yigo语言。

百应科技

百应科技

国内专业的AI解决方案提供商,国内首批将人工智能和大数据技术应用到商用领域的公司之一,作为中国智能营销领域的开创者,目前已有超30000家企业客户,其中包括阿里巴巴、腾讯、百度等行业巨头。

标贝科技

标贝科技

智能语音交互与AI数据服务专家,以“语音连接场景、数据服务技术”为理念,打造有温度有情感的声音体验,个性化、场景化的语音交互体验,让人机交互变得美好、生活变得更简单。

北大英华

北大英华

中国最大的法律信息与知识内容供应商。公司拥有目前最成熟、专业、先进的法律信息全方位检索系统。由北京大学投资控股,北大法学院主管的高新技术和软件企业。


广州印芯

广州印芯

全球领先的智能机器视觉识别硬件解决方案商,为客户提供视觉识别微光学系统组件及芯片的设计服务。

炬光科技

炬光科技

国内实力最强的高功率半导体激光器品牌,被中国光学学会激光加工专业委员会授予“高功率半导体激光器产业先驱”称号。