校园“云”协作的整合扩展
面对大量非结构化文档,为了方便用户快速搜寻到相关文件的位置,在私有云协作系统中,整合了文本挖掘过程中的预处理分词技术。在具体选用中,我们选择了IKAnalyzer这个开源的基于Java开发的轻量级中文分词工具包,它包括IK AnalyzerForLucene接口单元、IK Segmentation主分析器、词元处理子单元、词典配置管理模块和扩展配置管理单元这几个模块。该工具包自带的主词典拥有27万左右的汉语单词量,且提供了通过API或IKAnalyzer.cfg.xml配置文件对词典进行扩展,还可以配置自己的扩展停止词字典,这样某些不用解析的字就不会体现在分词结果上。
实现流程如图3所示,首先实例化一个IKAnalyzer分词器,然后建立内存索引对象RAMDirectory,将配置写入索引IndexWriter。在后续的搜索过程中需要实例化搜索器,最后用构造的Query对象在搜索器中进行搜寻,可依次搜索到相似度最高的指定条数的记录。
图3 搜索实现流程
我们还在该私有云文档系统内部集成了对学校Blackboard教学软件平台的支持,该平台是以课程为中心的网络教学环境,在国际国内各高校有着广泛的应用。通过扩展Blackboard的BuildingBlock,实现了校园教学网和文档协作系统的整合。可以方便地将文档系统中的教学资源课件及课程视频等文档发布到教学网相关课程中;通过在BB中增加模板,也可将教学系统中的文档同步到文档协作系统中去。通过系统整合,既丰富了私有云文档系统的内涵,又很好地提升了我校教学网中师生间、院系间和学科间的交流与协作功能,提升了学校教学信息化的整体水平,同时也方便了学校和院系加强教学质量监控。
我们在整合过程中使用了Building Block开发组件,该组件可实现Blackboard与外部系统的集成。它能作为课程和用户工具集成到课程首页和课程用户工具面板中,也能作为系统管理员工具集成到系统管理员面板中。组件本身基于servlet,提供可扩展API,支持热部署,可以方便地在当前系统增加集成功能。
Blackboard整合私有云文档协作系统流程如图4所示,首先在系统中增加了Blackboard基础库文件(bb-cms-admin.jar,bb-platform.jar和bb-taglibs.jar等)。随后配置bb-manifest.xml,该文件是Building block的描述文件,配置接入的文档协作系统名称、整合页面文件索引、组件类型等信息。在整合页面中,我们添加了文件同步等功能,方便用户操作。最后需导出该整合项目的jar包,由系统管理员在管理页面中完成该jar包的安装。
图4 Blackboard整合私有云文档协作系统流程
BuildingBlock组件还与外部系统间架设了桥连接,反过来也实现了通过调用Web服务在文档协作系统中来引入Blackboard内容。
经过私有云文档协作系统的建设和投入使用,学校人事处及科研处等职能部门与院系已经将文档管理的任务放在了本系统中,通过配置文档工作区权限,将部门及全校公开文档分别设置,相关人员可方便地在自己空间中查询到对应文档,比之前单一通过文件服务器来管理的模式要方便有效得多。在本系统中我们已经整合了文本挖掘技术,整合了教学软件平台及移动微信企业号功能,之后将会把它进一步推广成一个综合的文档协作管理平台,所有的文档都能在系统中进行操作和管理。学校师生如要查询或打印文档,查询教学课件视频或固定设备资产明细,阅读相关制度规则等都可在本系统内完成,而不像之前各个分离的文档信息孤岛,要到特定系统中的某个位置才能查询到指定文档。
上海财经大学以开源框架为基础,以私有云建设为核心,极大丰富和拓展了传统文档管理的内涵,在校园网络环境下给学校师生提供了更便捷的文档服务。
(文:陶晋 作者单位为上海财经大学教育技术中心)
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。