科情智库
1►
研究背景
数字化阅读是一种全新而独特的文学形式,是一种以娱乐方式进行阅读的新体验,给人们带来了不同于传统书籍的全新的心灵体验。数字化阅读推广是指利用图书馆网站、微博、微信等数字平台进行阅读推广工作,其功能主要定位于宣传与展示图书馆的阅读推广活动和资源推荐,引导读者阅读,为读者提供阅读交流与互动平台等。国内高校图书馆的数字化阅读推广主要有利用图书馆OPAC、开发专题网站、文本发布等几种模式。从整体上说,数字化阅读相较于传统阅读模式更具优势,使用户在阅读内容、方式和资源上有更多的选择,利于营造自主阅读、探究性学习的氛围,以调动用户积极性,从而提高阅读的成效和质量。随着数字化阅读的逐渐普及,大量的新手作者开始加入,给大众带来了更多的阅读作品。目前,较前端和知名的网站签约门槛都很高,所以很多新手作者的作品都会优先在小型网站中呈现。而在小型网站中的推广,大都集中在榜单推荐和定时换书等传统的推荐方式上,不仅推广的范围较小,而且很难有流量上的突破。
为了进一步优化数字化阅读的推广效果,设计基于用户画像的数字化阅读推广平台。从信息层、数据处理层和推广层三个方面设计了数字化阅读推广平台总体架构,利用爬虫原理设计了数字化阅读文本采集器,结合数字化阅读推广器的设计,完成了平台的硬件设计;通过构建用户画像,利用自适应学习算法设计了数字化阅读推广算法,完成平台的软件设计。平台性能测试结果表明,基于用户画像的数字化阅读推广平台推广路径完成度高于0.8,召回率可以达到85%以上。由此验证了设计平台在功能上可以满足设计要求,还可以通过提高数字化阅读推广的成功率和精度,满足性能设计要求。
2►
研究内容
2.1 数字化阅读推广平台总体架构设计
为了提高数字化阅读推广平台的信息推广能力,提升网络搜索引擎与数据库匹配的挖掘能力,本文利用人工蚁群算法提取数字化阅读的相似语义,并融合数字化信息特征,构建数字化阅读推广关键词之间的关联关系,利用聚类分析法构建数字化阅读推广模型,从而实现对数字化阅读平台的推广管理。
此次设计的数字化阅读推广平台总体架构模型一共分为三个层次,分别是数据层、业务层和应用层。在总体架构模型设计的基础上,分别设计了数字化阅读文本采集器、数字化阅读推广器。
2.2 数字化阅读推广平台软件设计
利用自适应学习算法计算出用户画像特征的属性值,如果将用户画像特征的属性值融入到用户画像特征向量中,就会对用户画像特征产生干扰,基于该干扰提取出用户画像特征。以此为依据构建用户画像,利用用户画像构建阅读用户的推广模块,扩展用户画像的推广内容。
通过采集器和推广器的设计,结合构建的用户画像设计数字化阅读推广算法,具体步骤如下:
Step1:构建数字化阅读的标签矩阵,在数字化阅读的标签矩阵中,根据用户搜索的关键词,计算出各个标签使用的次数,为用户使用标签的次数,以此类推。
Step2:计算标签关键词对用户的权重。利用TF-IDF算法计算每个标签关键词对用户的权重信息,根据用户使用标签的次数,计算出各个标签的权重值,并将其应用到文档中,构建关键词矩阵,计算出用户的个人偏好和每个关键词出现的次数。
Step3:构建数字化阅读的关键词资源矩阵。
Step4:计算标签对数字化阅读推广资源库的权重。
Step5:根据公式完成用户画像的扩展,预测用户对标签关键词的喜爱程度,并根据计算结果,为用户推广排名靠前的数字化阅读资源。
根据上述5步,完成数字化阅读推广算法的设计,根据计算结果为用户提供优质精准的推广服务。
3►
研究结果
采用UI Automator工具和Monkey工具对数字化阅读推广平台进行自动化测试,UI Automator工具编写的脚本可以在不同操作平台上运行,实现用户的不同操作,还可以对平台的各项功能生成详细的报告,方便开发人员随时发现平台问题;Monkey工具是一种命令执行工具,可以将其安装在真实设备中,向推广平台发送用户的相关信息,实现对推广平台性能的测试。
测试结果表明,随着读者人数的增加,数字化阅读推广路径完成度逐渐下降,但是文中平台的推广路径完成度仍然可以保持在0.8以上,说明文中平台在推广数字化阅读时的成功率更高,具有更好的稳定性。文中推广平台的召回率可以达到85%以上,说明在推广数字化阅读时,文中平台的推广精度更高,可以保证平台的稳定性。
4►
研究结论
经测试发现,该平台的功能和性能都可以满足设计要求。在今后的研究中,希望可以设计一套流量控制系统,提高读者的留存率。
作者:郑素萍
宁夏回族自治区图书馆,宁夏银川 750002
来源:此文为缩减版,《中国科技资源导刊》2023 Vol.(1):45-51
文章观点不代表主办机构立场。
推荐阅读 >

