

EI收录,
入选中国科技期刊卓越行动计划

摘要
大数据是一种新兴的信息技术,广泛应用于各行各业。大数据技术在膳食营养健康中的应用主要是结合营养学、医学等相关学科,利用大数据技术挖掘、分析数据,再根据个人生理指标提供个性化的信息服务。本文以Web of Science核心合集和中国知网中文数据库为数据来源,利用VOSviewer,对近10年大数据与膳食营养健康领域的相关文献进行年度发文量和关键词分析。总结分析了大数据技术在膳食营养健康领域中的应用以及其所面临的挑战。最后,对大数据在膳食营养健康领域的未来研究趋势做出了展望,以期为大数据技术在该领域的深入研究及应用提供帮助。

结果与分析

1. 大数据在膳食营养健康领域的研究
以Web of Science数据库(WOS)和中国知网(CNKI)作为文献来源数据库。在CNKI中文数据库中,以“大数据营养”、“大数据健康管理”、“大数据个性化营养”、“大数据膳食”、“大数据膳食营养”为主题进行检索,检索到大数据与膳食营养健康领域联系密切的文献98篇(2011~2021年,2011~2013年相关的文献为0)以EndNote格式从知网导出,用VOSviewer(1.6.17)进行分析。在Web of Science核心数据库中设置主题=“big data”AND“precision nutriton”OR“nutrition healthy”OR“personalized nutrition”OR“dietary nutrition”时间设置为2011-01-01——2021-12-31,国家/地区选择中国,文献类型为:论文、综述论文、会议论文、会议摘要,检索到相关文献123篇,以纯文本文件导出,用VOSviewer(1.6.17)进行分析。
1.2 结果分析
1.2.1 发文数量
发文量在一定程度上体现了该领域受科学界的关注程度,可以从一定意义上反映该研究领域的发展速度和趋势。结合Web of Science 数据库和CNKI共检索到相关中英文文献共计221篇,其中WOS 123篇,CNKI 98篇。总体来看,2011~2021年论文发文量总体呈上升趋势,2011~2015年间发文较少,2015后发文量数量增长较快(图1),说明大数据在膳食营养健康领域的研究逐渐加强,就目前检索的文献来看,2021年发文量最多,且自2019年来发文量增长速度较快,表明该领域额的研究逐渐得到了学术界越来越多的关注。
图 1 2011~2021年大数据在膳食营养健康领域研究的文献数量图
Figure 1. Distribution of the number of literatures on big data in the field of dietary nutrition and health from 2011 to 2021
1.2.2 关键词及研究热点分析
表 1 2011~2021年间大数据在膳食营养健康相关研究关键词共现聚类簇
Table 1. Co-occurrence clusters of big data in dietary nutrition and health related research from 2011 to 2021
Figure 2. Distribution of the number of literatures on big data in the field of dietary nutrition and health from 2011 to 2021
2. 大数据在膳食营养健康领域的应用食物成分数据库的管理及运用
结合大数据在膳食营养与健康领域的研究进展来看,大数据在膳食营养与健康领域的应用可归纳为于食物成分数据库的建立和管理、营养健康服务平台的建立、开展与营养调查相关的工作、进行与营养相关的疾病的监测四个方面的应用。
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。食物成分数据库是各种食物成分含量所组成的一个数据集,是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,具有学术、经济、社会等多种价值,是一个国家和地区重要的资源。目前我国食物成分数据库主要包含安全性指标及新食品原料、食品抽检信息、化学污染、微生物、营养数据等查询系统,数据量巨大,但这些数据仅仅作为数据进行分类存储和管理,后用作相关的参考标准或是规范标准,食品数据资源未能被充分的利用。数据经过有目的的加工可以形成信息,将食品数据变为有价值的信息就需要对这些数据进行数据分析。数据分析指用适当的统计、分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程,大数据技术的利用能够更好的挖掘食品数据的信息。文献[33]通过开展具有中国特色的国家食物成分监测,建立了1个国家级食物成分数据库,20个省及自治区的食物成分子数据库,构建了用于食物监测的网络平台,促进了膳食营养与健康领域的研究。2020年,中国食物成分数据库经过系统、完善、精准一些列的监测,极大程度上丰富了中国食物营养成分数据库,给予以后有关膳食营养的研究提供了数据基础。中国不同地区、不同民族,饮食习惯存在差异,食物的摄入量也有所差异,可根据不同地区、不同民族、不同人群等建立相应的数据库,促进膳食个性化、营养精准化的发展。现在中国食物成分数据库主要用于中国居民摄入量的依据、用于营养知识的传播,距离实现精准化、个性化膳食营养还较远。
国外的食物成分数据库,本文主要搜集了五个国家的食物成分数据库,分别是阿拉伯食物成分数据库、爱尔兰食物成分数据库、DietSys(巴西人口的饮食数据处理系统)、myfood24 FCDB(英国新的综合电子食品数据库)、喀里多尼亚食物成分数据库,其分别所包含的主要内容及用途如表2所示。
表 2 国外食物成分数据库相关信息
Table 2. Relevant information of foreign food composition databases
国外食品数据库与在线饮食记录工具(myfood24)相结合,可以更好的在膳食评估中发挥其作用,利用大数据技术能够更好的挖掘食物成分数据库的数据价值,给予居民更加准确的膳食营养指导,进行营养干预。而中国食物成分数据库目前对于进行居民营养干预还需要继续研究发展。食品成分数据库在公共卫生营养学中发挥着重要作用。因此,需要充分利用大数据技术来挖掘数据信息,使食品数据库信息发挥尽可能大的价值,以便更好地解决当前和未来公共卫生、营养和其他社会问题。
2.2 营养健康服务平台或模型
表 3 营养健康服务平台信息
Table 3. Information on nutrition and health service platform
除了以上平台和系统的运用外,大数据技术在膳食营养领域应用还有个性化膳食推荐,推荐系统通过科学的计算后根据用户需求推荐其科学、合理的膳食指导方案,因而个性化膳食推荐深受人们的喜爱。近年来个性化膳食推荐系统被越来多的学者进行研究,随着精准医学的出现,精准营养也逐渐被人们所认识,Xu等开发了用于精确膳食摄入管理的中国食品营养数据分析系统。未来的研究中个性化营养、精准营养的服务平台将会被越来越多的相关领域的研究者所重视。
2.3 营养调查
营养调查是对人民群众的营养状况进行调查,是营养健康工作重要的组成部分,是国家制定相关政策的依据,是修订居民膳食指南的重要依据,它反映了居民的营养健康情况。中国传统的营养调查,调查内容多、耗时长、工作量大;调查技术采用纸质问卷、电脑平板等相关设备,这些设备仅是简单替代了传统的纸笔的录入方式,却未能真正发挥其信息化作用;信息利用程度低,难以为新形势下个性化的健康服务所利用,不能提供个体化的营养健康指导和干预。
美国的营养调查,包括41474个个体和1191个变量。变量包括每个个体的表型和环境暴露信息,人口统计信息、体检结果(例如身高、体重指数)、实验室结果(例如胆固醇、葡萄糖和环境暴露)和问卷项目。其调查所产生的数据描述符描述了一个字典,分析人员能够按类别及可读的描述查找变量。数据集可在DataDryad上获得,通过新的大数据平台,BD2K以患者为中心的信息共享空间(http://pic-sure.org),提供一种通过web浏览器浏览数据集的新方法(https://nhanes.hms.harvard.edu)并为编程访问提供应用程序编程接口。日本国家健康和营养调查(NHNS)旨在收集有关成人和儿童健康、营养和生活方式的基本数据,促进居民健康发展。卫生、劳动和福利部(MHLW)对NHN进行规划和预算编制,MHLW和信息部对调查区域进行抽样。地方政府执行行政程序,公共卫生中心与调查访问人员一起准备并实施实地调查。调查访问人员检查和审查已完成的问卷,使用专门为调查开发的软件输入膳食摄入数据。后由地方政府向国家健康和营养研究所发送调查问卷和输入数据。公共卫生中心将血液样本发送给商业检测实验室,实验室将检测结果发送给国家健康和营养研究所。国家健康和营养研究所营养流行病学系分析数据,MHLW发布结果。
与国外营养调查相比,大数据技术在中国的营养调查中未能使数据充分发挥其应有的价值(数据共享较慢、膳食指导个性化欠缺),美国对于营养调查数据的共享工作做的较好,日本对营养调查数据的处理迅速,能够即时掌握居民的膳食摄入,能够给予居民膳食指导。目前中国的营养调查还在不断的完善中,利用新型膳食调查方法与大数据技术融合,建立共享的大数据营养与健康平台,促进营养调查数据的共享;通过物联网设备、计算机图像处理等设备,收集和监测居民的特定营养健康数据,并通过互联网上传至基层监测节点;再通过可移动监测中心、实验室管理等系统获取可溯源的人体和生物样本检测结果,完成基本情况、膳食调查、体格检测和生物样本检测,及时由被调查人员收集自身数据,加快数据处理的速度及时对居民进行营养干预、膳食指导。现在大数据技术逐渐发展成熟将其运用于营养调查能够将历届全国性、专项及地方性的营养和健康状况调查的数据得以汇总,并进行深度系统的挖掘,可以全面描述中国城乡居民、重点人群、重点地区的膳食结构和营养水平及其相关慢性疾病的流行病学特点及变化规律、找出中国居民不同时期存在的营养健康问题,发现营养缺乏和营养过剩的高危人群,为政府部门制定营养与健康相关政策和疾病防控措施提供了基础数据。因此要加强大数据在营养调查方面的研究,充分利用大数据技术。
2.4 进行与营养相关的疾病检测
大数据的使用可以推动营养相关慢性疾病的管理,通过数据挖掘,对大量的健康数据进行综合分析,从而及时对健康危险信号做出预警。文献[61]采用hadoop框架结构、spark计算框架、SDB分布式数据库为构建健康档案大数据平台提供了新的技术方案和思路。文献[62]设计了基于可穿戴设备的个性化健康监管平台,将医疗信息、物联网、大数据技术融合在一起,为用户定制个性化数据指标指导。文献[63]利用HBase和Phoenix构建了高性能的健康监测大数据平台,并对平台的读写性能进行了优化,为健康监测大数据存储和管理有很高的借鉴意义。本文简述了大数据技术在高血压、肥胖、糖尿病三种疾病中的运用,如表4。高血压、肥胖、糖尿病的发生通常会伴随相应并发症的出现,高血压、肥胖、糖尿病给人们的生活带来极大的不便,因高血压、肥胖、糖尿病的危害较大,受国家和社会的广泛关注,相应的研究也较多,选择高血压、肥胖、糖尿病作为本部分的综述对象,其相关研究较为成熟,数据来源丰富;同时与高血压、肥胖、糖尿病相关的因素众多,涉及到各种数据类型,可以参考相关的数据处理便于用于其他慢性疾病的监测。
表 4 三种疾病监测系统信息
Table 4. Information of three disease surveillance systems
结合表3可以看出,慢性病的管理系统主要包含数据的采集、储存、共享几个模块,结合患者身体状况,给予个性化的管理服务。除了管理系统外卫生部门还可通过患者电子病历数据库,对营养相关疾病及其他疾病患者的数据进行综合分析,将分析结果及指导通过移动网络等反馈给医生、社区卫生服务人员以及患者。这样能够让医务人员全面掌握病人的情况,给出有针对性的治疗和指导的同时还可以给患者适时的提醒,两方面相结合,更有助于疾病的管理和控制。新冠肺炎疫情期间,治病救人是重中之重,膳食供给和营养保障是辅助治疗,也是增加抗病能力以及促进康复的重要措施,大数据、物联网等技术,为突发公共卫生事件暴发时期的营养远程干预提供了可能。使用大数据和机器学习有助于提高营养流行病学调查结果的可靠性和有效性,将大数据和机器学习纳入流行病学分析可以减少测量误差,更好地表示饮食及其混杂因素的复杂性,并更好地考虑饮食与疾病之间的复杂关系。这些改进可以帮助改善关于饮食和疾病之间关系的预测和推论。
3. 大数据在膳食营养健康应用中面临的挑战
大数据在膳食营养健康的应用现还处于发展的初级阶段,还面临着很多的挑战,主要表现在以下方面。
3.1 数据的采集与预处理方面
食品大数据在生产、加工、储藏、运输、销售等过程中,其产生的数据来源是多源的,其形式是多模态的。数据的多源、多模态的不确定性和多样性,会导致数据的质量存在差异,影响数据的可用性,数据的可用性取决于数据质量,数据的质量包含精确性、一致性、完整性、统一性、实效性和真实性六个性质。为保证大数据的可用性,需要在数据源头上把好质量关,做好从原始数据到高质量信息的预处理。因此需要建立数据源的质量评估理论模型,针对各种模态数据的特点,建立高质量多模态数据的获取方法来确保数据源的质量。建立数据正确性语义模型、数据约束规则、数据错误模型等来清除不合理、错误的数据,对重要的信息进行修复,保证数据的完整性。总之,食品数据的采集和预处理是食品大数据的源头,在源头上把质量关,对食品大数据的后续处理和分析至关重要,因此有关政府部门应建立关于食品大数据数据质量的标准,保证食品大数据的统一质量,有效保证大数据的利用价值。
3.2 数据存储及与管理方面
膳食营养健康大数据在数据储藏及管理方面面临的挑战表现为:存储规模大,存储管理复杂,需要兼顾结构化、非结构化和半结构化的数据;随着数据的规模、产生的速度与复杂度的增加,如饮食记录、膳食膳食摄入等数据,会使系统引入各种数据类型的误差、错误,使得膳食营养健康大数据的应用产生分布式数据清洗、质量检测等挑战性问题,各种存储技术缺少统一标准,无法达到兼容,会使大量数据丢失,从而对新旧系统数据的迁移产生影响。在大数据带来的新挑战下,解决数据储存、管理的问题,需要更进一步的研究存储与管理软件技术。在大数据环境下,目前最适用的技术是分布式文件系统、分布式数据库以及访问接口和查询语言,在大数据存储系统的发展中实时/流式大数据存储与处理成为其发展的趋势。
3.3 数据分析与数据挖掘方面
大数据环境下的分析和挖掘方法与传统的小样本统计分析所不同,其面临的挑战表现为:数据量的膨胀,随着该领域数据生成的自动化、数据生成速度的加快,数据分析需要处理的数据量急剧膨胀;数据深度分析需求的增长,为了从数据中发现信息并加以利用进而指导人们的决策,必须对大数据进行深入的分析,这些复杂的分析需要依赖于复杂的分析模型;自动化、可视化分析需求的出现,因为数据规模很大,要对大数据进行有效分析,分析过程需要按照完全自动化的方式进行,故此一个好的适于分析的数据表示模式是非常重要的。
3.4 安全隐私保护方面
大数据时代,传统的隐私数据内涵与外延有了巨大突破与延伸,隐私数据保护不力,隐私数据保护技术面临更多的挑战。膳食营养健康数据包含众多内容,涉及群众的隐私、身体健康情况等的安全以及其他的特殊要求,这些数据的集中存储增加数据泄露风险,这些数据不被滥用,也成为人身安全的一部分;使用数据过程中的安全问题,进行数据挖掘和数据分析时,黑客可以利用大数据分析向企业发起攻击,黑客可能会最大限度地收集有用信息,使得数据安全局面异常严峻;目前还没有严格的法律法规来保证用户的数据隐私安全,因此膳食营养健康数据的应用存在法律安全隐患。安全隐私保护不够完善,会对数据共享范围造成影响,目前大数据技术操作还不算完善,对于安全隐私的保护还有待研究。目前所使用的方法主要有文件访问控制技术、基础设备加密、匿名化保护技术、加密保护技术等。最后,大数据的保护需要学术界、商业界、政府部门的共同参与,需要形成有效的安全机制和国家法律法规来约束和保护大数据的安全隐私,从而保证大数据时代的健全、安全发展。

结论

大数据既是一种科技,也是一种资产,随着社会的快速发展,食品行业累积了大量来源广泛,增长速度快,价值密度低而应用价值高的数据,如何使用大数据技术挖掘食品数据更多潜在的应用价值,从而促进食品行业的可持续发展,促进膳食营养健康的数字化、信息化发展,成为食品领域重点研究的问题。本文对大数据在该领域的运用归纳为:利用大数据技术进行与营养相关的疾病管理,提供个性化的营养服务;利用现代信息技术进行膳食营养健康领域的数据挖掘,聚集相关的数据信息,从而提供科学的健康管理服务;利用大数据开展与营养相关的研究三个方面。综上来看大数据技术与进行营养相关的疾病管理以及健康管理方面研究结合较为紧密,但是大数据技术的运用不够深入,Hadoop、Hbase、Spark等技术的利用较少;大数据在开展营养相关的研究结合也不够明显,该方面的研究含有大量的菌群、基因等数据应用较多的是储存技术,但相关的研究并没有介绍大数据技术在数据储存的应用,其研究较少。大数据技术在本文所述的应用领域应用程度较低,大多处于起步阶段,但已有很多学者从不同的角度,开始了该领域的研究营养健康管理平台如贵州铜仁学生智慧营养云平台,个性化食谱推荐等的研究。在未来的研究中结合个人的饮食喜好及自身的营养健康的个性化、智能化的饮食以及数字化的健康管理将成为未来的研究趋势。目前中国膳食营养健康大数据面临数据的采集与预处理、数据的存储及管理、如何进行数据分析挖掘数据价值方面的困难及挑战,缺乏安全隐私保护措施、缺少复合型人才的挑战,针对以上困难挑战还需要相关的学者进行深入的研究。大数据在食物成分数据库以及营养调查更多的是结合国家政策由政府作为主要的研究人员进行研究,与饮食相关的疾病监测更多的是结合相关的医学进行研究,因此大数据在膳食营养健康领域的研究需要很多的复合型人才,固然需要加强有关的人才培养,从而促进膳食营养健康大数据的发展,发掘数据的潜在价值,从而能更好的服务人民,促进社会发展、促进食品行业的数字化、信息化的发展。
引用本文:唐兴萍,周兵,杨文庆,等. 国内大数据与膳食营养健康的研究及应用进展[J]. 食品工业科技,2023,44(2):19−28. doi: 10.13386/j.issn1002-0306.2022030212.
Citation: TANG Xingping, ZHOU Bing, YANG Wenqing, et al. Research and Application Progress of Big Data and Dietary Nutrition Health in China[J]. Science and Technology of Food Industry, 2023, 44(2): 19−28. (in Chinese with English abstract). doi: 10.13386/j.issn1002-0306.2022030212.
基金项目: 云南省重大科技专项计划项目(202002AE090010);科技创新-基于区块链的云南核桃产品追溯体系研究(A303202105400202)。

通信作者简介
吴文斗,1974年9月生,男,教授,云南大学软件工程硕士,云南农业大学在读博士,农业信息技术与工程、农业工程与信息技术硕士生导师。主要从事农业物联网、农业大数据和农产品(食品)质量安全领域的研究,先后主持和参与各类科研项目40余项,主编教材(专著)3部,副主编5部,获得专利及软件著作权42项(其中第一完成人16项);获得云南省优秀教学成果奖二等奖1项,云南省科技进步奖3项,神农中华农业科技奖三等奖1项。在国内外重要学术刊物上一作或通信作者发表论文50余篇,其中SCI收录4篇,EI收录4篇,指导毕业硕士研究生35人,硕士在读生5人,2024年遴选为云南省科技副总。
(以上信息来云南农业大学网络)
点击文末“阅读原文”,获取论文全文;
或登录www.spgykj.com阅览全文。
食品科学家论文汇总
(点击专家姓名,查看论文)
《食品工业科技》特邀主编专栏征稿
《食品工业科技》客座主编专栏征稿:地方特色食品:加工技术、感官品质、风味特性和营养健康☚
《食品工业科技》特邀主编专栏征稿:“十四五”国家重点研发计划“陕西秦巴山区特色经济作物、果蔬产业关键技术集成与示范”☚
《食品工业科技》特邀主编专栏征稿:果蔬基料制造:基础理论,新型加工、质量控制与智能制造☚
群聊:食品工业科技作者群

温
馨
提
示
我刊正式组建微信作者群,为作者提供更多的学术与论文资讯,如需进群,请联系刘老师(微信:上方二维码,电话:87244117-8062)。

版权声明








